Najboljši ali lažni prijatelji? Luščenje slovensko-hrvaških prevodnih ustreznic in lažnih prijateljev iz korpusov
DOI:
https://doi.org/10.4312/slo2.0.2013.1.50-77Ključne besede:
avtomatsko luščenje dvojezičnega leksikona, distribucijska semantika, sorodni jeziki, sorodnice, lažni prijateljiPovzetek
V prispevku predstavimo korpusni pristop k samodejnemu luščenju prevodnih ustreznic in lažnih prijateljev med slovenščino in hrvaščino. Pristop izkorišča ortografske podobnosti med jezikoma in temelji na predpostavki distribucijske semantike, ki se glasi, da govorci obeh jezikov besede s podobnim pomenom uporabljamo v podobnih kontekstih. To nam po eni strani omogoča hitro izgradnjo slovensko-hrvaškega dvojezičnega leksikona, za katero razen primerljivih spletnih korpusov ne potrebujemo nobenega drugega vira znanja. Po drugi strani pa lahko na podlagi iste predpostavke s pomočjo korpusnih podatkov prepoznamo tiste sorodnice, ki so si podobne zgolj površinsko, leksikalizirajo pa različne pojme in se zato tudi različno uporabljajo. Predstavljen pristop je jezikovno neodvisen, zaradi česar je privlačen za številna področja računalniške obdelave naravnega jezika, kjer še vedno vlada veliko pomanjkanje leksikalnih virov, njihove ročne izdelave pa si ne moremo privoščiti. Pristop je prav tako zelo koristen v leksikografiji in za poučevanje tujih jezikov, saj nam pomaga osvetliti leksikalne posebnosti za določen jezikovni par oziroma strokovno področje.Prenosi
Podatki o prenosih še niso na voljo.
Literatura
Fišer, D., Ljubešić, N. (2013): Best friends or just faking it? Corpus-based extraction of Slovene-Croatian translation equivalents and false friends. Slovenščina 2.0, 1 (1): 50-77.
Prenosi
Objavljeno
1. 12. 2013
Številka
Rubrika
Razprave
Licenca
Avtorske pravice (c) 2013 Darja Fišer, Nikola Ljubešić
To delo je licencirano pod Creative Commons Priznanje avtorstva-Deljenje pod enakimi pogoji 4.0 mednarodno licenco.
Kako citirati
Fišer, D., & Ljubešić, N. (2013). Najboljši ali lažni prijatelji? Luščenje slovensko-hrvaških prevodnih ustreznic in lažnih prijateljev iz korpusov. Slovenščina 2.0: Empirične, Aplikativne in Interdisciplinarne Raziskave, 1(1), 50-77. https://doi.org/10.4312/slo2.0.2013.1.50-77