Najboljši ali lažni prijatelji? Luščenje slovensko-hrvaških prevodnih ustreznic in lažnih prijateljev iz korpusov

Avtorji

  • Darja Fišer University of Ljubljana, Faculty of Arts
  • Nikola Ljubešić University of Zagreb, Faculty of Humanities and Social Sciences

DOI:

https://doi.org/10.4312/slo2.0.2013.1.50-77

Ključne besede:

avtomatsko luščenje dvojezičnega leksikona, distribucijska semantika, sorodni jeziki, sorodnice, lažni prijatelji

Povzetek

V prispevku predstavimo korpusni pristop k samodejnemu luščenju prevodnih ustreznic in lažnih prijateljev med slovenščino in hrvaščino. Pristop izkorišča ortografske podobnosti med jezikoma in temelji na predpostavki distribucijske semantike, ki se glasi, da govorci obeh jezikov besede s podobnim pomenom uporabljamo v podobnih kontekstih. To nam po eni strani omogoča hitro izgradnjo slovensko-hrvaškega dvojezičnega leksikona, za katero razen primerljivih spletnih korpusov ne potrebujemo nobenega drugega vira znanja. Po drugi strani pa lahko na podlagi iste predpostavke s pomočjo korpusnih podatkov prepoznamo tiste sorodnice, ki so si podobne zgolj površinsko, leksikalizirajo pa različne pojme in se zato tudi različno uporabljajo. Predstavljen pristop je jezikovno neodvisen, zaradi česar je privlačen za številna področja računalniške obdelave naravnega jezika, kjer še vedno vlada veliko pomanjkanje leksikalnih virov, njihove ročne izdelave pa si ne moremo privoščiti. Pristop je prav tako zelo koristen v leksikografiji in za poučevanje tujih jezikov, saj nam pomaga osvetliti leksikalne posebnosti za določen jezikovni par oziroma strokovno področje.

Prenosi

Podatki o prenosih še niso na voljo.

Literatura

Fišer, D., Ljubešić, N. (2013): Best friends or just faking it? Corpus-based extraction of Slovene-Croatian translation equivalents and false friends. Slovenščina 2.0, 1 (1): 50-77.

Prenosi

Objavljeno

1. 12. 2013

Številka

Rubrika

Razprave

Kako citirati

Fišer, D., & Ljubešić, N. (2013). Najboljši ali lažni prijatelji? Luščenje slovensko-hrvaških prevodnih ustreznic in lažnih prijateljev iz korpusov. Slovenščina 2.0: Empirične, Aplikativne in Interdisciplinarne Raziskave, 1(1), 50-77. https://doi.org/10.4312/slo2.0.2013.1.50-77

Najbolj brani prispevki istega avtorja(jev)

1 2 3 > >>