Avtomatizacija leksikografskih postopkov
DOI:
https://doi.org/10.4312/slo2.0.2013.2.139-164Ključne besede:
avtomatsko luščenje jezikovnih podatkov, leksikalna podatkovna baza za slovenščino, predlog za izdelavo slovarja sodobnega slovenskega jezika, besedne skice, GDEXPovzetek
V razpravi opisujemo poskus uvajanja postopkov avtomatizacije v proces izdelave slovarjev, ki smo ga uporabili v končni fazi izdelave leksikalne baze za slovenščino (LBS). Gre za avtomatizacijo dela leksikografskega procesa, pri katerem računalnik na podlagi vnaprej določenih parametrov izbere, izloči ter neposredno v program za izdelavo slovarja ali slovarske baze prenese vrsto leksikalnogramatičnih podatkov o konkretni lemi, ki jih leksikograf nato uporabi za pomensko analizo in končno izdelavo slovarskega gesla. Optimalnost avtomatsko izluščenih podatkov smo določali s sprotnim prilagajanjem parametrov glede na različne frekvenčne skupine lem po posameznih besednih vrstah in s postopnim prilagajanjem hevristik v aplikaciji GDEX za izbor dobrih korpusnih zgledov. Prispevek zaključujemo s prikazom vključitve postopka avtomatskega luščenja leksikalnih podatkov v predlagan slovar sodobnega slovenskega jezika.Prenosi
Podatki o prenosih še niso na voljo.
Literatura
Kosem, I. Gantar, P. in Krek, S. (2013): Avtomatizacija leksikografskih postopkov. Slovenščina 2.0, 1 (2): 139–164.
Prenosi
Objavljeno
1. 12. 2013
Številka
Rubrika
Razprave
Licenca
Avtorske pravice (c) 1970 Iztok Kosem, Polona Gantar, Simon Krek
To delo je licencirano pod Creative Commons Priznanje avtorstva-Deljenje pod enakimi pogoji 4.0 mednarodno licenco.
Kako citirati
Kosem, I., Gantar, P., & Krek, S. (2013). Avtomatizacija leksikografskih postopkov. Slovenščina 2.0: Empirične, Aplikativne in Interdisciplinarne Raziskave, 1(2), 139-164. https://doi.org/10.4312/slo2.0.2013.2.139-164