Avtomatizacija leksikografskih postopkov

Avtorji

  • Iztok Kosem Trojina, zavod za uporabno slovenistiko
  • Polona Gantar Inštitut za slovenski jezik Frana Ramovša, ZRC SAZU
  • Simon Krek Institut “Jožef Stefan”, Laboratorij za umetno inteligenco; Fakulteta za družbene vede, Univerza v Ljubljani

DOI:

https://doi.org/10.4312/slo2.0.2013.2.139-164

Ključne besede:

avtomatsko luščenje jezikovnih podatkov, leksikalna podatkovna baza za slovenščino, predlog za izdelavo slovarja sodobnega slovenskega jezika, besedne skice, GDEX

Povzetek

V razpravi opisujemo poskus uvajanja postopkov avtomatizacije v proces izdelave slovarjev, ki smo ga uporabili v končni fazi izdelave leksikalne baze za slovenščino (LBS). Gre za avtomatizacijo dela leksikografskega procesa, pri katerem računalnik na podlagi vnaprej določenih parametrov izbere, izloči ter neposredno v program za izdelavo slovarja ali slovarske baze prenese vrsto leksikalnogramatičnih podatkov o konkretni lemi, ki jih leksikograf nato uporabi za pomensko analizo in končno izdelavo slovarskega gesla. Optimalnost avtomatsko izluščenih podatkov smo določali s sprotnim prilagajanjem parametrov glede na različne frekvenčne skupine lem po posameznih besednih vrstah in s postopnim prilagajanjem hevristik v aplikaciji GDEX za izbor dobrih korpusnih zgledov. Prispevek zaključujemo s prikazom vključitve postopka avtomatskega luščenja leksikalnih podatkov v predlagan slovar sodobnega slovenskega jezika.

Prenosi

Podatki o prenosih še niso na voljo.

Literatura

Kosem, I. Gantar, P. in Krek, S. (2013): Avtomatizacija leksikografskih postopkov. Slovenščina 2.0, 1 (2): 139–164.

Prenosi

Objavljeno

1. 12. 2013

Kako citirati

Kosem, I., Gantar, P., & Krek, S. (2013). Avtomatizacija leksikografskih postopkov. Slovenščina 2.0: Empirične, Aplikativne in Interdisciplinarne Raziskave, 1(2), 139-164. https://doi.org/10.4312/slo2.0.2013.2.139-164

Najbolj brani prispevki istega avtorja(jev)

1 2 3 > >>