V iskanju slovarsko relevantne kolokacije na primeru struktur s prislovi
DOI:
https://doi.org/10.4312/slo2.0.2018.2.154-185Ključne besede:
leksikografija, semantika, kolokativnost, kolokacijski slovar sodobne slovenščine, prislovPovzetek
V leksikogramatični raziskavi so predstavljeni rezultati analiz struktur s prislovi, ki so bile izvedene v okviru temeljnega raziskovalnega projekta Kolokacije kot temelj jezikovnega opisa: semantični in časovni vidiki (KOLOS; J6-8255). Na podlagi rezultatov predhodno izvedene pilotne množičenjske naloge, v kateri so označevalci jezikoslovci ocenjevali avtomatsko izluščene kolokacijske kandidate iz korpusa Gigafida in se opredeljevali do tega, kaj je in kaj ni slovarsko relevantna kolokacija, smo analizirali vse kolokacijsko produktivne strukture s prislovi. Namen analiziranja je bil opredeliti kolokacijo kot semantično relevantno sopojavitev dveh (ali več) besed ter s tem tudi razliko med slovarsko relevantnimi kolokacijami in statistično prepoznanimi oz. šibkejšimi kolokacijami, ki ne opravljajo semantične funkcije in so posledično nerelevantne za kolokacijski slovar.
Analize struktur s prislovi so pokazale, da se je o semantični relevantnosti in slovarski vključenosti pri posameznih primerih kolokacijskih kandidatov ali tipih kolokatorjev treba odločati na ravni posamezne strukture. Tovrstni primer so prislovi, ki lahko nastopajo v vlogi intenzifikatorja (tip kar pošteno [načeti]) ali pa semantično manj relevantni vlogi poudarnosti oz. členkovnosti (tip kar prekiniti). Podobne jezikoslovne obravnave so potrebne širše skupine števniškosti, kot je kratnost ali zaporedje (zaporednostni prislovi), ki jih zaradi raznolike semantične relevantnosti ne moremo strukturno omejiti (četrtič doktorirati proti stokrat povedati).
Podatki, pridobljeni na podlagi opravljenih analiz, bodo omogočali podrobnejše ali nadaljnje analize, predvsem pa celovit opis vsake kolokacijske strukture in njene kolokativnosti. Na podlagi identificiranih napak zaradi avtomatskega označevanja strukture pa bo mogoče nadgraditi obstoječe vzorce za luščenje in predvsem izboljšati avtomatsko luščenje za problematične strukture. Podatki bodo zelo uporabni tudi pri nadaljnjem vključevanju in obravnavi novih struktur, prvotno izločenih zaradi precejšnjega šuma. Vse ugotovitve bo mogoče implementirati v leksikografski delotok in na ta način izboljšati podatke (stopenjskost gesel) v slovarju. Učno množico s 17.576 kandidati bo mogoče uporabiti tudi v drugih dejavnostih projekta KOLOS: za uvrščanje kolokatorjev v gruče, primerjavo sopomenk s kolokacijami in nenazadnje za proučevanje kolokacijskih trendov skozi čas.
Prenosi
Prenosi
Objavljeno
Kako citirati
Številka
Rubrike
Licenca
Avtorske pravice (c) 2019 Eva Pori, Iztok Kosem

To delo je licencirano pod Creative Commons Priznanje avtorstva-Deljenje pod enakimi 4.0 mednarodno licenco.
Prispevki v reviji Slovenščina 2.0 so dostopni po licenci Attribution-ShareAlike 4.0 International (CC BY-SA 4.0).
Tudi pri objavi prispevkov v reviji Slovenščina 2.0 velja licenca Attribution-ShareAlike 4.0 International (CC BY-SA 4.0). Po tej licenci avtorji obdržijo avtorske pravice, hkrati pa uporabnikom dovolijo reproduciranje, distribuiranje, dajanje v najem, javno priobčitev in predelavo avtorskega dela (tudi za komercialno uporabo in predelavo), če navedejo avtorja ter citirajo delo in ga širijo naprej pod istimi pogoji. Dovoljenje niti s strani avtorja niti s strani izdajatelja revije za vse to torej ni potrebno. Predelavo in nadgradnjo dela sme uporabnik distribuirati, dati v najem ali priobčiti javnosti le pod pogoji te iste licence, novejše različice te licence z istimi elementi, kot jih vsebuje ta licenca, ali z drugo nacionalno licenco Creative Commons, ki vsebuje iste elemente licence kot ta licenca.
Pri reviji Slovenščina 2.0 med avtorji in izdajateljem niso sklenjene nobene dodatne pogodbe ali dogovori, avtorji torej avtorske pravice in pravice nadaljnjega širjenja obdržijo brez omejitev.
Pri reviji Slovenščina 2.0 avtorjem dovoljujemo in jih spodbujamo, da svoje besedilo, ki je bilo objavljeno v reviji Slovenščina 2.0, objavijo še kje drugje na spletu (npr. v institucionalnih repozitorijih, na osebnih spletnih straneh), vendar s pripisom, v katerem je razvidno, da je naša revija besedilo objavila prva.