Nenavaden par: pogostost besede v korpusu in pri uporabniških poizvedbah

Avtorji

  • Lars Trap-Jensen Society for Danish Language and Literature
  • Henrik Lorentzen Society for Danish Language and Literature
  • Nicolai H. Sørensen Society for Danish Language and Literature

DOI:

https://doi.org/10.4312/slo2.0.2014.2.94-113

Ključne besede:

pogostost v korpusu, izbira lem, načini iskanj po slovarju, posodabljanje slovarjev, dnevniki iskanj uporabnikov

Povzetek

rispevek se osredotoča na preučitev razmerja med dnevniki iskanj uporabnikov po spletnem slovarju in korpusno pogostostjo besed. Študijo so spodbudila razmišljanja, ki so se porajala pri rednem slovarskem delu in jih lahko strnemo v vprašanje: kako ohranjati na korpusu temelječ slovar aktualen? Bi morala biti naslednja beseda, ki jo uvrstimo v slovar, tista, ki sledi zadnji uslovarjeni besedi na frekvenčnem seznamu besed iz korpusa? Ali bi morala biti to beseda, ki jo uporabniki najpogosteje neuspešno iščejo v slovarju? Da bi prišli do ustreznih kriterijev, so avtorji analizirali dnevnike iskanj uporabnikov danskega slovarja v obdobju od 2009 do 2012 in seznam najpogosteje iskanih besed primerjali z njihovo pogostostjo v korpusu. S proučitvijo iskalnih navad uporabnikov so avtorji želeli priti do odgovorov na sledeča vprašanja: Ali so v slovarju besede, ki jih uporabniki nikoli ne iščejo? Če je odgovor da, ali lahko na podlagi njihove pogostosti v korpusu opazimo kakšne smiselne vzorce – gre za besede iste besedne vrste, so besede zelo pogoste ali zelo redke, se pojavljajo v določenem frekvenčnem območju? Ugotovitev prispevka je, da je pogostost v korpusu dober kriterij za 20.000 najpogostejših iztočnic, medtem ko je treba pri manj pogostih besedah dodati še druge metode, med katerimi je tudi pregled iskanj uporabnikov, nadvse pomembna pa je tudi presoja leksikografov.

Prenosi

Podatki o prenosih še niso na voljo.

Literatura

Trap-Jensen, L., Lorentzen, H., Sørensen, N. (2014): An odd couple – Corpus frequency and look-up frequency: what relationship?Slovenščina 2.0, 2 (2): 94–113.

Prenosi

Objavljeno

01.12.2014

Kako citirati

Trap-Jensen, L., Lorentzen, H., & H. Sørensen, N. (2014). Nenavaden par: pogostost besede v korpusu in pri uporabniških poizvedbah. Slovenščina 2.0: Empirične, Aplikativne in Interdisciplinarne Raziskave, 2(2), 94–113. https://doi.org/10.4312/slo2.0.2014.2.94-113

Številka

Rubrike

Razprave