Gradnja novega korpusa slovenščine

Avtorji

  • Nataša Logar Berginc
  • Simon Šuster

Ključne besede:

referenčni korpus | merila gradnje | taksonomijaFidaPLUS

Povzetek

V prispevku je predstavljen začetni del gradnje novega referenčnega korpusa slovenščine. Ta bo nadgradnja korpusa FidaPLUS ter bo imel 100-milijonski del in do milijarde pojavnic obsegajoči ostali del. Prikazana in na kratko utemeljena je taksonomija korpusa z okvirnimi deleži različnih vrst besedil, našteta pa so tudi druga ključna načela, ki bodo usmerjala zbiranje. Zbiranje besedil na podlagi različnih podatkov, iz katerih je mogoče vsaj okvirno sklepati o recepciji in produkciji javno objavljenih slovenskih besedil, že poteka.

Prenosi

Podatki o prenosih še niso na voljo.

Prenosi

Objavljeno

04.01.2024

Številka

Rubrika

Članki

Kako citirati

Logar Berginc, N., & Šuster, S. (2024). Gradnja novega korpusa slovenščine. Jezik in Slovstvo, 54(3-4), 57-68. https://journals.uni-lj.si/jezikinslovstvo/article/view/17470

Podobni članki

1-10 od 46

Lahko poskusite tudi zaženi napredni iskalnik podobnosti za ta članek.