Označevanje korpusov

Avtorji

  • Tomaž Erjavec

DOI:

https://doi.org/10.4312/jis.48.3-4.61-76

Povzetek

Urejene računalniške zbirke besedil, korpusi, so uporabni v številnih vejah jezikoslovja. Prispevek se osredotoči na računalniški zapis korpusov, predvsem na njihovo označevanje, tj. dodajanje interpretativnih informacij besedilu v korpusu. Predstavljeno označevanje temelji na upoštevanju mednarodnih standardov s tega področja, kar doprinese k boljši dokumentiranosti in preverljivosti, enostavnejši uporabi programov za obdelavo, in k večji izmenljivosti ter trajnosti. V prvem delu obravnavamo standarde za računalniški zapis besedil, predvsem XML (eXtended Markup Language) in TEI (Text Encoding Initiative), v drugem pa orišemo nekaj bolj zanimivih ravni jezikoslovnega označevanja korpusov.

Prenosi

Podatki o prenosih še niso na voljo.

Prenosi

Objavljeno

15.03.2003

Številka

Rubrika

Članki

Kako citirati

Erjavec, T. (2003). Označevanje korpusov. Jezik in Slovstvo, 48(3-4), 61-76. https://doi.org/10.4312/jis.48.3-4.61-76