Označevanje korpusov
DOI:
https://doi.org/10.4312/jis.48.3-4.61-76Povzetek
Urejene računalniške zbirke besedil, korpusi, so uporabni v številnih vejah jezikoslovja. Prispevek se osredotoči na računalniški zapis korpusov, predvsem na njihovo označevanje, tj. dodajanje interpretativnih informacij besedilu v korpusu. Predstavljeno označevanje temelji na upoštevanju mednarodnih standardov s tega področja, kar doprinese k boljši dokumentiranosti in preverljivosti, enostavnejši uporabi programov za obdelavo, in k večji izmenljivosti ter trajnosti. V prvem delu obravnavamo standarde za računalniški zapis besedil, predvsem XML (eXtended Markup Language) in TEI (Text Encoding Initiative), v drugem pa orišemo nekaj bolj zanimivih ravni jezikoslovnega označevanja korpusov.Prenosi
Podatki o prenosih še niso na voljo.
Prenosi
Objavljeno
15.03.2003
Številka
Rubrika
Članki
Licenca
Avtorske pravice (c) 2003 Tomaž Erjavec

To delo je licencirano pod Creative Commons Priznanje avtorstva-Deljenje pod enakimi pogoji 4.0 mednarodno licenco.
Kako citirati
Erjavec, T. (2003). Označevanje korpusov. Jezik in Slovstvo, 48(3-4), 61-76. https://doi.org/10.4312/jis.48.3-4.61-76