Transkribus za namen optične prepoznave rokopisa: poročilo o uporabi in učenju besedilnega modela
DOI:
https://doi.org/10.55741/knj.69.2-3.5Ključne besede:
digitalizacija , knjižnice, rokopisno gradivo, optična prepoznava rokopisov (HTR), umetna inteligenca (UI)Povzetek
Digitalizacija in prepoznavanje besedila sta ključna za omogočanje dostopa do zgodovinskih dokumentov, vključno z rokopisi. Članek predstavlja pregled obstoječih praks na področju optične prepoznave rokopisov (HTR) v Sloveniji in nekaj primerov tujih praks. Sledi poročilo o uporabi in učenju besedilnega modela za optično prepoznavo rokopisov z uporabo orodja Transkribus. Narodna in univerzitetna knjižnica (NUK) je v okviru projekta EODOPEN testirala platformo Transkribus na razmnoženih rokopisih semeniških predavanj Janeza Evangelista Kreka iz začetka 20. stoletja. Zapiske Krekovih predavanj so med letoma 1903 in 1907 nekateri bogoslovci stenografirali in po njegovem pregledu litografirali. Poročilo opisuje proces učenja besedilnega modela na enem delu in nato uporabo nastalega modela na treh dodatnih delih s podobno pisavo. Predstavljeni so tudi izzivi, s katerimi so se soočili, ter rezultati, ki so pokazali, da je uporaba Transkribusa učinkovita pri prepoznavanju besedil v slovenščini, čeprav sprva zahteva nekaj dodatnega ročnega dela. Članek se zaključuje s priporočili in idejami za nadaljnjo uporabo ter raziskovanje te tehnologije.
Prenosi
Literatura
Dolenec, I. (2024). Krek, Janez Evangelist. Slovenska biografija. Slovenska akademija znanosti in umetnosti, Znanstvenoraziskovalni center SAZU. https://www.slovenska¬-biografija.si/oseba/sbi302887/
Hodel, T. (2022). Chapter 6: Supervised and unsupervised: approaches to machine lear¬ning for textual entities. V Jaillant, L. (ur.), Archives, access and artificial intelligence: working with born-digital and digitized archival collections, (157–177). transcript Verlag, Bielefeld University Press. https://www.jstor.org/stable/jj.11425482
Klasinc, J., Kragelj, M., Grčar, U., Zorko, T., Šavnik, M., Malešič, J., Vovk, D., Kozjek, A., in Krstulović, Z. (2023). Enotne zahteve in postopkovni model izvajanja interne digitali¬zacije knjižničnega gradiva v Narodni in univerzitetni knjižnici, različica 1.1. Narodna in univerzitetna knjižnica.
The Library of Congress (15. 9. 2025). METS: Metadata Encoding & Transmission Standard. https://www.loc.gov/standards/mets/
Milioni, N. (2020). Automatic transcription of historical documents: Transkribus as a tool for libraries, archives and scholars [Magistrsko delo]. Uppsala universitet, department of ALM. https://urn.kb.se/resolve?urn=urn:nbn:se:uu:diva-412565
Muehlberger, G., Seaward, L., Terras, M., Oliveira, S. A., Bosch, V., Bryan, M., Colut¬to, S., Déjean, H., Diem, M., Fiel, S., Gatos, B., Greinoecker, A., Grüning, T., Hackl, G., Haukkovaara, V., Heyer, G., Hirvonen, L., Hodel, T., Jokinen, M., … Zagoris, K. (2019). Transforming scholarship in the archives through handwritten text recognition: Transkribus as a case study. Journal of Documentation, 75(5), 954–976. https://www.emerald.com/insight/content/doi/10.1108/JD-07-2018-0114/full/html
Nockels, J., Gooding, P., in Terras, M. (2024). The implications of handwritten text reco¬gnition for accessing the past at scale. Journal of Documentation, 80(7), 148–167. https://www.emerald.com/insight/content/doi/10.1108/JD-09-2023-0183/full/html
Peter Handke Notizbücher. (24. 6. 2024). Projektinformation. https://edition.onb.ac.at/fedora/objects/o:hnb.red-projectinformation/methods/sdef:TEI/get?mode=info#toc-2-2
Prebor, G. (2024). From digitization and images to text and content: Transkribus as a case study. Manuscript Studies, 9(1), 72–89. https://doi.org/10.1353/mns.2024.a930877
READ-COOP SCE, (b. d. a). A cooperative to unlock our written past. https://readcoop.org/
READ-COOP SCE. (b. d. b). Unlock the past with Transkribus. https://www.transkribus.org/
READ-COOP SCE. (b. d. c). Our story. https://readcoop.eu/our-story/
READ-COOP SCE. (b. d. č). +Searching handwritten manuscripts at Greifswald University Library. https://www.transkribus.org/blog/searching-handwritten-manuscripts-at-greif¬swald-university-library
Slovenska biografija. (2013). Slovenska akademija znanosti in umetnosti, Znanstveno¬raziskovalni center SAZU. https://www.slovenska-biografija.si
Smernice za digitalizacijo knjižničnega gradiva. (2010). Narodna in univerzitetna knjižni¬ca. https://www.dlib.si/details/URN:NBN:SI:DOC-ZU0LQ5EO
Terras, M. (2022). Chapter 7: Inviting AI into the archives: the reception of handwritten recognition technology into historical manuscript transcription. V Jaillant, L. (ur.), Ar¬chives, access and artificial intelligence: working with born-digital and digitized archival collections (179–204). transcript Verlag, Bielefeld University Press. https://www.jstor.org/stable/jj.11425482
Prenosi
Objavljeno
Številka
Rubrika
Licenca
Avtorske pravice (c) 2025 Andreja Hari

To delo je licencirano pod Creative Commons Priznanje avtorstva-Deljenje pod enakimi pogoji 4.0 mednarodno licenco.