HISTORISK SLAVISTIK MED STÖD AV MASKININLÄRNING Automatiserad handskriftsigenkänning av östslavisk kyrkoslaviska från 1400-talet
No Thumbnail Available
Date
2025-06-24
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
Syftet med uppsatsen är att bidra till den historiska slavistiken genom att skapa och utvärdera en modell baserad på maskininlärning för handskriftsigenkänning av halvuncial östslavisk handskrift samt att utvärdera hur den data som produceras genom automatisk handskriftsigenkänning (HTR) kan användas för att komplettera mer traditionella metoder.
Uppsatsen är teoretiskt grundad i utvecklingen av textkritisk metod och teori sedan 1800-talet och särskilt relationen mellan kopia och text som diskuterats av både förespråkare för och kritiker av den genealogiska metoden. Likväl som att den medeltida kopian av en historisk text är ett medium mellan forskaren och det utforskade, kan den elektroniska kopian och dess transkription ses som ytterligare mellanhänder. Uppsatsens undersökning baserar sig på detta förhållande.
Metoden som används i uppsatsen är främst kvantitativ kompletterad med kvalitativa aspekter. Två östslaviska handskrifter av den kyrkslaviska månadsboken för november med liknande innehåll har valts ut. Flera versioner av HTR-modeller har sedan tagits fram och utvärderats i plattformen Transkribus baserat på detta material. Materialet har slutligen transkriberats i sin helhet och analyserats, främst med hjälp av programmeringsspråket R.
Undersökningen visar att de modeller som publicerats i Transkribus och som baserats på en stor mängd träningsdata har liknande resultat som det som kan uppnås för en specialiserad modell med den minimala mängd träningsdata som rekommenderas av Transkribus. Däremot ger både de befintliga och nya modellerna fortsatt en relativt hög andel fel för tecken som ligger ovanför skrivraden. Dessutom har valen av de glyfvarianter som används i träningsdata betydelse för modellens transkriptioner. Resultaten av den lingvistiska analysen pekar på att de kvantitativa data som genererats med hjälp av HTR-modeller kan komplettera traditionella kvalitativa metoder för att analysera specifika språkliga drag i handskrifterna. Slutligen stödjer den teoretiska diskussionen baserat på uppsatsens resultat den riktning inom textkritisk metod som poängterar kopians värde jämte textens som analytisk enhet.
Description
Keywords
Fornkyrkoslaviska, kyrkoslaviska, HTR, digital humaniora, R, Transkribus, historisk slavistik, ortodox liturgi, Novgorod