Huvudansatser för parsningsmetoder. Om programutvecklingens förutsättningar i en svensk kontext
Abstract
Syftet med denna text var att ge en inblick i området (syntaktisk) parsning. Tanken
var att ge en bild av utvecklingen som var 1) fri från alltför tekniska detaljer, då
området är programmeringstekniskt, och 2) beskriven ur ett svenskt perspektiv.
Bakgrunden till valet av ämne till texten, som var tänkt att finnas med i antologin
Text och kontext, var att parsning är relativt okänt för många personer verksamma
inom närliggande områden, samtidigt som det är ett absolut nyckelbegrepp för
den som ägnar sig åt datorlingvistik eller språkteknologi.
Målet var alltså att ge en ganska allmän utifrånblick på några centrala sidor av
utvecklingen, samtidigt som det tydligt är så att den som själv arbetat med
utveckling kan ha starka åsikter och preferenser rörande metodval, något som i
ärlighetens namn kanske inte heller denna text är lösgjord från.
Hur ska det göras? Konsten att utveckla automatisk syntaxanalys av naturlig text
kan läras ut från ett flertal perspektiv. Det kan t.ex. ske med fokus på användandet
av en viss grammatikformalism, med fokus på beräkningssnabbhet, med fokus på
entydiggörande av möjliga ambiguiteter. Tolkningsval kan göras med hjälp av
antingen handskrivna regler eller inhämtad statistik.
En sorts huvudtema i denna text är hur metoder för parsning på senare år uppvisar
förändringar som kanske kan förklaras med att programmen har fått andra
användningsområden och att metoderna har anpassats därefter (en annan tolkning
är att flera senare system inte längre gör parsning i strikt mening).
När detta tänkta ”kapitel” var färdigt fick det kommentaren att det inte var
anpassat för antologins målgrupp. Det fick skrivas en annan kapiteltext, men det
kom samtidigt ett förslag att publicera texten om parsning här som denna rapport.
Publisher
Institutionen för svenska språket, Göteborgs universitet
View/ Open
Date
2016-11Author
Wilhelmsson, Kenneth
Keywords
parsning
text
språkteknologi
datorlingvistik
Publication type
report
ISSN
1401-5919
Series/Report no.
Forskningsrapporter från institutionen för svenska språket, Göteborg (GU-ISS)
2016-04
Language
swe