På-skruvad eller "påsk-ruvad" - LexWare hjälper till med rätt ordanalys i datorn - "Rusdrycksförsäljningsförordning" är det längsta lexikaliserade svenska ordet, enligt Guiness rekordbok. Den engelska ekvivalenten "regulations for the sale of alcoholic beverages" ger en föraning om svårigheterna att lära en dator att upptäcka lexikala enheter i ett svenskt sammansatt ord - detta har varit huvudmålet för Elzbietas Duras avhandling och den föreslagna analysatorn LexWare. - Det största problemet är att hitta den rätta segmenteringen, t ex "på-skruvad" snarare än "påsk-ruvad", "ny-pröva" och inte "nyp-röva", "maskin-driven" inte "mask-indriven" osv. Ofta finns det ett stort antal alternativ som inte passar men heller kan inte uteslutas lätt i förväg, vilket innebär att det tar för lång tid att analysera texten, och analysatorn lämpar sig inte för tillämpningar där svaren väntas av användaren direkt. - Den metod som använts i LexWare vilar på observationer av hur sammansatta skrivna ord uppfattas i vardagligt språkbruk, och försöker operationalisera det faktum att vi ger normalt företräde till tolkningen "kultur-krockar" istället för "kul-turk-rockar", "kult-ur-krockar", "kul-tur-krockar", som är fullt möjliga alternativ. - Operationaliseringen av dessa kunskaper hos språkbrukarna gör det möjligt för analysatorn att direkt upptäckta de önskade tolkningarna i textorden, den behöver inte slösa tid på att överväga de "konstiga" alternativen. Preliminära tester av LexWare visar att analysen kan bli inte bara mera precis utan också snabb, ca 10 000 ord i sekunden. Analysatorn kan alltså användas i online-tillämpningar, t ex för att öka precisionen i sökningar på Internet. - Avhandlingens titel är: Parsing Words (Automatisk ordanalys) Disputationen äger rum lördagen den 7 mars 1998 kl 10.00. Lilla hörsalen, Humanisten, Renströmsgatan 6, Göteborg