Þórunn Arnardóttir and Anton Karl Ingason.
Presented at Hugvísindaþing 2020. University of Iceland, 18.-19. September, 2020.
Publication year: 2020

A recording of the talk, hosted at Youtube:

Útdráttur (abstract, in Icelandic):

Greining á setningagerð er nytsamleg fyrir ýmsan máltæknihugbúnað, t.d. vélrænar þýðingar og hugbúnað sem leiðréttir texta málfræðilega. Til að geta greint texta á vélrænan hátt þarf þáttara, sem tekur inn hreinan texta og skilar af sér setningafræðilega greindum eða þáttuðum texta. Taugaþáttarar nýta tauganet við þjálfun og hafa skilað góðum niðurstöðum, en sagt verður frá þjálfun eins slíks þáttara. Sögulegi íslenski trjábankinn (IcePaHC), sem inniheldur þáttaðan texta, er notaður til að þjálfa þáttarann svo hægt sé að greina texta setningafræðilega samkvæmt þáttunarkerfi trjábankans. Með tilkomu íslenska þáttarans má þátta hreinan texta og einnig bæta gögnum við Sögulega íslenska trjábankann, en bæði nýtist í máltæknihugbúnað og málfræðirannsóknir.