Málgögn og gervigreind Steinþór Steingrímsson, Einar Freyr Sigurðsson og Helga Hilmisdóttir skrifa 7. október 2025 11:30 Texti og önnur gögn sem geyma upplýsingar um tungumálið eru lykillinn að þróun gervigreindarforrita á borð við ChatGPT, Claude og Gemini. Forritin byggja á mállíkönum sem eru mótuð með greiningu á textagögnum með það markmið að geta líkt eftir tungumálinu og myndað þannig læsilegan texta á öllum þeim málum sem það hefur „séð“ nógu mikið af. Langstærstur hluti þeirra texta sem líkönunum eru sýndir er á ensku. Flest stærstu mállíkönin eru þó fjöltyngd að því leyti að þau geta myndað texta á mörgum tungumálum. Bestu niðurstöðurnar sem fást úr líkönunum eru á málum sem mjög margir tala en tungumál sem færri tala standa ekki eins vel að vígi. Á alþjóðlegum fundi stjórnmálaleiðtoga, fræðimanna og fulltrúa tæknifyrirtækja um gervigreind í febrúar fyrr á þessu ári kom það fram að bæta þyrfti samkeppnisstöðu Evrópu. Meðal annars var rætt um mikilvægi þess að hlúa að þeim fjölmörgu tungumálum sem töluð eru í álfunni. Lykilatriði er að afla nægilegra gagna og vinna úr þeim svo að þau geti nýst til að búa til gervigreindarlíkön sem geta unnið með öll þessi tungumál. Liður í því er verkefnið European Language Data Space sem framkvæmdastjórn Evrópusambandsins hefur sett á laggirnar. Þar geta eigendur gagna og rétthafar samið um notkun við þá sem vilja nýta þau. Árnastofnun hefur verið leiðandi í því að búa til og safna málgögnum á íslensku með það að markmiði að tryggja stöðu íslensku í tækniheiminum. Fimmtudaginn 9. október stendur Árnastofnun fyrir málþingi í samvinnu við framkvæmdastjórn Evrópusambandsins um European Language Data Space-verkefnið. Á málþinginu, Hagnýting málgagna með Language Data Space, tala íslenskir og erlendir sérfræðingar um markmiðið með verkefninu, markað fyrir málgögn og mikilvægi þeirra. Þá verða pallborðsumræður um málgögn, máltækni og gervigreind fyrir íslensku, og hvort og þá hvernig hægt sé að ná sátt um nýtingu textagagna við þróun gervigreindarlíkana. Málþingið er opið öllum áhugasömum og upplýsingar um skráningu má finna á vef Árnastofnunar, arnastofnun.is. Höfundar eru fræðimenn við Stofnun Árna Magnússonar í íslenskum fræðum. Viltu birta grein á Vísi? Sendu okkur póst. Senda grein Gervigreind Máltækni Íslensk tunga Mest lesið Hafa íslenskir neytendur sama rétt og evrópskir? Ásthildur Lóa Þórsdóttir,Ragnar Þór Ingólfsson Skoðun Skuldin við úthverfin Jóhanna Dýrunn Jónsdóttir Skoðun Til þeirra sem fagna Doktornum! Kristján Freyr Halldórsson Skoðun Einelti er dauðans alvara Kolbrún Áslaugar Baldursdóttir Skoðun Hringekja verðtryggingar og hárra vaxta Benedikt Gíslason Skoðun Réttlæti hins sterka. Gildra dómarans Jörgen Ingimar Hansson Skoðun Áfram gakk – með kerfisgalla í bakpokanum Harpa Þorsteinsdóttir Skoðun Málgögn og gervigreind Steinþór Steingrímsson,Einar Freyr Sigurðsson,Helga Hilmisdóttir Skoðun Það sem Njáll sagði ykkur ekki Inga Lind Karlsdóttir Skoðun Engin eftirspurn eftir Viðreisnar- og Samfylkingarmódelinu Andri Steinn Hilmarsson Skoðun Skoðun Skoðun Hefur þú heyrt þetta áður? Stefnir Húni Kristjánsson skrifar Skoðun Hringekja verðtryggingar og hárra vaxta Benedikt Gíslason skrifar Skoðun Áfram gakk – með kerfisgalla í bakpokanum Harpa Þorsteinsdóttir skrifar Skoðun Til þeirra sem fagna Doktornum! Kristján Freyr Halldórsson skrifar Skoðun Skuldin við úthverfin Jóhanna Dýrunn Jónsdóttir skrifar Skoðun Málgögn og gervigreind Steinþór Steingrímsson,Einar Freyr Sigurðsson,Helga Hilmisdóttir skrifar Skoðun Réttlæti hins sterka. Gildra dómarans Jörgen Ingimar Hansson skrifar Skoðun Einelti er dauðans alvara Kolbrún Áslaugar Baldursdóttir skrifar Skoðun Hafa íslenskir neytendur sama rétt og evrópskir? Ásthildur Lóa Þórsdóttir,Ragnar Þór Ingólfsson skrifar Skoðun Sótt að réttindum kvenna — núna Svandís Svavarsdóttir skrifar Skoðun Afnám tilfærslu milli skattþrepa Breki Pálsson skrifar Skoðun Þegar heilinn sveltur: Tími til að endurhugsa stefnu í geðheilbrigðismálum Vigdís M. Jónsdóttir skrifar Skoðun Opið bréf til umhverfis-, orku- og loftslagsráðherra Bogi Ragnarsson skrifar Skoðun Íslenska þjóð, þú ert núna að gleyma Sighvatur Björgvinsson skrifar Skoðun Tölum íslensku um bíðandi börn: Uppgjöf, svarthol og lögbrot Vigdís Gunnarsdóttir skrifar Skoðun Fjórði hver vinnur í verslun og þjónustu Benedikt S. Benediktsson skrifar Skoðun Engin eftirspurn eftir Viðreisnar- og Samfylkingarmódelinu Andri Steinn Hilmarsson skrifar Skoðun Pabbar, mömmur, afar, ömmur Jón Pétur Zimsen skrifar Skoðun Vellíðan í vinnu Ingrid Kuhlman skrifar Skoðun Hefur vanfjármögnun sveitarfélaga áhrif á byggingarkostnað? Jón Ingi Hákonarson skrifar Skoðun Þar sem gervigreind er raunverulega að breyta öllu Björgmundur Örn Guðmundsson skrifar Skoðun Eru vegir fyrir ferðamenn mikilvægari en vegir fyrir fólk sem býr hér? Petrína Þórunn Jónsdóttir skrifar Skoðun Er Evrópa á villigötum? Efnahagsleg hnignun kallar á róttæka endurskoðun Eggert Sigurbergsson skrifar Skoðun Samræmd nálgun að öryggi og skilvirkni á ytri landamærum - Innleiðing EES á Íslandi Arngrímur Guðmundsson skrifar Skoðun Íslenskir flóttamenn - í okkar eigin landi Gunnar Magnús Diego skrifar Skoðun Ísrael á ekki heima á gleðileikum evrópskra sjónvarpsstöðva sem starfa í almannaþágu Stefán Jón Hafstein skrifar Skoðun Mótum framtíðina saman Jónína Hauksdóttir ,Magnús Þór Jónsson skrifar Skoðun Leikskóli þarf meira en þak og veggi. Kópavogsmódelið og Akureyrarleiðin sem leið að aukinni velferð barna Anna Elísa Hreiðarsdóttir,Svava Björg Mörk skrifar Skoðun Jákvæð áhrif dánaraðstoðar á sorgarferli aðstandenda og umönnunaraðila í Viktoríuríki í Ástralíu Ingrid Kuhlman skrifar Skoðun Kæra Epli, skilur þú mig? Lilja Dögg Jónsdóttir skrifar Sjá meira
Texti og önnur gögn sem geyma upplýsingar um tungumálið eru lykillinn að þróun gervigreindarforrita á borð við ChatGPT, Claude og Gemini. Forritin byggja á mállíkönum sem eru mótuð með greiningu á textagögnum með það markmið að geta líkt eftir tungumálinu og myndað þannig læsilegan texta á öllum þeim málum sem það hefur „séð“ nógu mikið af. Langstærstur hluti þeirra texta sem líkönunum eru sýndir er á ensku. Flest stærstu mállíkönin eru þó fjöltyngd að því leyti að þau geta myndað texta á mörgum tungumálum. Bestu niðurstöðurnar sem fást úr líkönunum eru á málum sem mjög margir tala en tungumál sem færri tala standa ekki eins vel að vígi. Á alþjóðlegum fundi stjórnmálaleiðtoga, fræðimanna og fulltrúa tæknifyrirtækja um gervigreind í febrúar fyrr á þessu ári kom það fram að bæta þyrfti samkeppnisstöðu Evrópu. Meðal annars var rætt um mikilvægi þess að hlúa að þeim fjölmörgu tungumálum sem töluð eru í álfunni. Lykilatriði er að afla nægilegra gagna og vinna úr þeim svo að þau geti nýst til að búa til gervigreindarlíkön sem geta unnið með öll þessi tungumál. Liður í því er verkefnið European Language Data Space sem framkvæmdastjórn Evrópusambandsins hefur sett á laggirnar. Þar geta eigendur gagna og rétthafar samið um notkun við þá sem vilja nýta þau. Árnastofnun hefur verið leiðandi í því að búa til og safna málgögnum á íslensku með það að markmiði að tryggja stöðu íslensku í tækniheiminum. Fimmtudaginn 9. október stendur Árnastofnun fyrir málþingi í samvinnu við framkvæmdastjórn Evrópusambandsins um European Language Data Space-verkefnið. Á málþinginu, Hagnýting málgagna með Language Data Space, tala íslenskir og erlendir sérfræðingar um markmiðið með verkefninu, markað fyrir málgögn og mikilvægi þeirra. Þá verða pallborðsumræður um málgögn, máltækni og gervigreind fyrir íslensku, og hvort og þá hvernig hægt sé að ná sátt um nýtingu textagagna við þróun gervigreindarlíkana. Málþingið er opið öllum áhugasömum og upplýsingar um skráningu má finna á vef Árnastofnunar, arnastofnun.is. Höfundar eru fræðimenn við Stofnun Árna Magnússonar í íslenskum fræðum.
Hafa íslenskir neytendur sama rétt og evrópskir? Ásthildur Lóa Þórsdóttir,Ragnar Þór Ingólfsson Skoðun
Skoðun Málgögn og gervigreind Steinþór Steingrímsson,Einar Freyr Sigurðsson,Helga Hilmisdóttir skrifar
Skoðun Hafa íslenskir neytendur sama rétt og evrópskir? Ásthildur Lóa Þórsdóttir,Ragnar Þór Ingólfsson skrifar
Skoðun Þegar heilinn sveltur: Tími til að endurhugsa stefnu í geðheilbrigðismálum Vigdís M. Jónsdóttir skrifar
Skoðun Engin eftirspurn eftir Viðreisnar- og Samfylkingarmódelinu Andri Steinn Hilmarsson skrifar
Skoðun Eru vegir fyrir ferðamenn mikilvægari en vegir fyrir fólk sem býr hér? Petrína Þórunn Jónsdóttir skrifar
Skoðun Er Evrópa á villigötum? Efnahagsleg hnignun kallar á róttæka endurskoðun Eggert Sigurbergsson skrifar
Skoðun Samræmd nálgun að öryggi og skilvirkni á ytri landamærum - Innleiðing EES á Íslandi Arngrímur Guðmundsson skrifar
Skoðun Ísrael á ekki heima á gleðileikum evrópskra sjónvarpsstöðva sem starfa í almannaþágu Stefán Jón Hafstein skrifar
Skoðun Leikskóli þarf meira en þak og veggi. Kópavogsmódelið og Akureyrarleiðin sem leið að aukinni velferð barna Anna Elísa Hreiðarsdóttir,Svava Björg Mörk skrifar
Skoðun Jákvæð áhrif dánaraðstoðar á sorgarferli aðstandenda og umönnunaraðila í Viktoríuríki í Ástralíu Ingrid Kuhlman skrifar
Hafa íslenskir neytendur sama rétt og evrópskir? Ásthildur Lóa Þórsdóttir,Ragnar Þór Ingólfsson Skoðun