Ótrúlegt hve hratt Google lærði íslensku Breki Logason skrifar 3. september 2012 22:51 Í síðasta mánuði gátu Íslendingar byrjað að tala íslensku við Google leitarvélina. Fyrrverandi starfsmaður fyrirtækisins og lektor við Háskólann í Reykjavík eru mennirnir á bakvið hugmyndina, sem þeir segja í upphafi hafa verið líkasta draumi. Í raun sé ótrúlegt hversu fljótt þeir náðu að kenna íslenskuna. Hingað til hefur það ekki talist neitt tiltökumál að tala íslensku í símann. Þannig hefur maður getað rætt við vini og vandamenn um nánast hvað sem er á hinu ástkæra og ylhýra. En nú getur maður talað íslensku við internetið í símanum. Þannig getur maður spurt sjálfan Google um nánast hvað sem er. Þetta eru þeir Trausti og Jón. Mennirnir á bakvið tungumálakunnáttu Google, sem nú í ágúst byrjaði að skilja íslensku. Íslenska er ekki beint efst á lista hjá Google en Trausti var þar starfsmaður og ýtti á eftir sínu móðurmáli. Hann leitaði til Jóns sem í samvinnu við fleiri hóf söfnun á íslenskum setningum. „Fyrst létum við einhverja fá síma og vonuðumst til að þeir söfnuðu. Það gekk voða hægt. Svo sátum við fyrir gestum og gangandi hérna í HR og veiddum inn fólk. Þá gekk þetta aðeins," segir Jón Guðnason, lektor við HR. en það komst ekki skriður á söfnunina fyrr en fyrirtæki og stofnanir hoppuðu um borð. Á endanum voru þetta um 230 þúsund setningar sem söfnuðust hjá rúmlega 500 manns. Íslenskan virkar vel að sögn strákanna en þeir vildu fá eins marga og þeir gátu til þess að tala eins fjölbreytt íslenskt mál og hægt er. Tölvan lærir síðan nokkurskonar meðaltals íslensku, og þjálfar sig í að tengja hljóð og texta. Og þeir eru óneitanlega stoltir. „Ég er búinn að vera í talgreiningu núna í 15 ár. Gerði fyrst talgervil. Þetta var lokatakmarkið. Ég vildi ekki fara frá Google fyrr en þetta yrði að veruleika," segir Trausti Kristjánsson, stofnandi. „Við erum með svona svipaðan bakgrunn við Trausti. Ég var í svona svipuðum sporum og hann. Þetta var draumur þegar maður kom út úr meistaranámi og eitthvað sem maður ætlaði að vinna að. Talgreining var augljóslega komin af stað. En það að ná talgreiningu fyrir íslensku var bara fjarlægur draumur. Og það er í raun bara ótrúlegt hvað við náðum þessu á stuttum tíma," segir Jón. Mest lesið Grunaður um að nauðga konu þrisvar sömu nóttina Innlent Segir Bandaríkin ekki geta ráðist inn Erlent „Aldrei fyrirgefanlegt þegar það er farið svona með opinbert fé“ Innlent „Gætir verið pirrandi við matarborðið en það er þess virði“ Innlent Annar hinna handteknu látinn laus: „Drepið mig, drepið mig, drepið mig“ Erlent Þúsundir hafi orðið af milljónum Innlent Moskítóflugan lifði kuldakastið af Innlent Hjóluðu 1300 kílómetra meðfram Dóná með börnum sínum Innlent Nokkrar milljónir horfnar á örfáum vikum Innlent Hætta á að ákveðnir staðir þrífist ekki Innlent Fleiri fréttir Grunaður um að nauðga konu þrisvar sömu nóttina „Aldrei fyrirgefanlegt þegar það er farið svona með opinbert fé“ Hjóluðu 1300 kílómetra meðfram Dóná með börnum sínum „Gætir verið pirrandi við matarborðið en það er þess virði“ Kynlífsverkafólk í Norræna húsinu og tölvuspilandi eldri borgarar Moskítóflugan lifði kuldakastið af „Þorsti í auglýsingafé er talsverður hjá Ríkisútvarpinu“ Hætta á að ákveðnir staðir þrífist ekki Velunnarar hefja söfnun fyrir ekkju Hjörleifs Þúsundir hafi orðið af milljónum Hundrað þúsund færri kindur í dag en fyrir tíu árum Dökk mynd í byggingariðnaði, umsvif RÚV og fækkun fjár Losun gróðurhúsalofttegunda jókst í Reykjavík Húsnæðismálin og staða Ríkisútvarpsins Ölvaður undir stýri með börn í bílnum Kosningahugur í eigendum frístundahúsa Keypti stól í Góða hirðinum sem reyndist fágætur gripur Getur gervigreindarsmjaður leitt til gervigreindargeðrofs? Söguleg óvissa á fasteignamarkaði og meðvirk gervigreind Óttast að námsbraut verði undir verði af frumvarpinu Kostnaður við stjórnsýslu borgarinnar mun hærri en landsmeðaltalið Tveir fá heilablóðfall á hverjum degi á Íslandi Breytingar sem litlu breyta og mokstursmenn þakka veðurguðunum Líta eigi á eignir landsbyggðafólks í Reykjavík sem sumarbústaði Sendi síðasta bréfið degi áður en fellibylurinn gekk yfir Borgin tekur út framkvæmdir við Vesturbæjarlaug Nokkrar milljónir horfnar á örfáum vikum Tilkynnt um bíl fullan af flugeldum Valhöll auglýst til sölu Rændur fyrir utan Costco um hábjartan dag Sjá meira
Í síðasta mánuði gátu Íslendingar byrjað að tala íslensku við Google leitarvélina. Fyrrverandi starfsmaður fyrirtækisins og lektor við Háskólann í Reykjavík eru mennirnir á bakvið hugmyndina, sem þeir segja í upphafi hafa verið líkasta draumi. Í raun sé ótrúlegt hversu fljótt þeir náðu að kenna íslenskuna. Hingað til hefur það ekki talist neitt tiltökumál að tala íslensku í símann. Þannig hefur maður getað rætt við vini og vandamenn um nánast hvað sem er á hinu ástkæra og ylhýra. En nú getur maður talað íslensku við internetið í símanum. Þannig getur maður spurt sjálfan Google um nánast hvað sem er. Þetta eru þeir Trausti og Jón. Mennirnir á bakvið tungumálakunnáttu Google, sem nú í ágúst byrjaði að skilja íslensku. Íslenska er ekki beint efst á lista hjá Google en Trausti var þar starfsmaður og ýtti á eftir sínu móðurmáli. Hann leitaði til Jóns sem í samvinnu við fleiri hóf söfnun á íslenskum setningum. „Fyrst létum við einhverja fá síma og vonuðumst til að þeir söfnuðu. Það gekk voða hægt. Svo sátum við fyrir gestum og gangandi hérna í HR og veiddum inn fólk. Þá gekk þetta aðeins," segir Jón Guðnason, lektor við HR. en það komst ekki skriður á söfnunina fyrr en fyrirtæki og stofnanir hoppuðu um borð. Á endanum voru þetta um 230 þúsund setningar sem söfnuðust hjá rúmlega 500 manns. Íslenskan virkar vel að sögn strákanna en þeir vildu fá eins marga og þeir gátu til þess að tala eins fjölbreytt íslenskt mál og hægt er. Tölvan lærir síðan nokkurskonar meðaltals íslensku, og þjálfar sig í að tengja hljóð og texta. Og þeir eru óneitanlega stoltir. „Ég er búinn að vera í talgreiningu núna í 15 ár. Gerði fyrst talgervil. Þetta var lokatakmarkið. Ég vildi ekki fara frá Google fyrr en þetta yrði að veruleika," segir Trausti Kristjánsson, stofnandi. „Við erum með svona svipaðan bakgrunn við Trausti. Ég var í svona svipuðum sporum og hann. Þetta var draumur þegar maður kom út úr meistaranámi og eitthvað sem maður ætlaði að vinna að. Talgreining var augljóslega komin af stað. En það að ná talgreiningu fyrir íslensku var bara fjarlægur draumur. Og það er í raun bara ótrúlegt hvað við náðum þessu á stuttum tíma," segir Jón.
Mest lesið Grunaður um að nauðga konu þrisvar sömu nóttina Innlent Segir Bandaríkin ekki geta ráðist inn Erlent „Aldrei fyrirgefanlegt þegar það er farið svona með opinbert fé“ Innlent „Gætir verið pirrandi við matarborðið en það er þess virði“ Innlent Annar hinna handteknu látinn laus: „Drepið mig, drepið mig, drepið mig“ Erlent Þúsundir hafi orðið af milljónum Innlent Moskítóflugan lifði kuldakastið af Innlent Hjóluðu 1300 kílómetra meðfram Dóná með börnum sínum Innlent Nokkrar milljónir horfnar á örfáum vikum Innlent Hætta á að ákveðnir staðir þrífist ekki Innlent Fleiri fréttir Grunaður um að nauðga konu þrisvar sömu nóttina „Aldrei fyrirgefanlegt þegar það er farið svona með opinbert fé“ Hjóluðu 1300 kílómetra meðfram Dóná með börnum sínum „Gætir verið pirrandi við matarborðið en það er þess virði“ Kynlífsverkafólk í Norræna húsinu og tölvuspilandi eldri borgarar Moskítóflugan lifði kuldakastið af „Þorsti í auglýsingafé er talsverður hjá Ríkisútvarpinu“ Hætta á að ákveðnir staðir þrífist ekki Velunnarar hefja söfnun fyrir ekkju Hjörleifs Þúsundir hafi orðið af milljónum Hundrað þúsund færri kindur í dag en fyrir tíu árum Dökk mynd í byggingariðnaði, umsvif RÚV og fækkun fjár Losun gróðurhúsalofttegunda jókst í Reykjavík Húsnæðismálin og staða Ríkisútvarpsins Ölvaður undir stýri með börn í bílnum Kosningahugur í eigendum frístundahúsa Keypti stól í Góða hirðinum sem reyndist fágætur gripur Getur gervigreindarsmjaður leitt til gervigreindargeðrofs? Söguleg óvissa á fasteignamarkaði og meðvirk gervigreind Óttast að námsbraut verði undir verði af frumvarpinu Kostnaður við stjórnsýslu borgarinnar mun hærri en landsmeðaltalið Tveir fá heilablóðfall á hverjum degi á Íslandi Breytingar sem litlu breyta og mokstursmenn þakka veðurguðunum Líta eigi á eignir landsbyggðafólks í Reykjavík sem sumarbústaði Sendi síðasta bréfið degi áður en fellibylurinn gekk yfir Borgin tekur út framkvæmdir við Vesturbæjarlaug Nokkrar milljónir horfnar á örfáum vikum Tilkynnt um bíl fullan af flugeldum Valhöll auglýst til sölu Rændur fyrir utan Costco um hábjartan dag Sjá meira