Saame AI – puheentunnistusta saamelaiskielille

Projekti
Saame AI – puheentunnistusta saamelaiskielille on Aalto-yliopiston ja Lapin yliopiston yhteisprojekti, jonka tavoitteena on kehittää automaattinen puheentunnistusohjelma (ASR) saamelaiskielille. Helsingin yliopiston on projektissa mukana väitöskirjatutkimuksen kautta. Projekti on saanut rahoituksen Suomen Kulttuurirahastolta (SKR), ja projektin arvioitu kesto on kolme vuotta. Projektin pääpaino on ensin pohjoissaamessa, mutta tulevaisuudessa tavoitteena on kehittää puheentunnistusohjelma myös muille saamelaiskielille.
Puheentunnistus
Puheentunnistus (eng. speech recognition) tarkoittaa sitä, että ohjelma kartoittaa äänitiedostosta puhetta ja muuntaa sen digitaalisesti kirjoitettuun muotoon. Puheentunnistus on hyödyllinen monella eri alalla, kuten tutkimuksessa (esim. haastattelujen litterointi) ja opetuksessa (esim. oppimissovellusten kehittäminen). Puheen muuntaminen kirjoitettuun muotoon, eli litterointi, on hidasta ja raskasta työtä, mikäli sen tekee manuaalisesti. Automaattinen puheentunnistusohjelma nopeuttaa tätä työtä ja vapauttaa näin työntekijöiden resursseja muihin töihin.
Puheentunnistusohjelman rakentaminen saamelaiskielille on samalla myös kielellisen tasa-arvon kysymys. Puheentunnistusohjelmia ja muita kieliteknologisia ratkaisuja on jo rakennettu monille suuremmille kielille, joilla on käytettävissä enemmän resursseja – sekä inhimillisiä että materiaalisia. Pienemmillä tai vähemmistökielillä ei ole vastaavia resursseja käytössään. Kieliteknologisten ratkaisujen hyöty vähemmistökielille on merkittävä, sillä ne lisäävät ihmisten mahdollisuuksia käyttää kieltä laajemmin ja helpommin digitaalistuvassa yhteiskunnassa.
Projektin tilanne ja ajankohtaisia uutisia
Puheentunnistusohjelma on kehitetty Aalto-yliopistossa pohjoissaamen kielelle materiaaleilla, joita Suomen audiovisuaalinen instituutti KAVI ja Norjan Saamelaiskäräjät ovat tarjonneet. Demoversio löytyy HuggingFace-sivustolta.

Kuka tahansa voi testata puheentunnistusohjelmaa HuggingFace-sivustolla, mutta pyydämme huomioimaan, että emme suosittele, että sivustolle ladataan henkilökohtaista tai arkaluontoista materiaalia, sillä emme voi varmentaa sivuston tietoturvallisuutta. Tietoturvallisessa ympäristössä toimivaa puheentunnistusohjelmaa kehitetään parhaillaan Aalto-yliopistossa.
Seuraava vaihe on puheentunnistusohjelman tarkkuuden parantaminen. Tarkkuutta on mahdollista parantaa antamalla ohjelmalle enemmän koulutusmateriaalia. Tähän tarkoitukseen soveltuvat puhemateriaalit, joista ainakin osalle löytyy vastaava tekstitiedosto.
Yhteystiedot
Mikko Kurimo, Aalto-yliopisto (projektipäällikkö) Sähköposti: mikko.kurimo@aalto.fi
Pigga Keskitalo, Lapin yliopisto (projektipartneri) Sähköposti: pigga.keskitalo@ulapland.fi
Kristiina Ojala, Helsingin yliopisto (väitöskirjatutkija) Sähköposti: kristiina.ojala@helsinki.fi
Muut projektityöntekijät / yhteistyökumppanit
Yaroslav Getman, väitöskirjatutkija, Aalto-yliopisto Sähköposti: yaroslav.getman@aalto.fi
Riho Grünthal, väitöskirjaohjaaja, Helsingin yliopisto Sähköposti: riho.grunthal@helsinki.fi