29. maaliskuuta 2015

Arvokasta kielitietoa

Julkaistu useissa sanomalehdissä tammikuussa 2012

Näinä päivinä puhutaan siitä, miten oppiminen ja viestintä kaikkiallistuvat: niitä siis ajatellaan olevan kaikkialla. Samaa voi sanoa teksteistä ja kielestä.

Kielenkäyttö on yhä useamman toimintamme alku ja juuri, jopa varsinainen sisältö. Kieltä ja kieliä on hyvä osata monipuolisesti.

Kieliosaamisen voi muuttaa monella tavalla menestykseksi. Yksi kiinnostavimmista esimerkeistä on kieliteknologinen menetelmä, jonka avulla voidaan selvittää puhujan todellinen äidinkieli. Keksintö voi mullistaa rajavalvonnan ja auttaa ihmiskaupan vastaisessa työssä.

Kyse on yleisen kielitieteen tohtorin Annu Marttilan kehittämästä Pronouncer-menetelmästä. Keksinnölle on haettu patenttia, ja Ylioppilaslehden mukaan Valkoinen talokin on kiinnostunut asiasta.

Pronouncer on tietokanta ja tietokonesovellus, joka pystyy ihmisen puhetta analysoimalla selvittämään hänen äidinkielensä. Keksintö perustuu äänteiden, sanajärjestyksen ja monien muiden puhekielen piirteiden tunnistamiseen, kertoo Marttila Helsingin Sanomissa.

Lähtökohta on, että kielet eivät ole samanlaisia. Suomen kieleksi ohjelma tunnistaa puheen, jossa on vokaalisointu (esim. a ja ä eivät esiinny samassa sanassa, ellei kyse ole yhdyssanasta) ja diftongeja (esim. ai, ui, eu). Monessa tapauksessa jo parin juuri tietylle kielelle ominaisen äänteen löytyminen riittää luotettavaan tunnistamiseen.

Ohjelmaan on ladattu kahdensadan kielen tiedot, joten kehitettävää siinä tietysti on. Onhan maailmassa kaikkiaan seitsemisentuhatta kieltä.

Moderni kieliteknologia avaa monenlaisia mahdollisuuksia – on jo avannut. Suomalaiset kieliteknologit ovat 1980-luvulta lähtien tehneet yhteistyötä sellaisten yritysten kuin IBM, Nokia ja Microsoft kanssa. Suomalaisella kielitieteellisellä ammattitaidolla on ollut kysyntää muun muassa puheentunnistuksen, kieliopintarkistinten, konekäännösjärjestelmien ja elektronisten sanakirjojen kehittämisessä.

Miksi juuri Suomessa on oltu tällä lähtökohdiltaan kansainvälisellä alalla innovatiivisia? Yhden vastauksen antaa Antti Arppe Helsingin yliopiston kieliteknologiaoppiaineen verkkosivuilla.

Arppen mukaan suomi on rakenteellisesti rikasta. Tämä näkyy esimerkiksi taivutusmuotojen, johdosten ja yhdyssanojen runsautena. Suomi tarjoaa virkistävän näkökulman kielentutkimukseen, jossa rakenteeltaan yksinkertaisempi englanti on käytännössä ollut hallitsevassa asemassa.

Englantia varten pystyy kehittämään yksinkertaisen oikolukuohjelman listaamalla yleisimmät satatuhatta sanaa. Jos sama tehdään suomelle, sanojen listaaminen ei riitä. Pitää listata kymmeniä miljoonia eri sanamuotoja.

Ei kommentteja:

Lähetä kommentti

Saa kommentoida. Tosin käyn kommentteja laiskasti läpi. Julkaisen kommentit, jotka ymmärrän ja joista tykkään :)