No blir det enklare å talestyra mobilen på nynorsk

Nynorsk Pressekontor
Publisert

info

Denne artikkelen er eldre enn 1 år gamal. Det betyr at noko av informasjonen kan vere utdatert.

– Ved å tilby den nye uttaleordlista på nynorsk med open lisens gjer vi det billegare og enklare å utvikla taleteknologi for nynorsk, seier språkteknolog Per Erik Solberg ved Språkbanken i Nasjonalbiblioteket. Foto: Nasjonalbiblioteket

– Til no har det ikkje vore så mykje taleattkjenning på nynorsk, seier språkteknolog Per Erik Solberg ved Språkbanken til Nynorsk pressekontor.

For å bøta på dette har Nasjonalbiblioteket no gjort tilgjengeleg ei uttaleordliste, som er ein viktig grunnlagsressurs for nynorsk taleteknologi.

Snart kan datamaskina snakka nynorsk

Uttaleordlista er ikkje ei vanleg ordliste som menneske kan slå opp i. Ho er laga spesielt til bruk for datamaskiner. Solberg forklarer at ordlista både vil vera nyttig for taleattkjenning og for såkalla talesyntese.

– Taleattkjenning er det å snakka til datamaskina, og så skriv maskina det du seier, medan talesyntese er ei syntetisk stemme som les opp tekst frå datamaskina. Du kan til dømes få datamaskina til å lesa ein avisartikkel på nynorsk, utdjupar han.

På same måten kan taleattkjenning vera eit nyttig verktøy viss du til dømes har senebetennelse og ikkje kan bruka hendene. Då kan du i staden bruka stemma til å diktera til pc-en.

– Taleattkjenning kan også brukast til automatisk transkripsjon av møte, som til dømes Stortinget held på å utvikla, forklarer språkteknologen.

Gratis for alle

Den nyutvikla nynorske uttaleordlista er utvikla av trondheimsfirmaet Lingit og er gratis tilgjengeleg i ressurskatalogen til Språkbanken for alle, både kommersielle – og ikkje-kommersielle utviklarar.

– Å ha ein open lisens er veldig viktig for oss. Språkbanken er til for å tilby ressursar som trengst for å utvikla norsk språkteknologi slik at verken bokmål eller nynorsk taper terreng samanlikna med engelsk og andre større språk, seier Solberg.

Han peikar på at det er svært dyrt å utvikla slik teknologi, og at det for mange føretak ikkje ville vera mogleg eller lønsamt å laga si eiga liste for nynorsk.

– Ved å tilby denne lista med open lisens, gjer vi det billegare og enklare å utvikla taleteknologi for nynorsk, seier han.

570.000 nynorske ord

Ordlista inneheld 570.000 nynorske ord og maskinlesbare, fonetiske transkripsjonar av orda. Den tilsvarande uttalelista på bokmål har oppunder 800.000 ord.

– Forskjellen er likevel ikkje så stor som det i utgangspunktet kanskje høyrest ut som, seier Solberg.

Han forklarer at bokmålsordlista inneheld mange namn som er dei same både på bokmål og nynorsk. Mykje av bokmålsordlista kan ifylgje Solberg difor også brukast på nynorsk.

Taleattkjenning på dialekt

Språkbanken vil no gå vidare og utvikla begge ordlistene med fleire dialektversjonar og fleire ord, slik at ordlistene blir endå meir nyttige.

– Vi har akkurat begynt på eit prosjekt der vi skal utvida desse ordlistene med dialektvariasjonar, slik at ein fangar opp ulike dialektar ein har i Noreg, seier Solberg.

Han peikar på at det i dag mellom anna kan vera eit problem for dialektbrukarar at dei ikkje blir så godt forstått når dei snakkar med taleassistenten på mobilen sin.

– Ved å leggja til variasjonar i ei slik ordliste, kan ein forbetra den situasjonen i ein viss grad.

Peder Lofnes Hauge er leiar i Noregs Mållag. Foto: Jannica Luoto

Mållagsleiar jublar

For leiaren i Noregs Mållag, Per Lofnes Hauge, er nyheita frå Nasjonalbiblioteket godt nytt.

– Dette er ei kjempenyheit som eg er svært glad for å høyra, seier Lofnes Hauge og held fram:

– Det å sikra språkteknologi på nynorsk er noko av det Noregs Mållag vil jobba mest med i tida som kjem, fordi utviklinga går svært fort og det tek over fleire og fleire funksjonar både i arbeidslivet og privatlivet. Det å få taleteknologi som forstår nynorsknære dialektar, er difor utruleg viktig.

 


Les også om SV-politikar Eirik Faret Sakariassen krev å verte referert på nynorsk på talarstolen på Stortinget: – Det er eit viktig signal å senda

Eirik Faret Sakariassen er vararepresentant på Stortinget. No har han gjeve beskjed til stortingsreferentane om at han vil bli referert på nynorsk. Foto: SV