Vil styrke nynorsken med omsetjingsrobot

I desse dagar utviklar NTB og nynorsk pressekontor ein «nynorskrobot» som skal kunne omsetje alle tekstar til nynorsk. Målet er å gjere nynorsken meir tilgjengeleg.

Beate Haugtrø
Publisert
Oppdatert 07.10.2020 12:10

info

Denne artikkelen er eldre enn 1 år gamal. Det betyr at noko av informasjonen kan vere utdatert.

– Det hadde vore eit kjempeløft for nynorsk i media om dette fungerer. Det vil gjere nynorsk meir tilgjengeleg og synleg i media, og det er det vi jobbar for kvar dag, seier Karoline Riise Kristiansen, redaktør i Nynorsk pressekontor.

Karoline Riise Kristiansen, redaktør i NPK, har som mål å normalisere nynorsk i media. Thomas Brun / NTBscanpix

I samarbeid med nyheitsbyrået NTB, er NPK i startgropa av eit prosjekt som skal utvikle ein «robot» som skal omsetje tekstar frå bokmål til nynorsk.

Direktør i NTB, Geir Terje Ruud, meiner dette kan frigjere tid og ressursar for Nynorsk pressekontor, som i dag bruker mykje tid på å omsetje byråstoff til nynorsk.

– Det er positivt, for da kan NPK bruke meir tid på å lage anna type innhald på nynorsk, seier han i eit intervju med Medier 24.

Nyheiter er ein eigna kategori

Utviklarar hos NTB jobbar med å lage algoritmen som skal utføre omsetjingane. Med hjelp av over 40.000 artiklar som allereie finst på begge målformer, skal roboten lære kva som er god nynorsk. Målet er å gjere journalistikken meir tilgjengeleg på nynorsk.

Kevin Brubeck Unhammer er språkteknolog og programmerar, og har vore med på å utvikle omsetjarmotoren Apertium. Der er det blant fleire språk mogleg å omsetje frå bokmål til nynorsk.

– Er det noko informasjon eller nokre nyansar i språket som kan forsvinne på vegen, når ein omset via ei programvare?

Kevin Brubeck Unhammer er språkteknolog og programmerar. Foto: Privat

– Det er det absolutt. Bokmål og nynorsk er jo språk som er av dei enklare å omsetje, stort sett. Men dersom ei setning er tung for menneske å lesa, så er ho vanlegvis endå verre for ei maskin å omsetja, forklarer Unhammer.

Les også: Lovar digitale læremiddel på nynorsk

Han fortel at det generelt er store utfordringar når det gjeld omsetjing via digitale verktøy, men meiner at nyheiter er ein språkkategori som eignar seg godt til dette.

– Det er noko som burde vere mogleg å gjere med god nok kvalitet til at ein sparer tid. Så eg trur det er eit prosjekt som absolutt burde kunne fungere bra, seier Unhammer.

Utfordrande med mange substantiv

Ofte er det lange setningar med mange substantiv som kan vere problematiske å omsetje digitalt. Setningar der ein må omformulere heile setninga for å få godt språk, er òg utfordrande for ei maskin.

Unheim gir to døme på utfordrande setningar:

«En av våre beste vitenskapsmenns store oppdagelse», vart i ein test omsett til:

«Ein av den store oppdaginga til dei beste vitskapsmennene våre».

«Dersom vi skal forstå menneskene som levde i det 17. århundrets utfordringer», vart i testen omsett til:

«Dersom vi skal forstå menneska som levde i utfordringane i det 17. århundret».

Unhammer forklarer at omsetjingsverktøyet her har tolka feil «eigar» i genitivsfrasane. Men han har sett få slike tilfelle i setningsbygginga hos NTB.

Les også: Snart får du omsetjing frå nynorsk til svensk

Treng fortsatt vanleg intelligens og sunn fornuft

Unhammer er klar på at det alltid bør vere ein person som ser over teksten til slutt.

– Men forhåpentleg er den digitale omsetjinga bra nok til at ein sparar tid på å gjere nokre små rettingar på det systemet, heller enn å gjere alt frå botnen av, trur språkteknologen.

Karoline Riise Kristiansen i Nynorsk pressekontor er einig i at det framleis vil vere behov for «naturleg» intelligens.

– Uansett kor smarte maskinane kan vere, så treng vi fortsatt menneskeleg kunnskap og sunn fornuft, seier ho.

Ho har stor tru på prosjektet, og ser for seg ei framtid der det kan gå ti gonger så raskt som i dag å få omsett tekstar frå bokmål til nynorsk.

– Målet er at nynorsk skal vere heilt naturleg

Redaktøren i NPK trur at ein robot vil føre til at nynorsk blir lettare å bruke i media og at målforma blir meir akseptert.

– Dess meir nynorsk som er tilgjengeleg i media, dess lettare og meir attraktivt blir det å bruke han. Målet at det ikkje skal bli stilt spørsmål ved nynorsken, men at det skal vere heilt naturleg, seier ho.

Utviklinga av roboten er eit satsingsområde for NPK i 2018 og 2019. Prosjektet har foreløpig ikkje ekstern finansiering, men NPK har søkt om utviklingsstøtte frå både Vinjefondet og statsbudsjettet 2019. Svaret på søknadane kjem i haust.

Les også: Strøymetenestene gløymer nynorsk