På talefot med talegjenkjenning?

Posted on 21. oktober 2011

3



En ny måte å samhandle med datamaskinen står i døra. Ikke før har vi lært oss berøring på skjermen, så detter talegjenkjenning i hodet på oss med lanseringen av Siri. Det er Nuance som står for talegjenkjenningen. Jeg har testet Nuance app-en Dragon for å lese inn tekst på iPhone. Det fungerer på samme måte på iPod touch og iPad. App-en er gratis og er også tilgjengelig for Android. Norsk tilpasning kom i slutten av september, men det er ikke helt rett fram enda. Heldigvis har Dragon noen triks under panseret og jeg viser noen av dem her.

I forrige artikkel om Siri skrev jeg om forskjellen mellom talegjenkjennelse og taleforståelse. Det første må oppnås før det neste, Siri har begge disse komponentene. Talegjenkjenning som tar høyde for norsk språk, er i seg selv svært krevende. Mange husker konkursen til Norsk Språkteknologi på Voss i 2005. De brukte opp langt over 100 millioner over noen år, og klarte ikke kommersialisere og ferdigstille teknologien for markedet. Nuance har brukt et par milliarder på sin teknologi, og de har heldigvis klart det. De har portet sin teknologi til land etter land, og skandinaviske språk er endelig del av satsingen.

Tale til tekst

Jeg leser inn korte sekvenser, sjeldent mer enn en setning av gangen foreløpig. Nå er ikke jeg blant de raskeste i hodet, så jeg drar fordel av at temaet modnes mens jeg arbeider sekvensielt. Dragon kan brukes i standardmodus og tastaturmodus. Begge deler er nyttige for å redigere og viderebehandle teksten som tales inn. Du må påregne litt bearbeiding da Dragon stadig bommer litt. Jeg merker stor forskjell på om det er stille når jeg leser inn, eller om det er støy rundt meg. Stille er bedre.

Muntlige kommandoer

Her er noen fine talekommandoer jeg har funnet som lager tegn. Ved å tale inn disse slipper jeg å redigere inn de samme tegnene i tastaturmodus.

puntum .

spørsmålstegn ?

utropstegn !

Ny paragraf – Lager mellomrom og ny linje

Ny linje – Hopper til neste lenje

apostrof ‘

Sletting og redigering av tekst

I standardmodus sletter jeg raskt tekst umiddelbart etter innlesing. Jeg holder fingeren over aktuelle tilstøteende ord jeg vil fjerne, deretter sveiper jeg over aktuelle ord som da dekkes av sammenhengende blå farge. Slik kan jeg slette mange ord svært raskt.

I tastaturmodus kan jeg gjøre ren tekstbehandling slik jeg er vant til på en smarttelefon. Det er bra at Dragon har denne egenskapen. Det gjør at det er mye enklere å ferdigstille tekst før jeg kopierer og/eller videresender den.

Kopiering og videresending av tekst

Dersom jeg velger å kopierer tekst til utklippstavla kan jeg lime den inn i en hvilken som helst app. Jeg har allerede lest inn mange avsnitt på de siste blogginnleggene på denne måten via WordPress app-en. Plutselig kan jeg lage mye tekst bare med iPhone i hånda. Det gir perspektiver… Tenk på barn og voksne med lese- og skrivevansker. Hvordan vil ikke dette muliggjøre skriftlig kommunikasjon?

Avslutningsvis

Vi står som nevnt overfor en ny måte å samhandle med datamaskinene. Forstå at også smarttelefoner og iPod touch er datamaskiner. Framtidens grensesnitt er ankommet, og vi ser foreløpig ikke betydningen fullt ut. Det grafiske grensesnittet var kanskje en nesten like stor revolusjon som det vi står overfor nå. Den teknologien har vært her i snart 30 år. Tenk når taleteknologien har vært her i 30 år.

Andre artikler:

Siri revolusjonen
Siri portes til iPhone 4 og iPad 2
iPod Touch som digitalt verktøy
.

Advertisements
Posted in: iPad i skolen