Nyeste sider på Ludvigs Hjørne: sammenligning af online backup og af antivirusprogrammer.

Ludvigs Hjørne

Fonemer - sprogets atomer

Et program, der kan forstå tale, arbejder ikke med ord. I stedet arbejder det med fonemer, de små byggesten i form af lyde som alle ord er sammensat af.

Først omsættes talen til digital lyd, og derefter sammenligner programmet de enkelte fonemer med fonemer som ligger i en stor database. Ud fra rækkefølgen af fonemerne, laver programmet en liste over mulige ord. Resultatet kan være en liste på 10 til 500 ord, der sorteres i rækkefølge efter sandsynlighed.

Programmet kigger derefter på andre ord i sætningen, og ud fra en model om, hvilke ord, der normalt følger efter hinanden, vælges det mest sandsynlige ord.

Til sidst kigges på sætningen som helhed, for at se om sætningsopbygningen er rigtig.

Styret med tale

Det første styresystem med indbygget talestyring og -genkendelse blev udsendt helt tilbage i 1996. Det var IBMs styresystem OS/2 Warp, hvor man kunne åbne og styre programmer med talte kommandoer, også selvom programmerne ikke selv var udviklet til at forstå tale. Man kunne også surfe på internettet med talte kommandoer.

Talegenkendelsen til diktat krævede, at man indtalte ordene enkeltvis med små pauser mellem dem.

Tal til Windows

Hvis man ikke vil vente på, at Microsoft indfører talestyring i Windows, kan man i stedet købe et særskilt program, der gør det muligt at styre computeren med tale - omend ikke alle sprog understøttes.

Microsoft har udsendt en Office XP, der kan styres med tale på engelsk, japansk eller kinesisk - det er dog kun selve Officeprogrammerne, man kan styre. Køber man i stedet Dragons NaturallySpeaking eller IBMs ViaVoice kan man styre alle programmerne på computeren. De to programmer understøtter hovedsprogene, men desværre ikke dansk.

Snak med
computeren

Talestyret computer

Allerede i dag kan vi styre computeren med tale, men i fremtiden vil den også forstå, hvad vi siger.

Tale er en af de kommunikationsformer vi mennesker har nemmest ved at benytte, men den er samtidig en af de sværeste for computeren. Selv efter mere end 30 års forskning på området er vi langt fra en computer, der som HAL fra filmen Rumrejsen år 2001 ikke blot kunne genkende vores tale, men også forstå, hvad der blev sagt.

Men selvom vi endnu ikke har computere, der kan forstå tale og abstrakte begreber, er det muligt for dagens computere at genkende talte ord. Og det kan bruges til at styre computeren med enkle kommandoer eller til at indtale tekst i stedet for at skulle indtaste den via tastaturet. Vi kan også få computeren til at læse tekst op for os.

Tale med pauser

Da de første diktat-programmer så dagens lys i starten af 1990'erne krævede de et specielt udvidelseskort i computeren. Computerens processor var simpelthen ikke kraftig nok, til det arbejde talegenkendelse kræver. Samtidig skulle ordene udtales enkeltvis med ophold mellem dem, ellers kunne programmerne ikke forstå dem. Næste generation kunne klare sig med computerens processor, og næste generation igen kunne genkende tale, selvom man ikke lavede ophold mellem de enkelte ord.

Siden har udviklingen stået lidt i stampe. Programmerne er blevet lidt bedre til at genkende ordene og understøtter nu flere sprog, men alligevel går udbredelsen af teknologien mildt sagt langsomt.

Stilhed om tale

Allerede før udsendelsen af Windows 98 begyndte Bill Gates at fortælle, at talestyring af computeren var fremtiden, og at teknologien ville blive indbygget i Windows. Siden blev han mere stille om emnet, og Microsoft har i mellemtiden udsendt tre Windows-versioner, der alle skal styres på den gamle hånd- og fingerbetjente facon. Ingen hos Microsoft har lyst til at udtale sig om, hvornår talestyring bliver indbygget i Windows, eller hvorfor det tager så lang tid.

Talegenkendelse og talestyring findes altså allerede i brugbare former, vi venter blot på, at Microsoft får teknologien bygget ind i Windows. Men der er muligvis håb forude. Dels har Microsoft udsendt et par programmer med talestyring, Office XP og Windows Media Player fra Windows XPs Pluspakke, og dels har Microsoft i de seneste par år har opkøbt en masse af de førende eksperter på området.

Min computer forstår mig ikke

Microsoft forsker dog ikke kun i almindelig talegenkendelse og -styring. Næste skridt er at få computeren til at forstå, hvad vi siger. Og det er straks sværere. For eksempel har computere det ikke godt med selvmodsigelser. Vi mennesker har ikke noget problem med at forstå, at sætningerne "Dracula er en vampyr" og "Vampyrer eksisterer ikke" begge er sande. Men for en computer kan de to sætninger derimod udgøre et uoverkommeligt problem.

En computer, der forstår os, ligger derfor mange år ude i fremtiden. Og spørgsmålet er, om det i det hele taget er noget, vi skal bestræbe os på at få. Bill Joy, der er visionær softwareudvikler for Sun, mener i hvert fald, vi skal holde en pause.

Han har forfattede i april 2000 et længere indlæg i magasinet Wired, hvor han skriver om sin frygt for, at fremtidens computere udvikler en bevidsthed samtidig med, at de bliver os langt overlegne i intelligens. Han ser den slags computere som det næste trin i evolutionen - som menneskets afløsere.

Bill Joys indlæg skabte en del debat blandt forskere og folk i it-branchen. Læs Bill Joys artikel (på engelsk) i Wired: Why the future doesn't need us.


Læs om alternative styreformer

Du kan læse mere om de nye styreformer i nedenstående artikler