lørdag den 18. december 2004

Blinkx: Omsætter tale til tekst.
Det mest interessante ved Blinkx er ikke at den kan søge på multimedier. Det er der så mange andre søgemaskiner der kan. Og faktisk er dens database endnu ret indskrænket.
Det spændende er at den kan omsætte lyd, eller tale, til tekst. Og det ser ud til at fungere!
Som nævnt nedenfor i indslaget om Yahoo Video Search, så er multimediernes problem at de er svære at finde. De skal findes via søgeord/tekst. Og billeder og lyd er jo netop ikke tekst! Derfor er det også lidt af et tigerspring frem, hvis det virkelig nu skulle være muligt at omsætte tale til tekst. Og så lynhurtigt, således som det sker i Blinkx.
Som nævnt er Blinkx ikke særlig stor. Den indekserer 15 forskellige nyhedsstationer, fx Fox, CNN, BBC og Bloomberg, samt en håndfuld radiostationer (især BBC). Mig bekendt er netop BBC-journalister kendt for deres formfuldendte engelsk, så det er måske derfor netop de er valgt. Men venstremenuen lover andet, under Coming Soon: Biography, History Channel, National Geographic. Og fremtidens muligheder ligger i alle slags medier, også satellit, kabeltv og mediestrømme.
Ifølge den meget omfattende præsentation af Blinkx skulle den være i stand til ikke bare at genkende ord, men også hvem der taler og på hvilket sprog. Dansk er nok ikke med. Men foreløbig er det jo også kun engelsktalende tv- og radiostationer med. I præsentationen kan du også læse om hvordan selve det tekniske fungerer. Her vil jeg koncentrere mig om selv søgningerne.
Blinkx indekserer altså video og audio. Søgefeltet er meget stort, og det opfordrer til at bruge mange ord. Jeg afprøvede søgeordet Copenhagen, og der kom en pæn portion fund frem. Det er nu i første omfang ikke særligt lange klip man får. Omkring 30 sekunder. Det fleste af dem handlede om Tyrkiet, fordi speakerne nævnte begrebet Copenhagen Criteria om Tyrkiets forhold til EU. Dette viser i det mindste at omsætning fra tale til tekst rent faktisk fungerer!
Men hermed hører begejstringen dog op. Flere af linkene virkede slet ikke. Fx viser det sig at alle fundene fra Sky ikke kan ses uden for USA. Det var svært at bruge raffinere søgningen (Refine Search). Og det var meningsløst at bruge valget mellem at sortere efter relevans eller dato. Der var simpelthen for få fund. Muligvis ville man kunne finde hele videoen ved at anvende adressen i fundoversigten. Denne er i øvrigt noget skrabet. Men teksten var hvad speakerne sagde. Så den er go' nok!
Jeg nåede ikke til at bruge de obligatoriske personaliseringer. Men det skulle være muligt at lave sit eget video- eller audioarkiv ved at lave automatiske søgninger i Blinkx. Herefter ville eventuelle nye klip automatisk blive downloaded til mapper. Som man så ved lejlighed kunne checke. Dette kræver dog nok, som Blinkx reklamer antyder, at man har bredbånd. Multimediefiler er meget tunge og belaster nettet meget.
Disse sidste bemærkninger skal dog ikke fjerne min begejstring for at vi nu vist nok for første gang har set antydningen af en søgemaskine som kan omsætte tale og lyd til tekst. Det giver helt uanede muligheder for fremtidens søgninger!
Tilføjelse, søndag morgen.
En læser har bemærket at Blinkx absolut ikke er fejlfri: Når hun søger på Amish, får hun utilfredsstillende resultater, bl.a. på Army (!) samt en verjudsigt fra BBC. Så: desværre. Det var næsten også for godt til at være sandt.
Nu er det jo ikke min opgave at forsvare Blinkx, men måske er det derfor at de anbefaler at skrive mindst tre ord i søgefeltet. Dette ville muligvis gøre søgningen mere præcis. Men omvendt: når jeg prøver at gøre det, er resultatet som regel "Sorry, no results". En søgning på amish society gør heller ikke søgningen mere præcis. Man kan håbe på at når databasen bliver tilstrækkelig stor, vil den begynde at give resultater når man skriver flere end 3 ord.
Forventningerne til omsætning tale-tekst må dog skrues betydeligt ned (Suk). Tak for kommentaren. (Jeg har ikke kunnet få Blogger til at vise kommentarer på andre måder end på enkeltposterne, så hvis du vil se kommentarerne, skal du klikke på de enkelte indslag, fx Blinx)
Link:
www.blinkx.tv

3 kommentarer:

lis sagde ...

Jeg er nu ikke enig i, at omsætningen fra lyd til tekst fungerer. Søg på Amish. Kun ét af resultaterne handler Amish (som kun kan betyde én ting), resten handler om alt muligt andet, f.eks. hæren (army) *G*
Mest vanvittig er 'BBC News 23:30 12/06/2004'. Videoclipet er en vejrudsigt og teksten er rent nonsens.

Erik Høy sagde ...

Du har desværre ret. Det var næsten også for godt til at være sandt. Forventningerne til omsætning tale-tekst må skrues betydeligt ned (Suk). Tak for kommentaren.

Erik Høy sagde ...

Nu er det jo ikke min opgave at forsvare Blinkx, men måske er det derfor at de anbefaler at skrive mindst tre ord i søgefeltet. Dette ville muligvis gøre søgningen mere præcis. Men omvendt: når jeg prøver at gøre det, er resultatet som regel "Sorry, no results". En søgning på amish society gør heller ikke søgningen mere præcis. Man kan håbe på at når databasen bliver tilstrækkelig stor, vil den begynde at give resultater når man skriver flere end 3 ord.