Organizando la información del mundo, incluyendo Audio y Video

Posted: May 10th, 2009 | Author: | Filed under: Tecnología | Tags: , | No Comments »

gaudi-google-audio-indexingMuchos ya conocen la misión de Google: “organizar la información mundial para que resulte universalmente accesible y útil”. Sin duda es una misión mas que altruísta, y hay que reconocer que por lo menos intentan llevarla acabo, sobre todo si tenemos en cuenta algunos esfuerzos que hacen por organizar cosas que no estan online, como la digitalización de libros.

Hace un par de semanas me encontré con GAUDI, un producto del prolífico Google Labs, que aunque no es nada nuevo creo que tiene un gran potencial. GAUDI o Google Audio Indexing, es una tecnología que indexa un video en YouTube no sólo por su título o los tags que este pueda tener, sino por el contenido propiamente dicho. Utilizando software de reconocimiento de voz, GAUDI es capaz de reconocer todas las palabras pronunciadas en el video. Esto después es indexado por Google, permitiendo que se pueda buscar una palabra o una frase en particular de una manera refrescantemente innovadora. Cuando uno busca una palabra, aparece una lista de videos donde ésta se encuentra, y además en cada video están las frases escritas que contienen la palabra buscada, pudiendo adelantar con un click específicamente a la parte que estamos buscando.

Hay que reconocer que esta tecnología no es ninguna novedad, hace ya algunos años que existen softwares para que vos puedas dictar y que un procesador de texto tome nota, algo que parecía muy prometedor y útil, sobre todo para aquellos con discapacidades. La verdad es que nunca tuvo demasiado éxito porque la mayoría de la gente organiza mejor sus ideas escribiendo que dictando (además tenía un margen de error de 2-3%, que puede parecer bajo, pero si cada 100 palabras que dicto tengo que estar corrigiendolo 3 veces, en un documento de algunas hojas se vuelve un trabajo un poco tedioso). Google ahora usa esta tecnología mejorada de una manera muy útil, logrando que sus usuarios puedan encontrar lo que están buscando de una manera innovadora.google-audio-indexing-page

Google lanzó está tecnología hace más de un año durante las elecciones en US. YouTube fue un gran medio de discusión y difusión en las pasadas elecciónes, y Google aprovechó el tráfico para mostrar esta novedad. Además, creo yo, los políticos suelen hablar clara y pausadamente cuando dan un discurso o se dirigen a una audiencia. Esto permite al software de reconocimiento de voz lucirse al trabajar adecuadamente, con menos márgen de error y mostrando lo provechoso que puede ser buscar un video por su contenido.

Pero por qué Google no lanzó GAUDI para todos los videos de YouTube? Mejor aún, por qué no existe una plataforma nueva que indexe no sólo YouTube si no otros sitios de video, además del audio de la radio y televisión? Es un poco ambicioso, pero sin duda Google tiene las herramientas y el dinero para hacerlo. Además creo que el impacto de tal lanzamiento provocaría una revolución similar a la que provocó hace mas de 10 años la introducción de Google  al mundo de la internet. OK, exageré. Pero no me van a negar que el potencial de esto es grande, y su posible impacto más que considerable.

Imaginen lo rápido que sería buscar las opiniones de un par de políticos sobre un tema y contrastarlas. De esta manera un votante puede tomar una decisión más consciente a la hora de votar porque se puede informar en los temas que le conciernen, de una forma simple y rápida. O lo fácil que sería encontrar una determinada entrevista a un famoso  en la cual se toque un tema del que surgió un renovado interés. Sin duda a las figuras medianamente públicas se les  haría mucho mas difícil resistir al archivo, porque el archivo sería inmensamente más fácil de buscar y evaluar.

Puede que a la tecnología de reconocimiento de voz le falten algunos ajustes para volverse mainstream. Evidentemente, no debe ser fácil poder eliminar los ruidos de fondo y crear un algoritmo que pueda reconocer lo que alguien está diciendo, teniendo en cuenta la infindad de tipos de voces que existen, con sus distintos timbres y tonos. Pero han habido grandes adelantos y seguramente no pasará mucho tiempo hasta que logren resolver los problemas actuales. Cuando eso pase, Google va a tomar la delantera en otro nivel del negocio de internet, seguramente junto con un número de start-ups que van a usar esta tecnología con un twist creativo e inteligente.

Para seguir leyendo:
Blogtelopia – Gaudi, el audio indexing de Google
Genbeta – Google audio indexing


Te animás a comentar?