miércoles, 8 de mayo de 2013

'Aprendizaje profundo', la carta de Google para el futuro cercano

En julio del año pasado, Google sustituyó parte del sistema de su asistente de voz, Google Now, y logró recortar las tasas de error hasta en un 25%, superando, según muchos expertos, al Siri de Apple. En una entrevista concedida a Forbes, Jeff Dean, ingeniero de software de la compañía, ha explicado que la herramienta funciona utilizando una tecnología similar al cerebro humano. Aprende de sus errores y mejora con el tiempo. Algo que ha denominado
"aprendizaje profundo".

Esta tecnología intenta imitar la forma en la que el cerebro absorbe la información y aprende de ella. En concreto, Dean lo ha descrito como
"la manera que tienen las máquinas de dilucidar qué características son importantes para decidir, por ejemplo, si una imagen contiene un gato o no".
Respecto a este método empleado en el asistente de voz, Dean ha explicado que:
"si, por ejemplo, el sistema de Google cree que ha escuchado "voy a comerme un litchi" pero la última palabra está ligeramente distorsionada, puede confirmar su intuición basándose en experiencias de frases pronunciadas en el pasado".
Julián Beltrán, desarrollador y uno de los pocos españoles que ha podido probar las Google Glass,explicó  el funcionamiento de esta tecnología comparándola con el famoso reCAPTCHA, un código de seguridad a través del que las webs pueden discernir si un usuario es realmente un humano o un robot con intenciones de spam:
"En 2009, Google compró esta empresa para digitalizar todos los libros que forman Google Books. Cada vez que pasa a internet cualquier manuscrito, se encuentra con palabras mal escritas o distorsionadas que no son fáciles de reconocer. Si tuviera que hacerlo a mano tendría que gastarse mucho dinero, a través de este código de seguridad es mucho más fácil. Sin darnos cuenta, cada vez que introducimos este código estamos ayudando a digitalizarlos ya que son las mismas palabras que aparecen en esos libros. Es el mismo método que utiliza el aprendizaje profundo".
Un sistema que mejora con el paso del tiempo
"Por ejemplo, en el asistente de voz de Google, cuando el usuario pregunta "¿Qué tiempo va a hacer mañana?", si tras la respuesta vuelve a presionar el botón para preguntar, el sistema interpreta que no lo ha hecho bien y recurre a la otra opción que tenga más probabilidad de éxito. A base de ensayo y error, saca sus conclusiones y aprende para la próxima ocasión",
ha explicado Beltrán.
"Siri también lo utiliza, lo que sucede es que Google lleva ocho años trabajando en esta tecnología y le saca mucha ventaja",
ha añadido.

Esto significa que cuanto más tiempo pasa, más evoluciona el sistema. Algo que el gigante de internet ha implementado no solo en Google Now, sino también en otros servicios como su propio buscador.
"La revolución de Google consiste en que utiliza las búsquedas de los millones de usuarios para aprender de ellos. Usa esa información, la conserva. Parece que cada uno de nosotros busca cosas diferentes, pero en realidad las personas tenemos cosas en común”,
explicó al respecto Luis von Ahn, ex ingeniero de la compañía y creador del reCAPTCHA.
Pero no solo Google está utilizando esta tecnología. Además de Apple, Richard F. Rashid, de Microsoft, llevó a cabo una demostración el pasado mes de noviembre en la que demostró cómo, gracias a este avance, un programa era capaz de reconocer sus palabras y escribirlas simultáneamente en una pantalla. Más tarde, aquellas mismas palabras se fueron traduciendo a caracteres de chino mandarín, acompañadas por una simulación de su propia voz en ese idioma, que en realidad desconocía.
"Las Google Glass también utilizan esta tecnología. La ventaja en este caso es que eliminan todo el ruido de fondo, con lo que el asistente funciona mejor que en las tabletas y smartphones ya que recibe el sonido limpio", ha añadido Beltrán.

Jeff Dean, el super-ingeniero en la sombra
Detrás de la mejora de Google Now gracias a esta tecnología se encuentra Jeff Dean, un empleado de Google que ha logrado tantos avances que, sin quererlo, se ha convertido en toda una celebridad dentro y fuera de la tecnológica.
"El teclado de Jeff Dean solo tiene dos teclas: 1 y 0".
"Los compiladores no advierten a Jeff Dean. Jeff Dean advierte a los compiladores".
"Jeff Dean escribe directamente en binario. A continuación, escribe el código fuente como documentación para otros desarrolladores".
Estos son solo algunos ejemplos de lo que se puede leer en Jeff Dean Facts, una página creada por cientos de sus fans y compañeros de trabajo en honor (en tono humorístico), a sus logros en Google. Y sí, todos recuerdan a los chistes hechos con Chuck Norris. Pero, ¿quién es realmente este personaje?
Dean se unió a Google a mediados de 1999 y actualmente es miembro del Grupo de Sistemas de Infraestructura. Sus áreas de interés son los sistemas distribuidos a gran escala, la supervisión del rendimiento, recuperación de información, la aplicación de aprendizaje de máquina a la búsqueda o el desarrollo de nuevos productos que organizan la información existente de nuevas maneras, entre otras cosas. Desde que entró en la compañía ha participado en proyectos tan importantes como por ejemplo el desarrollo de AdSense, Protocol Buffers, aspectos de los algoritmos de ranking de búsqueda o el de Google Translate. También participó en la creación de la herramienta de programación del buscador MapReduce, el sistema de almacenamiento BigTable y Spanner.
Tan solo es necesario darse una vuelta por los medios estadounidenses especializados para apreciar la importancia que está adquiriendo su figura, y en parte gracias al desarrollo del aprendizaje profundo. Pero Google no se da por satisfecha. Solo un dato: además de seguir apostando por ingenieros de software como Dean, el pasado mes de marzo la tecnológica adquirió la compañía de soluciones de aprendizaje basado en máquina,DNNresearch.