El test de Turing hoy día es considerado como la prueba de fuego de la inteligencia artificial. Ideado y expuesto en 1950 por el científico matemático Alan Turing, la prueba pretende responder a la pregunta de si una maquina puede o no verdaderamente pensar como los humanos. La prueba en palabras simples consiste en colocar a un humano a chatear con una maquina, sin saber si de verdad lo hace con una maquina o una persona. Luego de 5 minutos de charla el juez debe decidir si la charla la sostuvo con un humano o con una maquina. El test de Turing se considera aprobado, si el computador es capaz de convencer a al menos 30% de los jueces con quien chatee.
El pasado 7 de Junio y conmemorando el 60 aniversario de la muerte de Turing, se realizaron las pruebas anuales, en las que programadores de todo el mundo someten a la famosa prueba de Turing sus programas para lograr el reconocimiento de la verdadera inteligencia artificial. Este año y por primera vez desde que se creó la famosa prueba, un programa de computadora fue capaz de pasarla convenciendo al 33% de los jurados de que se trataba de un humano.
Eugene Goostman
Se trata de Eugene Goostman, un chatbot o programa de computador diseñado para comportarse como un joven Ucraniano de 13 años de edad cuando se conversa con él. Sus creadores, un grupo de investigación ruso, lo diseñaron en 2001 y desde entonces lo han perfeccionado de a poco para superar la prueba de conversar por 5 minutos de la manera más natural posible. “Siento que he superado el test de Turing de forma sencilla. Nada original”, dijo el propio Goostman tras preguntarle cómo se sentía después de haber superado el reto.
Uno de sus programadores Vladimir Veselov, cuenta que uno de los objetivos que se propusieron al crear a Goostman era hacer que el pudiera decir que lo sabía todo, pero que su corta edad lo delatara como un joven que aún le falta mucho por aprender. Para lograr esto dotaron a Goostman de un picaresco sentido del humor, que convence a los jurados de que en realidad se trata de un muchacho de 13 años, cuando hablan con el por medio del chat. El chatbot combina técnicas del procesamiento del lenguaje, con concordancia de palabras clave y con acceso a bases de datos. El resultado es un agente de conversación inteligente que puede interaccionar con uno o más usuarios humanos a través de métodos auditivos o textuales.
Esta no es la única vez que Goostman se enfrenta al test de Turing, ya en los años 2001, 2005, 2008 y 2012 participo en el evento y estuvo muy cerca de lograrlo. En su intento en el 2012 convenció al 29% de los jurados, estando por debajo el 30% establecido por Turing hace 60 años como el valor mínimo para ser considerado humano, sin embargo fue el mejor puntaje obtenido ese año de los otros 5 participantes.
En esta pagina se puede leer una conversación que un científico matemático sostuvo hace poco con una versión online de Eugine, la maquina, logrando con gran facilidad desenmascarar a Goostman. Se supone que en este enlace se puede hablar con Goostman pero hasta la fecha de publicación de esta nota se encuentra caido el sitio, seguramente por la cantidad de personas que quiere probar suerte.
La lluvia de críticas
A pesar de notable logro del equipo desarrollador de Goostman, y del icónico hito de superar el famoso test de Turing, la comunidad científica está dividida en sus opiniones, entre los que celebran el alcance de este logro, y entre los que cuestionan la veracidad de los resultados obtenidos.
Entre los argumentos más fuertes esta el que dice el hecho de que una máquina consiga engañar a un humano sólo prueba que esa máquina es capaz de imitar la inteligencia, y no que en realidad la posea.
Otros consideran que los programadores de Eugene hicieron trama al test de Turing al asignar a su programa una edad concreta y “disfrazar” sus respuestas con una capa de humor que terminó por confundir a los examinadores. Lo cual desestima su verdadera inteligencia y lo coloca en la categoría de un programa que engaña a la persona con la que habla.
Finalmente Otros científicos ponen en duda incluso la validez del propio test de Turing después de 60 años y advierten de la necesidad de actualizarlo (con una prueba visual) o con una manera distinta y más rigurosa de certificar los avances de la inteligencia artificial. Al fin y al cabo, sostienen, no estamos ante la proeza de una supermáquina, sino ante la habilidad de un programa diseñado estrictamente para conversar, pero no para pensar.
El test de Turing
Expuesto en 1950 por el matematico Alan Turing en un artículo (Computing machinery and intelligence) para la revista Mind, y sigue siendo uno de los mejores métodos de prueba para los defensores de la inteligencia artificial. Se fundamenta en la hipótesis positivista de que, si una máquina se comporta en todos los aspectos como inteligente, entonces debe ser inteligente.
Básicamente la prueba consiste en un desafío en el cual la máquina debe hacerse pasar por humana en una conversación con un hombre a través de una comunicación de texto en modo chat. Al sujeto no se le avisa si está hablando con una máquina o una persona de modo que si el sujeto es incapaz de determinar si la otra parte de la comunicación es humana o máquina, entonces se considera que la máquina ha alcanzado un determinado nivel de madurez: es inteligente.
En 1990 se inició un concurso, el Premio Loebner, una competición de carácter anual entre programas de ordenador que sigue el estándar establecido en la prueba de Turing. Un juez humano se enfrenta a dos pantallas de ordenador, una de ellas que se encuentra bajo el control de un ordenador y la otra bajo el control de un humano. El juez plantea preguntas a las dos pantallas y recibe respuestas. El premio está dotado con 100.000 dólares estadounidenses para el programa que pase el test, y un premio de consolación para el mejor programa mensual.
La primera vez que un juez confundió a una máquina con un humano fue en el año 2010, cuando el robot Suzette, de Bruce Wilcox, superó la prueba. Una de las aplicaciones de la prueba de Turing es el control de spam o correo basura. Dado el gran volumen de correos electrónicos enviados, el spam es, por lo general, enviado automáticamente por una máquina. Así, la prueba de Turing puede usarse para distinguir si el correo electrónico era enviado por un remitente humano o por una máquina (por ejemplo, por la prueba Captcha).