La prueba de Turing consiste en un desafío en el que se sitúa a un juez en una habitación y a una máquina y un ser humano en otra. El juez debe descubrir cuál es el ser humano y cuál es la máquina, estándoles a los dos permitido mentir al contestar por escrito las preguntas que el juez les haga.
Desde que Turing propuso esta prueba en 1950 y, antes el continuo avance de los ordenadores, existe el consenso general de que todavía ninguna máquina ha sido capaz de superar esa prueba, aunque sin embargo ha habido numerosas ocasiones en las que un ordenador sí que ha sido capaz de hacerse pasar por un humano. Por ejemplo, uno de los primeros chatbots, el famoso Eliza, consiguió que varios usuarios le confundieran con un ser humano.
En estos momentos, la cuestión que debe plantearse tal vez no sea si una máquina es capaz de que un ser humano la tome por tal, sino ¿durante cuanto tiempo es capaz de hacerlo?

Imaginemos que un ser humano comienza a conversar con una máquina. Probablemente las primeras interacciones consistan en el habitual intercambio de saludos y, durante ese tiempo, realmente pueda atribuirse a la máquina un comportamiento humano. Sin embargo, a medida que la conversación avance, quedará patente que se trata de la máquina, tal vez porque no sepa responder adecuadamente a una pregunta, tal vez porque repita excesivamente una misma respuesta o por mil otros motivos.
Por tanto, podría crearse una calificación consistente en el menor número de interacciones de un humano necesita para descubrir si una máquina es un humano. Es decir, puede que haya máquinas que consigan mantener la ilusión durante una conversación más larga, pero si existe una conversación más corta que ofrece una evidencia justificable de que se trata de una máquina, ese sería el resultado de la calificación de Turing.
Esta calificación no solo aporta la ventaja de ofrecer un baremo que permita comparar las capacidades de conversación de las máquinas (una máquina con un Turing de 37 será mucho mejor que una con un Turing de 4) además de transmitir de una manera sencilla el progreso realizado en este campo, sino que brinda un excelente material para mejorar los sistemas. Es decir, si se descubre una conversación que en solo tres iteraciones es capaz de lograr que la máquina se ponga en evidencia, huelga decir que los programadores de las máquinas tendrán un excelente material de estudio para plantearse por qué ha fallado su sistema y los cambios que deberán realizar para que dicha conversación ya no surta su efecto en un futuro. Y, con el tiempo y si se cumplen las previsiones que nos hablan del próximo advenimiento de la inteligencia artificial fuerte, pronto tendremos máquinas con una calificación de Turing que tienda a infinito.