¿Cómo saber si un texto está escrito por IA?

La creciente presencia de la inteligencia artificial (IA) en la vida cotidiana, tanto personal como social y profesional, es un fenómeno evidente de cuya relevancia se ocupan, por ejemplo, muchos de los informes de tendencias para el nuevo año que por estas fechas ven la luz. La irrupción de esta tecnología conoció uno de sus capítulos más importantes y notorios el pasado mes de noviembre, cuando la compañía OpenAI puso a disposición del público una versión de prueba de su producto ChatGPT, chatbot de lenguaje conversacional que responde a cuestiones planteadas por el usuario y que se ha demostrado capaz de generar textos con un nivel de redacción e información muy notables y que los pueden hacer difíciles de distinguir de una redacción hecha por una persona.

 

Los textos que genera ChatGPT tienen un nivel de redacción que pueden hacerlos difíciles de distinguir de los escritos por un ser humano

 

Naturalmente, esto puede plantear un problema, particularmente en ámbitos académicos, o incluso en los periodísticos, en los que un profesor o un redactor jefe pueden tener dificultades para identificar si un texto ha asido elaborado por una herramienta dotada de inteligencia artificial o por un alumno o periodista.

 

Como en cierto modo cabía esperar, es la propia inteligencia artificial la que viene en auxilio de quienes se enfrenten a estos dilemas -que distan de ser irrelevantes-, tal y como explica la revista estadounidense Fast Company en un reportaje en el que presenta algunas de las herramientas que se han desarrollado para la detección de textos escritos por IA.

 

La propuesta de OpenAI

El primero que se reseña fue creado, justamente, por OpenAI, la misma compañía que ha generado gran parte del interés en torno al tema con su muy eficaz ChatGPT. Su producto de detección de textos “artificiales” se denomina GPT-2 Output Detector Model, se presentó en 2019 y permite, una versión demo accesible online, pegar un texto y obtener una respuesta acerca de la probabilidad de que haya sido escrito por un robot.

 

Según las pruebas llevadas a cabo por OpenAI, y de acuerdo con fuentes de la compañía, el sistema tiene una tasa de detección relativamente alta“pero necesita ser complementado con enfoques de metadata, criterio humano y educación pública para ser más efectivo”.

 

Un algoritmo de predicción

Poco después de que OpenAI lanzara su GPT-2, se dio a conocer GLTR (Giant Language Model Test Room). Se trata de un algoritmo desarrollado por expertos del MIT-IBM Watson AI Lab y del Natural Language Processing Group de la Universidad de Harvard que basa su sistema de detección de textos escritos por IA en la idea de que los semejantes se reconocen entre sí.

 

EL GLTR se basa en la idea básica de que los semejantes se reconocen entre sí

 

De este modo, si el algoritmo puede prever la siguiente palabra de una frase concreta, asumirá que ha sido escrita por una inteligencia artificial. El planteamiento básico complementario de los creadores de esta herramienta es que los humanos tenemos más tendencia que las máquinas a utilizar términos impredecibles en nuestros textos.

 

La idea de un estudiante

Otra herramienta es GPTZero, que ha presentado muy recientemente Edward Tian, estudiante de la Universidad de Princeton, y que se basa igualmente en la idea de impredecibilidad o aleatoriedad. Su algoritmo, según ha explicado Tian, mide tanto el grado de aletoriedad individual de las frases como el nivel conjunto de esta característica en textos completos para determinar si han sido escritos específicamente por ChatGPT.

 

Al parecer, desde que dio a conocer su producto el pasado 2 de enero, varias compañías de capital riesgo le han hecho propuestas de inversión en el desarrollo del mismo.

 

Otro método de detección de textos generados con IA en el que está trabajando OpenAI consiste en identificar todos los textos generados por su ChatGPT con algún tipo de señal oculta. Al parecer, y según adelantó Scott Aronson, un miembro de su equipo de investigación, en una reciente conferencia profesional, la compañía ya dispone de un prototipo de la herramienta.
“Básicamente”, dijo, “queremos que cada vez que ChatGPT genere un texto largo este contenga una señal secreta en su elección de palabras que permita demostrar que, en efecto, eso texto ha sido creado por GPT». La compañía sería la única con acceso a esa clave.

 

Además de las citadas, otras herramientas que afirman ayudar en la detección de textos creados por softwares dotados de inteligencia artificial son AI Content Detector, de una compañía llamada Crossplag, y otra denominada Unfluff.

Enlace a la fuente original