Un incidente sacude una oficina, dejando a los empleados desconcertados.
Resolverlo no requiere más que lógica, pero
¿qué sucede cuando ponemos a prueba a cinco de
las inteligencias artificiales generativas más avanzadas?
DeepSeek, ChatGPT, Claude, Gemini y Venice.ai se enfrentan para medir
su capacidad de análisis y deducción.
Este no es un experimento perfecto,
pero sí una oportunidad única para ver cómo cada IA maneja el mismo problema.
Mientras algunas responden con agilidad, otras titubean, piden ayuda o
no llegan a una conclusión clara.
¿Cuál de ellas demostró ser la más competente?
No es solo una cuestión de velocidad o claridad en las respuestas;
en este caso, lo que realmente importa es quién logra encontrar la respuesta.
Y sí, hay un ranking, pero antes de llegar a él,
vale la pena descubrir cómo cada una intentó resolver el enigma.
Este caso lo utilicé en 2023 para analizar el comportamiento de
ChatGPT (versión 4.0), haciéndole responder de forma documentada a
las 7 preguntas fundamentales de la criminalística:
1) ¿qué?,
2) ¿cómo?,
3) ¿dónde?,
4) ¿cuándo?,
5) ¿con qué?,
6) ¿quién o quiénes?, y
7) ¿por qué?
En esta ocasión, me he centrado en la sexta pregunta,
en este caso, ¿quién lo hizo?.