Los chatbots de inteligencia artificial, como ChatGPT, Claude, Gemini, Mistral, Copilot y Llama 3.1, han sido desarrollados por empresas que han invertido enormes recursos en su entrenamiento. Sin embargo, estos modelos a menudo cometen errores en tareas matemáticas básicas y otras cuestiones. Por ejemplo, ChatGPT y Claude fallan al comparar los números 9,11 y 9,9, mientras que Gemini, Mistral, Copilot y Llama 3.1 responden correctamente.
Estos errores no son exclusivos de las matemáticas. Se estima que aproximadamente la mitad de las respuestas de ChatGPT relacionadas con programación son incorrectas. Los desarrolladores de estos modelos advierten que sus respuestas pueden ser erróneas, ya que se basan en patrones probabilísticos y no en un entendimiento real.
OpenAI ha lanzado SearchGPT, un buscador basado en IA que incluye atribución y enlaces a las fuentes originales. Aunque es un prototipo, su éxito dependerá de su capacidad para ofrecer respuestas precisas y fiables. Google también ha intentado integrar IA en su buscador, pero ha enfrentado problemas de precisión.
La fiabilidad de los chatbots de IA y su capacidad para superar a los buscadores tradicionales sigue siendo un desafío. Los modelos de IA generativa consumen mucha energía y recursos, y deben demostrar ser significativamente mejores para justificar su uso.
Imagen: Xataka con Bing Image Creator