“Adivinar” en lugar de decir “no lo sé”

OpenAI también señala que las alucinaciones persisten porque los actuales métodos de evaluación incentivan a los modelos a adivinar. Para ilustrarlo, compara la situación con un examen de opción múltiple: si un estudiante no sabe la respuesta pero arriesga, puede acertar; en cambio, dejar en blanco le garantiza un cero. Del mismo modo, los modelos se califican solo por la precisión de sus aciertos, lo que los motiva a arriesgar antes que reconocer la incertidumbre.