Les grands modèles de langue : une réussite éblouissante au test de Turing

ConseilNewsPerformance

Performance linguistique au défi Turing

L’étude évalue quatre systèmes d’IA dans un test de Turing à trois volets, révélant que GPT-4.5-Persona et LLaMa-Persona sont suffisamment convaincants pour être pris pour des humains. L’analyse souligne l’importance des invites personnalisées et les implications potentielles sur l’automatisation des fonctions humaines.

Points clés

  • Quatre systèmes d’IA évalués : GPT-4.5, LLaMa-3.1, GPT-4o et ELIZA.
  • Tests menés via deux études sur des populations d’étudiants UC San Diego et de participants Prolific.
  • GPT-4.5-Persona a été perçu comme humain dans 73 % des cas.
  • LLaMa-Persona a atteint un taux de réussite de 56 %, alors que les versions sans persona ont échoué.
  • Les modèles de base, GPT-4o-NO-PERSONA et ELIZA, ont obtenu des taux de réussite inférieurs à 25 %.
  • Chaque jeu comportait 8 tours de conversations de 5 minutes.
  • Importance des invites “Persona” pour améliorer l’illusion d’humanité.
  • L’étude explore les stratégies de conversation des interrogateurs pour déceler l’authenticité.

À retenir

Si vous pensiez que les chatbots ne pouvaient pas se faire passer pour des humains, détrompez-vous : il semble que l’IA ait trouvé la recette secrète, surtout avec un petit plus de “persona”. Le conseil pour les novices ? Ne soyez pas trop surpris si, un jour, votre interlocuteur virtuel vous convainc mieux que votre meilleur ami, mais gardez quand même un œil critique… et un zeste d’humour !

Sources

Quiz sur le document: 10 questions

Loading