Comment savoir si un article a été écrit par ChatGPT

Publié: 2023-05-14

ChatGPT Plus — Hannah Stryker / Geek pratique

Vous pouvez reconnaître un article écrit par ChatGPT par sa structure simple et répétitive et sa tendance à faire des erreurs logiques et factuelles. Certains outils sont disponibles pour détecter automatiquement le texte généré par l'IA, mais ils sont sujets aux faux positifs.

La technologie de l'IA change ce que nous voyons en ligne et comment nous interagissons avec le monde. D'une photo de Midjourney du pape dans une doudoune à des modèles d'apprentissage des langues comme ChatGPT, l'intelligence artificielle fait son chemin dans nos vies.

Les utilisations les plus sinistres de la technologie de l'IA, comme une campagne de désinformation politique diffusant de faux articles, signifient que nous devons nous éduquer suffisamment pour repérer les contrefaçons. Alors, comment savoir si un article est réellement un texte généré par l'IA ?

Comment savoir si ChatGPT a écrit cet article

Plusieurs méthodes et outils existent actuellement pour aider à déterminer si l'article que vous lisez a été écrit par un robot. Tous ne sont pas fiables à 100 % et ils peuvent donner des faux positifs, mais ils offrent un point de départ.

Un grand marqueur du texte écrit par l'homme, du moins pour l'instant, est le caractère aléatoire. Alors que les gens écrivent en utilisant différents styles et argots et font souvent des fautes de frappe, les modèles de langage d'IA font très rarement ce genre d'erreurs. Selon MIT Technology Review, "le texte écrit par l'homme est truffé de fautes de frappe et est incroyablement variable", tandis que les modèles de texte générés par l'IA comme ChatGPT sont bien meilleurs pour créer du texte sans faute de frappe. Bien sûr, un bon éditeur de copie aura le même effet, vous devez donc faire attention à plus qu'une simple orthographe correcte.

Un autre indicateur est les modèles de ponctuation. Les humains utiliseront la ponctuation de manière plus aléatoire qu'un modèle d'IA. Le texte généré par l'IA contient également généralement plus de mots connecteurs comme "le", "il" ou "est" au lieu de mots plus grands plus rarement utilisés, car les grands modèles de langage fonctionnent en prédisant quel mot sera le plus susceptible de venir ensuite, sans proposer quelque chose qui sonnerait bien comme un être humain.

Ceci est visible dans la réponse de ChatGPT à l'une des questions de stock sur le site Web d'OpenAI. Lorsqu'on vous demande « Pouvez-vous expliquer l'informatique quantique en termes simples », vous obtenez des phrases comme : « Ce qui rend les qubits spéciaux, c'est qu'ils peuvent exister dans plusieurs états en même temps, grâce à une propriété appelée superposition. C'est comme si un qubit pouvait être à la fois un 0 et un 1 simultanément. ”

Chat GPT répondant à la question "Pouvez-vous expliquer l'informatique quantique en termes simples ?"

Des mots de liaison courts et simples sont régulièrement utilisés, les phrases ont toutes la même longueur et les paragraphes suivent tous une structure similaire. Le résultat final est une écriture qui sonne et se sent un peu robotique.

Pouvez-vous utiliser l'IA pour détecter le texte généré par l'IA ?

Les grands modèles de langage eux-mêmes peuvent être formés pour repérer l'écriture générée par l'IA. La formation du système sur deux ensembles de texte - l'un écrit par l'IA et l'autre écrit par des personnes - peut théoriquement apprendre au modèle à reconnaître et à détecter l'écriture de l'IA comme ChatGPT.

Les chercheurs travaillent également sur des méthodes de filigrane pour détecter les articles et le texte de l'IA. Tom Goldstein, qui enseigne l'informatique à l'Université du Maryland, travaille sur un moyen de créer des filigranes dans les modèles de langage d'IA dans l'espoir qu'il puisse aider à détecter l'écriture générée par la machine même si elle est assez bonne pour imiter le hasard humain.

Invisible à l'œil nu, le filigrane serait détectable par un algorithme, qui l'indiquerait comme généré par l'homme ou par l'IA en fonction de la fréquence à laquelle il a adhéré ou enfreint les règles de filigrane. Malheureusement, cette méthode n'a pas été aussi bien testée sur les derniers modèles de ChatGPT.

Outils pour vérifier si un article a été écrit par ChatGPT

Vous pouvez trouver plusieurs outils de copier-coller en ligne pour vous aider à vérifier si un article est généré par l'IA. Beaucoup d'entre eux utilisent des modèles de langage pour analyser le texte, y compris ChatGPT-4 lui-même.

L'IA indétectable, par exemple, se présente comme un outil permettant de rendre votre écriture IA indiscernable de celle d'un humain. Copiez et collez le texte dans sa fenêtre et le programme le compare aux résultats d'autres outils de détection d'IA comme GPTZero pour lui attribuer un score de probabilité - il vérifie essentiellement si huit autres détecteurs d'IA penseraient que votre texte a été écrit par un robot.

L'originalité est un autre outil, destiné aux grands éditeurs et aux producteurs de contenu. Il prétend être plus précis que d'autres sur le marché et utilise ChatGPT-4 pour aider à détecter le texte écrit par l'IA. Les autres outils de vérification populaires incluent :

GPTZéro
Fuites de copie
Écrivain

La plupart de ces outils vous donnent une valeur en pourcentage, comme 96 % humain et 4 % IA, pour déterminer la probabilité que le texte ait été écrit par un humain. Si le score est de 40 à 50 % d'IA ou plus, il est probable que la pièce ait été générée par l'IA.

Alors que les développeurs s'efforcent d'améliorer la détection du texte généré par l'IA, aucun d'entre eux n'est totalement précis et ne peut signaler à tort le contenu humain comme étant généré par l'IA. On craint également que, puisque les grands modèles de langage comme GPT-4 s'améliorent si rapidement, les modèles de détection rattrapent constamment leur retard.

Entraînez votre cerveau à attraper l'IA

En plus d'utiliser des outils, vous pouvez vous entraîner à capturer le contenu généré par l'IA. Cela demande de la pratique, mais avec le temps, vous pouvez vous améliorer.

Daphne Ippolito, chercheur principal à la division IA de Google, Google Brain, a créé un jeu appelé Real Or Fake Text (ROFT) qui peut vous aider à séparer les phrases humaines des robotiques en vous entraînant progressivement à remarquer quand une phrase ne semble pas tout à fait correcte. .

Un marqueur commun du texte de l'IA, selon Ippolito, est des déclarations absurdes comme "il faut deux heures pour faire une tasse de café". Le jeu d'Ippolito vise en grande partie à aider les gens à détecter ce genre d'erreurs. En fait, il y a eu plusieurs exemples d'un programme d'écriture d'IA énonçant des faits inexacts avec une confiance totale - vous ne devriez probablement pas non plus lui demander de faire votre devoir de mathématiques, car il ne semble pas très bien gérer les calculs numériques.

À l'heure actuelle, ce sont les meilleures méthodes de détection dont nous disposons pour capturer le texte écrit par un programme d'IA. Les modèles de langage s'améliorent à une vitesse qui rend les méthodes de détection actuelles obsolètes assez rapidement, nous laissant cependant, comme l'écrit Melissa Heikkila pour MIT Technology Review, dans une course aux armements.

CONNEXION: Comment vérifier les faits ChatGPT avec Bing AI Chat