記事が ChatGPT によって書かれたかどうかを確認する方法

公開: 2023-05-14

ChatGPT で書かれた記事は、その単純で反復的な構造と、論理的および事実上の誤りを犯す傾向によってわかります。 AI によって生成されたテキストを自動的に検出するツールもいくつかありますが、誤検知が発生する傾向があります。

AI テクノロジーは、私たちがオンラインで見るもの、そして世界との関わり方を変えています。フグコートを着たローマ法王のミッドジャーニーの写真から、ChatGPT のような言語学習モデルに至るまで、人工知能は私たちの生活に浸透しつつあります。

偽記事を大々的に流す政治的偽情報キャンペーンなど、AI テクノロジーのより邪悪な用途には、偽記事を見分けるための十分な教育が必要であることを意味します。では、記事が実際に AI によって生成されたテキストであるかどうかをどうやって判断できるのでしょうか?

ChatGPT がその記事を書いたかどうかを確認する方法

現在、あなたが読んでいる記事がロボットによって書かれたものであるかどうかを判断するのに役立つ複数の方法とツールが存在します。それらすべてが 100% 信頼できるわけではなく、誤検知が発生する可能性もありますが、出発点としては役立ちます。

少なくとも現時点では、人間が書いたテキストの大きな指標の 1 つはランダム性です。人々はさまざまなスタイルやスラングを使用して文章を書き、タイプミスをすることがよくありますが、AI 言語モデルがそのような間違いを犯すことはほとんどありません。 MIT Technology Review によると、「人間が書いたテキストはタイプミスが多く、信じられないほど変わりやすい」のに対し、ChatGPT のような AI 生成のテキストモデルはタイプミスのないテキストを作成する点ではるかに優れています。もちろん、優れたコピーエディタでも同様の効果が得られるため、スペルが正しいだけではないことに注意する必要があります。

もう 1 つの指標は句読点パターンです。人間は AI モデルよりもランダムに句読点を使用します。また、AI が生成したテキストには、通常、めったに使用されない大きな単語ではなく、「the」、「it」、または「is」などの接続単語が多く含まれています。これは、大規模な言語モデルが、次にどの単語が来る可能性が最も高いかを予測することによって機能するためであり、考え出すことはできません。人間がそうするのと同じように良い音になるもの。

これは、OpenAI の Web サイトにある株式質問の 1 つに対する ChatGPT の回答に見られます。「量子コンピューティングを簡単な言葉で説明できますか」と尋ねると、次のような文章が返されます。「量子ビットが特別なのは、重ね合わせと呼ばれる特性のおかげで、量子ビットが同時に複数の状態に存在できることです。それは量子ビットが同時に 0 と 1 の両方になることができるようなものです。」

チャット GPT が「量子コンピューティングを簡単に説明できますか?」という質問に答えます。

短くて単純な接続語が定期的に使用され、文はすべて同様の長さで、段落はすべて同様の構造に従います。最終的には、少しロボットのように聞こえる、感じられる文章が作成されます。

AI を使用して AI によって生成されたテキストを検出できますか?

大規模な言語モデル自体をトレーニングして、AI が生成した文章を特定することができます。 2 つのテキストセット (1 つは AI によって書かれ、もう 1 つは人間によって書かれたもの) でシステムをトレーニングすると、理論的には、ChatGPT のような AI の書き込みを認識して検出するようにモデルに学習させることができます。

研究者たちは、AI の記事やテキストを検出するための透かし入れ方法にも取り組んでいます。メリーランド大学でコンピューターサイエンスを教えているトムゴールドスタイン氏は、たとえ人間のランダム性を模倣するのに十分であるとしても、機械が生成した書き込みの検出に役立つことを期待して、AI 言語モデルにウォーターマークを組み込む方法に取り組んでいます。

肉眼では見えない透かしはアルゴリズムによって検出可能であり、透かしルールを順守した頻度または違反した頻度に応じて、それが人間によるものであるか、AI によって生成されたものであるかを示します。残念ながら、この方法は ChatGPT の以降のモデルでは十分にテストされていません。

記事がChatGPTによって書かれたかどうかを確認するツール

記事が AI によって生成されたものであるかどうかを確認するのに役立つ、オンラインで複数のコピーアンドペーストツールを見つけることができます。その多くは、ChatGPT-4 自体を含め、言語モデルを使用してテキストをスキャンします。

たとえば、Undetectable AI は、AI が人間の文章と見分けがつかないようにするツールとして自らを売り込んでいます。テキストをコピーしてウィンドウに貼り付けると、プログラムはそれを GPTZero などの他の AI 検出ツールの結果と照合して、尤度スコアを割り当てます。基本的に、他の 8 つの AI 検出器があなたのテキストがロボットによって書かれたと考えるかどうかをチェックします。

オリジナリティは、大手出版社やコンテンツ制作者向けのもう 1 つのツールです。市場の他の製品よりも正確であると主張しており、ChatGPT-4 を使用して AI によって書かれたテキストの検出を支援します。その他の一般的なチェックツールには次のものがあります。

GPTゼロ
コピーリーク
ライター

これらのツールのほとんどは、テキストが人間によって書かれた可能性がどの程度あるかを判断するために、96% が人間、4% が AI などのパーセンテージ値を提供します。スコアが 40 ～ 50% AI 以上の場合、その作品は AI によって生成された可能性があります。

開発者は、AI が生成したテキストの検出を改善するためにこれらのツールの開発に取り組んでいますが、どのツールも完全に正確ではなく、人間のコンテンツに AI が生成したものとして誤ってフラグを立てる可能性があります。 GPT-4 のような大規模な言語モデルが急速に改善されているため、検出モデルが常に追いつき続けているという懸念もあります。

AIをキャッチするために脳を訓練する

ツールを使用するだけでなく、AI が生成したコンテンツをキャッチできるように自分自身をトレーニングすることもできます。練習が必要ですが、時間の経過とともに上達することができます。

Google の AI 部門 Google Brain の上級研究員である Daphne Ippolito 氏は、Real Or Fake Text (ROFT) というゲームを作成しました。このゲームは、文が正しく見えない場合に気づくように徐々に訓練することで、人間の文とロボットの文を区別するのに役立ちます。。

イッポリト氏によると、AI テキストの一般的な指標の 1 つは、「一杯のコーヒーを作るのに 2 時間かかります」のような無意味な発言です。 Ippolito のゲームは主に、人々がそのような種類のエラーを検出できるようにすることに重点を置いています。実際、AI が不正確な事実を完全な自信を持って記述したプログラムの例が複数あります。AI は数値計算をあまりうまく処理できないように見えるため、数学の課題を AI に依頼するべきではありません。

現時点では、これらが AI プログラムによって書かれたテキストを検出するための最良の検出方法です。しかし、MIT Technology Review で Melissa Heikkila 氏が書いているように、言語モデルは急速に改良されており、現在の検出方法はあっという間に時代遅れになってしまい、軍拡競争に取り残されています。

関連: Bing AI Chat を使用して ChatGPT をファクトチェックする方法