OpenAI が魅力的な AI 言語モデル GPT 4 を発表
公開: 2023-03-15OpenAI は常に見出しを飾っています。 OpenAI が魅力的な AI 言語モデル GPT 4 を発表する中、ChatGPT の作成者と、人工知能を使用してマシンや私たちの周りの世界とのやり取りを統合し、革命を起こそうとする彼らの試みは、すぐに減速する気配を見せません。
また読む: OpenAI Chatgpt 4でテキストをビデオに変換できます
すべての噂と憶測の後、Open AI は、人間レベルの機能を合理化し、画像やテキストの入力に応答する最新かつ最先端の AI 言語モデルをリリースしました。 この新しいラインナップは、Chat GPT や Bing への最新の追加などのアプリケーションに対応しています。
大規模なマルチモーダル モデルである GPT-4 を発表し、機能と整合性で過去最高の結果を達成しました: https://t.co/TwLFssyALF pic.twitter.com/lYWwPjZbSg
— OpenAI (@OpenAI) 2023 年 3 月 14 日
「私たちは、ディープ ラーニングのスケールアップにおける OpenAI の取り組みにおける最新のマイルストーンである GPT-4 を作成しました。 GPT-4 は大規模なマルチモーダル モデル (画像とテキストの入力を受け入れ、テキスト出力を発行する) であり、多くの現実世界のシナリオでは人間よりも能力が劣りますが、さまざまな専門的および学術的なベンチマークで人間レベルのパフォーマンスを示します」と発表ブログを読む役職。
開発者が主張するように、この独創的なモデルはより機能的で容量性があり、以前よりも正確です。 OpenAI は、内部の敵対的テスト プログラムと ChatGPT からの教訓を使用して GPT 4 を「反復的に調整」するのに 6 か月を費やし、その結果、優れたモデルの前例のない安定したバージョンが得られたと述べて、進歩を拡大するための取り組みについて述べました。
「私たちは、敵対的テスト プログラムと ChatGPT からの教訓を使用して GPT-4 を繰り返し調整することに 6 か月を費やしました。その結果、事実性、操縦可能性、およびガードレールの外に出ることを拒否することに関して、これまでで最高の結果が得られました (完全にはほど遠いですが)。 」
OpenAI は Microsoft と協力し、スーパー コンピューターを地上から Azure クラウドまで開発して GPT 4 をトレーニングしました。さらに、OpenAI は多くの企業と提携して GPT 4 を製品に統合することを明らかにしました。その一部には Duolingo が含まれます。ストライプ、カーン アカデミー。
ChatGPTのGPT 3.5と比較して、GPT 4はどこが際立っていますか?
1. GPT 4 は画像を見て理解する:これは、言語モデルに対する最も予想され、話題になっている変更です。 これは OpenAI が Be My Eyes と提携したおかげです。 「マルチモーダル」学習システムであるため、複数の形式の情報を理解します。 このように、前任者と同じようにテキストに対応することに加えて、今年は飛躍を遂げ、画像も処理します。 食材の写真を見ただけでレシピを紹介したり、写真を見ながら機械の正しい使い方を説明したり。 ただし、テキストでのみ応答します。
2.だまされにくい: 「ガードレールの外に出るのを拒否する」、これが OpenAI が GPT 4 に対して主張していることです。 GPT 3.5 と比較して、あらゆる形式の微妙な命令を処理できます。 これは、過去 2 年間に人々から OpenAI に提供されたデータを使用して、多くの悪意のあるプロンプトでトレーニングされています。
3.より長いメモリ: GPT 4 の言語モデルは、Web ページ、書籍、およびその他のテキスト データの実質的な学習スタックでトレーニングされています。 モデルのアカデミック ベンチマークは、下位 10% で得点した GPT 3.5 と比較して、シミュレートされた司法試験の受験者の上位 10% で得点したため、パフォーマンスの大幅な改善をもたらします。 さらに、節約を念頭に置いた場合、制限はGPT 3.5よりも比較的重要です. 前者は 4096 トークン (ほぼ 8000 語または本の 4 ~ 5 ページ) の制限がありましたが、最新のものは約 64000 語または 50 ページのテキストを翻訳します。
4.多言語効率: GPT 4 の Massive Multitask Language Understanding ベンチマークは、26 の言語でほぼ 57 の科目をカバーする 14,000 の多肢選択問題のスイートで構成されていました。 このモデルは、GPT 3.5 英語のパフォーマンスに対して、イタリア語、ラトビア語、韓国語、ネパール語、ウルドゥー語など、26 言語のうち 24 言語で優れたパフォーマンスを発揮しました。
5.行動属性:オープン AI は、GPT 4 の操縦性の側面に取り組んだと主張しています。 これにより、現実と同調する機械の役割がさらに強化され、しばしば温かい仲間として、時には悪魔の支配者として行動します。 AI のスタイル、冗長性、トーン、およびタスクは、GPT 3.5 よりもネイティブな方法でユーザーが規定できるようになりました。 さらに、API ユーザーは、ユーザーのエクスペリエンスに合わせてカスタマイズすることもできますが、範囲内です。
GPT 4 は、ChatGPT Plus への月額 20 ドルのサブスクリプションを介して OpenAI のプレミアム ユーザーに開放されています。また、現在待機リストにサインアップできる開発者向けの API 形式でも提供されています。 価格に関する限り、1000 の「プロンプト」トークン (約 750 ワード) あたり 0.03 ドル、1000 の「完了」トークン (約 750 ワード) あたり 0.006 ドルです。 トークンは未加工のテキストを表し、プロンプト トークンはモデルに提供される単語の一部であり、完了トークンは生成されたコンテンツです。
最終的には、議論する必要があることがたくさんあり、開発者は GPT 4 の制限とリスクについても考慮してきました。 GPT 4はGPT 3.5と比較して幻覚を減らしますが、モデルは完全に信頼できるわけではありません. それらは事実を幻覚させ、エラーを生成する可能性があるため、使用する際には注意が必要です. さらに、選択、フィルタリング、評価の実施、および監視に関する厳密なトレーニングを行った後でも、有害なアドバイスや誤った情報が生成される可能性があります。
推奨:サイバー セキュリティにおける人工知能の役割とは?
より高度な機械学習技術とその実生活への応用に向けてゆっくりと歩調を合わせている今、望ましくない結果に裏打ちされたより良い出力が常に存在するため、物事を良心的に受け止める必要があります. そうは言っても、OpenAI が魅力的な AI 言語モデル GPT 4 を発表したとき、私たちはそれがイノベーションの形でどこにつながるかを目の当たりにすることを強く求められています. 下のコメント欄であなたの考えを教えてください。
出典:オープン AI ブログ