LLM はジェネレーティブ エージェントで AI に革命を起こす: WestWorld のようなシミュレーションの夜明け
Published on
人工知能が進歩し続けるにつれて、スタンフォード大学の研究者は生成エージェント、つまり人間の行動を信頼できる方法でシミュレートできる計算ソフトウェア エージェントを開発しました。 これらのエージェントは、さまざまなアクションを実行したり、相互にやり取りしたり、独自のパーソナリティを示したりすることさえできます。 この記事では、生成エージェントの内部の仕組み、潜在的なアプリケーション、およびこの革新的なテクノロジーの将来について説明します。
ジェネレーティブ エージェントで何が起こっているのか?
ジェネレーティブ エージェントは、エージェントの経験を自然言語でキャプチャして処理することにより、LLM の機能を拡張する最先端のアーキテクチャを採用しています。 この革新的なアプローチは、次の 3 つの主要コンポーネントで構成されています。
-
メモリー ストリーム: 経験の記録 メモリ ストリームはエージェント アーキテクチャの基盤として機能し、将来の参照のためにエージェントのエクスペリエンスを細心の注意を払って記録します。
-
リフレクション: より高度な推論の導出 リフレクション コンポーネントは、記録されたエクスペリエンスを取得し、それらをより洗練された推論に統合して、エージェントが時間の経過とともに学習および適応できるようにします。
-
計画: 洞察を行動に移す プランニング コンポーネントは、豊富な高レベルの推論を自由に使用して、これらの洞察を実行可能な計画に変換し、エージェントが環境に動的に対応できるようにします。
現実とシミュレーションの境界線を曖昧にする: サンドボックス環境
ジェネレーティブ エージェントの機能を紹介するために、研究者は人気ゲームのザ・シムズを連想させるインタラクティブなサンドボックス環境を作成しました。 この環境には、それぞれ独自の性格、好み、スキル、および目標を持つ 25 のエージェントが収容されています。 ユーザーは、自然言語を使用してこれらのエージェントと対話し、コマンドを与えたり、アクティビティに参加したりできます。 環境は動的に進化し、エージェントが互いに影響を与え合い、周囲に影響を与え、人間の行動の豊かで没入型のシミュレーションを提供します。
サンドボックス環境のエージェントは、それぞれ独自のストーリーと個性を備えた個人的および社会的行動を示します。 たとえば、画家志望のアリスは、自由時間を使ってスキルを磨き、作家のボブに感銘を与えようとしています。 フィットネス愛好家のチャーリーは、ジムで別のトレーナーであるデイブと競争し、ジャーナリストのイブはさまざまなトピックを調査し、写真家の友人であるフランクと協力します。 これらは、サンドボックス環境のジェネレーティブ エージェント間で発生する可能性のある無数の相互作用のほんの一例です。
アーキテクチャの基礎: ジェネレーティブ エージェントが現実的な動作を生成する方法
生成エージェントは、GPT-3 や BERT などの大規模言語モデル (LLM) を拡張するアーキテクチャを使用して、エージェントの経験の完全な記録を自然言語で保存します。 このアーキテクチャは、観察、計画、反映という 3 つの主要コンポーネントで構成されています。 これらのコンポーネントが連携することで、生成エージェントは、その性格、好み、スキル、および目標を反映した現実的で一貫した動作を生成できます。 さらに、このアーキテクチャにより、ユーザー、エージェント、および他のエージェント間の自然言語通信が可能になります。
信憑性の評価: ジェネレーティブ エージェントと人間のアクターを比較する方法
研究者は、人間の俳優、スクリプト化されたエージェント、およびランダムエージェントと比較して、生成エージェントの信憑性を評価するための評価研究を実施しました。 参加者は、一貫性、一貫性、性格、感情などについてエージェントを評価しました。結果は、生成エージェントが、信憑性のすべての面で、スクリプト化されたランダムエージェントよりも優れていることを示しました。 彼らはまた、一貫性と一貫性において人間の俳優を上回りましたが、個性、感情、および社会性には及ばなかった. これらの欠点は、言語モデルの制限と、シミュレーションに言語以外の手がかりがないことに起因していました。
生成エージェントのアプリケーションと将来の展望を探る
生成エージェントは、さまざまな領域で大きな可能性を秘めています。 エンターテインメントでは、没入型の仮想世界やインタラクティブなストーリーを作成できます。 教育への応用には、社会的スキルの教育や文化的認識の促進が含まれます。 さらに、生成エージェントは、人間の行動の研究や仮説の検証などの研究目的で使用できます。
ただし、生成エージェントには制限がないわけではありません。 言語モデルやシミュレーション環境の制約により、エラーや矛盾が生じる場合があります。 プライバシー、同意、責任などの倫理的および社会的問題も考慮する必要があります。
結論: ジェネレーティブ エージェントによる AI の進化
結論として、ジェネレーティブ agents は、人工知能の研究開発の有望な分野です。 大規模な言語モデルを対話型エージェントとマージすることにより、この作業では、人間の行動の現実的なシミュレーションを可能にするアーキテクチャおよび対話パターンが導入されます。 この技術が進化し続けるにつれて、さまざまな分野における生成エージェントの潜在的なアプリケーションと将来の影響は間違いなく計り知れません。
引用: