GPT4All-J-v1.0:日本語での包括的な記事
Published on
GPT4All-J-v1.0は、Nomic AIが開発した大規模なカリキュラムベースのアシスタント対話データセットを含む、Apache-2ライセンスのチャットボットです。本記事では、その概要と特徴について説明します。
📚
モデルの詳細
GPT4All-Jは、GPT-Jからファインチューニングされたモデルで、英語での対話を中心に設計されています。いくつかのバージョンがリリースされており、それぞれ異なるデータセットで学習されています。以下にその概要を示します。
- v1.0: 最初のモデルで、v1.0データセットで学習されています。
- v1.1-breezy: AI言語モデルのすべてのインスタンスを削除したデータセットで学習されています。
- v1.2-jazzy: 「I'm sorry, I can't answer...」やAI言語モデルのようなインスタンスを削除したデータセットで学習されています。
- v1.3-groovy: v1.2データセットにDollyとShareGPTを追加し、Atlasを使用して意味的な重複を含むv1.2のデータセットの約8%を削除して学習されています。
特定のリビジョンのモデルをダウンロードするには、以下のコードを実行します。
from transformers import AutoModelForCausalLM
model = AutoModelForCausalLM.from_pretrained("nomic-ai/gpt4all-j", revision="v1.2-jazzy")
リビジョンを指定せずにダウンロードすると、デフォルトでmain/v1.0が選択されます。
モデルのリソース
- リポジトリ: https://github.com/nomic-ai/gpt4all (opens in a new tab)
- ベースモデルリポジトリ: https://github.com/kingoflolz/mesh-transformer-jax (opens in a new tab)
- 論文(オプション): GPT4All-J: An Apache-2 Licensed Assistant-Style Chatbot
- デモ(オプション): https://gpt4all.io/ (opens in a new tab)
学習手順
GPT4Allは、提携コンピュートパートナーであるPaperspaceの協力により実現されています。8台のA100 80GB GPUを搭載したDGXクラスタで約12時間学習されています。DeepspeedとAccelerateを使用し、グローバル
モデル | BoolQ | PIQA | HellaSwag | WinoGrande | ARC-e | ARC-c | OBQA |
---|---|---|---|---|---|---|---|
GPT4All-J 6.7B v1.0 | 73.4 | 74.8 | 63.4 | 64.7 | 54.9 | 36.0 | 40.2 |
GPT4All-J v1.1-breezy | 74.0 | 75.1 | 63.2 | 63.6 | 55.4 | 34.9 | 38.4 |
GPT4All-J v1.2-jazzy | 74.8 | 74.9 | 63.6 | 63.8 | 56.6 | 35.3 | 41.0 |
GPT4All-J v1.3-groovy | 73.6 | 74.3 | 63.8 | 63.5 | 57.7 | 35.0 | 38.8 |
GPT4All-J Lora 6.7B | 68.6 | 75.8 | 66.2 | 63.5 | 56.4 | 35.7 | 40.2 |
GPT4All LLaMa Lora 7B | 73.1 | 77.6 | 72.1 | 67.8 | 51.1 | 40.4 | 40.2 |
Dolly 6B | 68.8 | 77.3 | 67.6 | 63.9 | 62.9 | 38.7 | 41.2 |
Dolly 12B | 56.7 | 75.4 | 71.0 | 62.2 | 64.6 | 38.5 | 40.4 |
Alpaca 7B | 73.9 | 77.2 | 73.9 | 66.1 | 59.8 | 43.3 | 43.4 |
Alpaca Lora 7B | 74.3 | 79.3 | 74.0 | 68.8 | 56.6 | 43.9 | 42.6 |
GPT-J 6.7B | 65.4 | 76.2 | 66.2 | 64.1 | 62.2 | 36.6 | 38.2 |
LLaMa 7B | 73.1 | 77.4 | 73.0 | 66.9 | 52.5 | 41.4 | 42.4 |
Pythia 6.7B | 63.5 | 76.3 | 64.0 | 61.1 | 61.3 | 35.2 | 37.2 |
Pythia12B | 67.7 | 76.6 | 67.3 | 63.8 | 63.9 | 34.8 | 38.0 |