GPT4All-J-v1.0：日本語での包括的な記事

Published on 2024/4/28

GPT4All-J-v1.0は、Nomic AIが開発した大規模なカリキュラムベースのアシスタント対話データセットを含む、Apache-2ライセンスのチャットボットです。本記事では、その概要と特徴について説明します。

📚

モデルの詳細

GPT4All-Jは、GPT-Jからファインチューニングされたモデルで、英語での対話を中心に設計されています。いくつかのバージョンがリリースされており、それぞれ異なるデータセットで学習されています。以下にその概要を示します。

v1.0: 最初のモデルで、v1.0データセットで学習されています。
v1.1-breezy: AI言語モデルのすべてのインスタンスを削除したデータセットで学習されています。
v1.2-jazzy: 「I'm sorry, I can't answer...」やAI言語モデルのようなインスタンスを削除したデータセットで学習されています。
v1.3-groovy: v1.2データセットにDollyとShareGPTを追加し、Atlasを使用して意味的な重複を含むv1.2のデータセットの約8%を削除して学習されています。

特定のリビジョンのモデルをダウンロードするには、以下のコードを実行します。

from transformers import AutoModelForCausalLM
 
model = AutoModelForCausalLM.from_pretrained("nomic-ai/gpt4all-j", revision="v1.2-jazzy")

リビジョンを指定せずにダウンロードすると、デフォルトでmain/v1.0が選択されます。

リポジトリ: https://github.com/nomic-ai/gpt4all (opens in a new tab)
ベースモデルリポジトリ: https://github.com/kingoflolz/mesh-transformer-jax (opens in a new tab)
論文（オプション）: GPT4All-J: An Apache-2 Licensed Assistant-Style Chatbot
デモ（オプション）: https://gpt4all.io/ (opens in a new tab)

GPT4Allは、提携コンピュートパートナーであるPaperspaceの協力により実現されています。8台のA100 80GB GPUを搭載したDGXクラスタで約12時間学習されています。DeepspeedとAccelerateを使用し、グローバル

モデル	BoolQ	PIQA	HellaSwag	WinoGrande	ARC-e	ARC-c	OBQA
GPT4All-J 6.7B v1.0	73.4	74.8	63.4	64.7	54.9	36.0	40.2
GPT4All-J v1.1-breezy	74.0	75.1	63.2	63.6	55.4	34.9	38.4
GPT4All-J v1.2-jazzy	74.8	74.9	63.6	63.8	56.6	35.3	41.0
GPT4All-J v1.3-groovy	73.6	74.3	63.8	63.5	57.7	35.0	38.8
GPT4All-J Lora 6.7B	68.6	75.8	66.2	63.5	56.4	35.7	40.2
GPT4All LLaMa Lora 7B	73.1	77.6	72.1	67.8	51.1	40.4	40.2
Dolly 6B	68.8	77.3	67.6	63.9	62.9	38.7	41.2
Dolly 12B	56.7	75.4	71.0	62.2	64.6	38.5	40.4
Alpaca 7B	73.9	77.2	73.9	66.1	59.8	43.3	43.4
Alpaca Lora 7B	74.3	79.3	74.0	68.8	56.6	43.9	42.6
GPT-J 6.7B	65.4	76.2	66.2	64.1	62.2	36.6	38.2
LLaMa 7B	73.1	77.4	73.0	66.9	52.5	41.4	42.4
Pythia 6.7B	63.5	76.3	64.0	61.1	61.3	35.2	37.2
Pythia12B	67.7	76.6	67.3	63.8	63.9	34.8	38.0