FinGPT: 데이터 중심 접근으로 금융 오픈소스 혁신하기

Name: Matt Popovic

Published on 2023. 8. 17.

AI4Finance Foundation이 개발한 FinGPT는 대형 언어 모델 (LLM)을 위한 금융 데이터를 민주화하는 데이터 중심 도구입니다. 금융 산업을 혁신시키기 위한 오픈소스 해결책으로 설계되었습니다. 이 글에서는 FinGPT의 복잡성, 이점 및 금융 분야에서 게임체인저로 자리 잡은 방식을 자세히 살펴보겠습니다.

왜 FinGPT인가?

금융 분야는 매우 동적인 특성이 있어 지속적인 변화에 대응하는 것이 어려울 수 있습니다. 금융 및 일반 데이터 원본의 혼합 데이터 집합을 사용하여 LLM의 다시 교육하는 전통적인 방법은 코스트가 많이 드는 시간 소비적인 방법일 수 있습니다. 예를 들어, 다른 LLM 중 하나인 BloombergGPT는 재교육을 위해 GPU 시간 약 130만 시간이 필요하며 500만 달러가 소요됩니다. 이러한 이유로 매달 또는 매주 LLM 모델을 다시 훈련시키는 것은 현실적이지 않습니다.

FinGPT는 더 쉽고 접근성이 높은 대안을 제시합니다. 가볍게 적응하는 것을 우선순위로 삼아 최고의 오픈소스 LLM 강점을 활용하여 디자인된 방식으로 금융 데이터를 학습시키고 금융 언어 모델링을 위해 최적화된 오픈소스 도구로 설계되었습니다. 적응 비용이 상당히 감소하여 학습당 비용은 300달러 미만으로 추정되기 때문에 FinGPT는 비용 효과적인 해결책입니다.

FinGPT가 작동하는 방식:

FinGPT를 탐색할 때, 기술 적인 측면에 대해 자세히 살펴보겠습니다. FinGPT는 금융 언어 모델링을 위해 금융 데이터로 학습시킨 오픈소스 LLM 기반으로 구성됩니다. 이 과정은 인간 피드백으로부터의 강화 학습(RLHF)을 이용하여 가능합니다. 이 기술은 모델이 개인적 선호도를 학습하는 데 도움이 됩니다.

FinGPT의 중요한 측면 중 하나는 오픈소스 인터넷 규모의 금융 데이터에 중점을 둔다는 것입니다. 이를 통해 자동 데이터 선별 파이프 라인을 사용하여 적시에 업데이트 (월간 또는 주간)를 수행할 수 있습니다. 특권 데이터 액세스 및 API를 보유한 BloombergGPT와는 달리, FinGPT는 더욱 접근성이 높으며 가볍게 적응할 수 있도록 고려되었습니다.
또 하나의 FinGPT의 주요 강점은 새로운 데이터에 신속하게 적응할 수 있는 능력입니다. 학습 비용을 상당히 감소시키는 가벼운 적응 접근 방식 덕분에 가능합니다. 그렇기에, FinGPT는 금융 분야에서 권위적인 도구 뿐만 아니라 비용 효과적인 해결책으로 자리 잡게 되었습니다.
FinGPT는 또한 인터넷 규모의 금융 데이터에 중점을 둡니다. 이는 자동 데이터 선별 파이프 라인을 통해 가능하며, 빠른 업데이트가 가능합니다. 이 기능은 다른 LLM과 구별되는 기능이며 FinGPT를 더 접근 가능한 대안으로 만들어냅니다.

FinGPT의 핵심 기술은 "RLHF (리인포스먼트 러닝 프롬 휴먼 피드백)"입니다. 이 기술은 BloombergGPT에서 사용되지 않는 기술로, LLM 모델이 리스크 회피 수준, 투자 습관 및 맞춤형 로보어드바이저와 같은 개인적 선호도를 학습할 수 있습니다. 이것이 ChatGPT와 GPT4의 "비밀" 원료로, FinGPT를 금융 산업에서 강력한 도구로 만듭니다.

FinGPT 데모: 자세한 가이드

FinGPT는 사용자에게 기능을 보여주는 데모를 제공하며 다양한 금융 시장에서 자신만의 FinGPT 모델을 훈련하는 실용적인 가이드를 제공합니다. 이 목록에서는 이러한 데모들의 세부 정보를 살펴보겠습니다.

FinGPT V1: ChatGLM 및 LoRA로 중국 금융 시장 파악하기

첫 번째 데모인 FinGPT V1은 중국 금융 시장에 초점을 맞추고 있습니다. 이 데모는 ChatGLM 및 LoRA (Low-Rank Adaptation)를 활용하여 FinGPT 모델을 학습시킵니다. 다음은 사용 방법에 대한 단계별 가이드입니다.

환경 설정: 시작하기 전에 필요한 패키지가 설치되어 있는지 확인하세요. 터미널에서 pip install -r requirements.txt 명령을 실행하여 가능합니다.
필요한 모듈 가져오기: 모델 학습에 필요한 모듈을 가져옵니다. FinGPT, ChatGLM, LoRA 등이 포함됩니다.

from fingpt import FinGPT
from chatglm import ChatGLM
from lora
```python
# 모델 생성
model = FinGPT(
    num_tokens=50257,
    dim=768,
    depth=12,
    heads=12,
)
 
# 4. 모델 훈련
model.train(ChatGLM, LoRA)
 
# 5. 모델 저장
model.save("fingpt_v1.pth")
 
### FinGPT V2: LLaMA 및 LoRA를 사용한 미국 금융 시장
 
FinGPT V2 데모는 미국 금융 시장에 초점을 맞추며 LLaMA 및 LoRA를 사용하여 FinGPT 모델을 훈련합니다. 다음은 사용 방법에 대한 단계별 안내입니다.
 
1. 환경 설정: 첫 번째 데모와 마찬가지로 필요한 패키지가 설치되어 있는지 확인합니다.
 
2. 필요한 모듈 가져 오기 : 모델 훈련에 필요한 모듈을 가져옵니다. 이에는 FinGPT, LLaMA 및 LoRA 등이 포함됩니다.
 
```python
from fingpt import FinGPT
from llama import LLaMA
from lora import LoRA

모델 초기화 : 원하는 매개 변수로 FinGPT 모델을 초기화합니다.

model = FinGPT(
    num_tokens=50257,
    dim=768,
    depth=12,
    heads=12,
)

모델 훈련 : LLaMA 및 LoRA를 사용하여 모델을 훈련합니다.

model.train(LLaMA, LoRA)

모델 저장 : 훈련 후 모델을 저장하여 나중에 사용할 수 있도록 합니다.

model.save("fingpt_v2.pth")

이러한 데모는 직접 FinGPT 모델을 훈련하여 금융 시장을 분석하고 예측하는 방법을 알려줍니다. 이러한 단계를 따라서 FinGPT의 기능을 활용하여 금융 시장을 분석할 수 있습니다.

결론

이 글이 여러분께 FinGPT가 금융 산업을 혁신시킬 수 있는 잠재력을 포괄적으로 이해하게 도와주었기를 바랍니다. 오픈소스 금융 세계에서 더 많은 인사이트를 기대해주세요!

FAQ

FinGPT를 탐색하는 동안 자주 묻는 질문 몇 가지를 다뤄보도록 하겠습니다.

FinGPT가 무엇인가요?

FinGPT는 AI4Finance 재단에서 개발한 데이터 중심 도구입니다. 이는 대규모 언어 모델(Large Language Models)에게 금융 데이터를 민주화하는 오픈소스 솔루션을 제공합니다.

FinGPT는 어떻게 동작하나요?

FinGPT는 최고의 오픈소스 대규모 언어 모델을 이용해 자금 데이터를 전달하고, 금융 언어 모델링을 위해 최적화됩니다. FinGPT의 핵심 기술은 RLHF(인간 피드백으로부터 강화 학습)입니다. 이 기술은 모델이 개인적인 기호를 배울 수 있도록 합니다.

FinGPT는 다른 대규모 언어 모델과 어떻게 차이나나요?

FinGPT는 인터넷 규모의 금융 데이터 민주화에 집중하고 고유한 RLHF 기술로 인해 높은 차별성을 보입니다. 또한, 적용 비용이 300달러 미만으로 저렴한 솔루션을 제공합니다.

FinGPT: Revolutionizing Open-source Finance with Data-Centric Approach Fix 'Conversation Not Found' Error on ChatGPT: the Solution