Skip to content

Vicuna-13B: GPT-4 감동을 선사하는 오픈 소스 ChatGPT 대안

OpenAI의 ChatGPT와 같은 대형 언어 모델 (LLM) 이 개발되면서 챗봇 세계는 최근 몇 년 동안 크게 발전했습니다.그러나 ChatGPT의 아키텍처 및 교육에 대한 세부 사항은 아직 파악하기 어려워 연구자들이 ChatGPT의 성공을 기반으로 구축하기가 어렵습니다.이것이 바로 강력한 데이터세트와 확장 가능한 인프라로 뒷받침되는 ChatGPT를 대체하는 오픈 소스 챗봇인 Vicuna가 필요한 이유입니다.이 글에서는 Vicuna의 능력, 개발 방법, 향후 연구 가능성에 대해 자세히 알아볼 것입니다.

📚

비쿠나란?

Vicuna (opens in a new tab)는 UC Berkeley, CMU, Stanford 및 UC San Diego의 연구원 팀이 만든 Vicuna-13B라는 오픈 소스 챗봇 모델입니다. ShareGPT의 사용자 공유 대화에서 LLaMA 모델을 미세 조정하여 구축되었으며 예비 평가에서 ChatGPT 품질의 90% 이상을 달성하는 것으로 나타났습니다. 특히 Vicuna-13B 교육 비용은 약 $300입니다.

비쿠나 GitHub 링크: https://github.com/lm-sys/FastChat (opens in a new tab)

비쿠나는 어떻게 활동하나요?

Vicuna는 예비 평가에서 인상적인 성과를 보여주었습니다.70,000개의 사용자 공유 ChatGPT 대화로 Vicuna를 미세 조정함으로써 모델은 상세하고 체계적인 답변을 생성할 수 있게 되었습니다.품질은 ChatGPT와 동등하며 90% 이상의 사례에서 라마 및 스탠포드 알파카와 같은 다른 모델을 능가합니다.

Vicuna의 개발: 교육 및 서비스 인프라

비쿠나 팀은 ShareGPT.com에서 약 7만 건의 대화를 수집하고 Alpaca에서 제공하는 교육 스크립트를 개선했습니다.그들은 트레이닝을 위해 8개의 A100 GPU에서 PyTorch FSDP를 사용했고 가벼운 분산 서빙 시스템을 구현했습니다.또한 팀은 80개의 다양한 질문 세트를 만들고 GPT-4 자료를 활용하여 모델 결과를 판단하여 모델 품질에 대한 예비 평가를 실시했습니다.

Vicuna를 교육하기 위해 팀은 사용자 공유 대화를 사용하여 LLaMa 기본 모델을 미세 조정했습니다.HTML을 다시 마크다운으로 변환하고 부적절하거나 품질이 낮은 샘플을 필터링하여 데이터 품질을 보장했습니다.또한 메모리 최적화, 다중 라운드 대화 처리, 스팟 인스턴스를 통한 비용 절감 등 학습 레시피를 다양하게 개선했습니다.

Vicuna를 위해 구축된 서빙 시스템은 분산된 작업자와 함께 여러 모델에 서비스를 제공할 수 있습니다.온프레미스 클러스터와 클라우드 모두에서 GPU 작업자를 위한 유연한 플러그인을 지원합니다.SkyPilot의 내결함성 컨트롤러 및 관리형 스팟 기능을 사용하면 서비스 시스템이 여러 클라우드의 저렴한 스팟 인스턴스와 잘 작동하여 서비스 비용을 절감할 수 있습니다.

GPT-4 기반 챗봇 평가

챗봇을 평가하는 것은 어려운 작업이지만 Vicuna 팀은 챗봇 성능 평가를 자동화하기 위한 GPT-4 기반 평가 프레임워크를 제안합니다.이들은 챗봇 성능의 다양한 측면을 테스트하기 위해 8개의 질문 범주를 고안했으며, GPT-4 문항이 비교적 일관된 점수를 산출하고 해당 점수에 대한 자세한 설명을 제공할 수 있음을 발견했습니다.

그러나 이 제안된 평가 프레임워크는 아직 엄격한 접근 방식이 아닙니다. GPT-4 같은 대형 언어 모델은 환각에 취약하기 때문입니다.챗봇을 위한 포괄적이고 표준화된 평가 시스템을 개발하는 것은 추가 연구가 필요한 미해결 과제로 남아 있습니다.

한계 및 향후 연구

Vicuna는 다른 대형 언어 모델과 마찬가지로 추론이나 수학과 관련된 작업에는 한계가 있습니다.또한 자신을 정확하게 식별하거나 출력의 사실적 정확성을 보장하는 데 어려움이 있을 수 있습니다.또한 안전성, 독성 또는 편향 완화를 위해 충분히 최적화되지 않았습니다.

그럼에도 불구하고 Vicuna는 이러한 한계를 해결하기 위한 향후 연구를 위한 열린 출발점 역할을 합니다.비쿠나 팀은 GitHub (opens in a new tab) 에 트레이닝, 서빙 및 평가 코드를 공개했습니다.

📚