2024.10.22 (화)

  • 흐림동두천 14.1℃
  • 흐림강릉 16.1℃
  • 서울 15.9℃
  • 대전 17.9℃
  • 박무대구 18.1℃
  • 구름많음울산 19.8℃
  • 광주 19.3℃
  • 박무부산 21.1℃
  • 흐림고창 18.9℃
  • 흐림제주 21.9℃
  • 흐림강화 14.3℃
  • 흐림보은 17.4℃
  • 흐림금산 18.0℃
  • 흐림강진군 20.4℃
  • 흐림경주시 19.9℃
  • 흐림거제 20.7℃
기상청 제공

뉴스

기술 혁신 연구소, 세계에서 가장 강력한 오픈 LLM ‘팰컨 180B’ 소개

 

 

한국보건복지신문 김재근 기자 | 아랍에미리트(UAE)의 기술혁신연구소(Technology Innovation Institute, TII)가 플래그십 대형 언어 모델(large language model, LLM)의 고급 버전인 팰컨 180B를 출시하며 생성형 AI의 경계를 다시 한번 확장하고 있다. 이 획기적인 출시를 통해 연구 및 상업적 목적을 위한 오픈 액세스 모델인 팰컨 180B를 제공하고 UAE의 AI 지배력을 강화했다. 

 

2023년 5월 오픈 소스 AI 모델인 팰컨 40B가 LLM 허깅 페이스 리더보드(Hugging Face Leaderboard for LLM)에서 빠르게 정상에 오르며 놀라운 성공을 거둔 이후, 아부다비 첨단기술연구위원회(Advanced Technology Research Council, ATRC)의 응용 연구 부문인 TII는 생성형 AI 분야에서 계속 선두를 달리고 있다. 팰컨 40B는 연구자와 상용 사용자 모두를 위한 오픈 소스 모델의 첫 번째 사례 중 하나로, 이 분야에서 개척자적 도약으로 간주됐다. 

 

첨단기술연구위원회의 파이잘 알 반나이(H.E. Faisal Al Bannai) 사무총장은 팰컨이 AI 환경에 미치는 긍정적인 영향을 강조하며 다음과 같이 말했다. '우리는 AI의 혁신적 힘을 모든 사람이 누릴 수 있는 미래를 그리고 있다. 프라이버시와 AI가 인류에 미칠 수 있는 잠재적 영향이 소수에 의해 통제돼서는 안 되기 때문에 우리는 고급 AI에 대한 접근성을 민주화하기 위해 노력한다. 모든 해답을 가지고 있지는 않지만, 오픈 소스 커뮤니티와 협력하고 이에 기여해 AI의 혜택을 모든 사람이 나누도록 한다는 우리의 결심은 꺾이지 않았다.' 

 

1800억 개의 엄청난 파라미터를 사용하고 3조5000억개의 토큰으로 학습된 팰컨 180B는 사전 학습 LLM의 허깅 페이스 순위표에서 정상에 올랐다. 추론, 코딩, 숙련도, 지식 테스트 등 다양한 벤치마크에서 메타의 LLaMA 2와 같은 유명 경쟁 모델보다 뛰어난 성능을 발휘한다. 

 

최고의 클로즈드 소스 LLM인 팰컨 180B는 OpenAI의 최신 GPT 4에 이어 2위를 차지하고 있으며, 절반 크기에도 불구하고 바드(Bard)를 구동하는 모델인 구글의 PaLM 2 Large와 성능 면에서 동등하다. 이 모델의 라이선스 프레임워크는 아파치 2.0(Apache 2.0)을 기반으로 하는 '팰컨 180B TII 라이선스'를 기반으로 설정된다. 

 

TII의 책임자 겸 AI 크로스 센터 유닛 수석 연구원 대행인 엡테삼 알마즈루에이 박사(Dr. Ebtesam Almazrouei)는 다음과 같이 말했다. '팰컨 180B의 출시는 AI의 경계를 확장하기 위한 우리의 헌신을 잘 보여주는 예이며, 그 무한한 잠재력을 전 세계와 공유하게 돼 매우 기쁘다. 팰컨 180B는 미래의 혁신을 촉진하는 오픈 액세스를 통해 과학적 발전의 잠재력을 활용할 수 있는 새로운 생성형 AI 시대를 예고한다. 과학과 기술의 최전선에 뛰어드는 우리의 비전은 혁신을 넘어선다. 즉, 협력적 돌파구를 통해 글로벌 과제를 해결하기 위한 깊이 있는 연결을 맺어가는 것이다.' 

 

1200만명 이상의 개발자가 팰컨의 첫 번째 릴리스를 채택하고 배포하면서 이 중요한 업그레이드는 챗봇에서 코드 생성에 이르기까지 다양한 영역에서 최고의 모델이 될 예정이다. 

 

팰컨 180B은 영어, 독일어, 스페인어, 프랑스어 등의 주요 언어를 지원하며 호환도 가능하다. 이탈리아어, 포르투갈어, 폴란드어, 네덜란드어, 루마니아어, 체코어, 스웨덴어는 제한적으로 지원된다.