팔콘 3: UAE 기술혁신연구소가 노트북을 비롯한 경량 인프라에서 구동할 수 있는 세계 최강의 소형 AI 모델 출시
애즈뉴스
0
2
12.19 02:02
아부다비 첨단기술연구위원회(Advanced Technology Research Council, ATRC) 산하의 선도적인 글로벌 과학 연구센터인 기술혁신연구소(Technology Innovation Institute, TII)가 오픈 소스 대규모 언어 모델(LLM)의 세 번째 버전인 팔콘 3(Falcon 3)를 출시했다. 이 획기적인 릴리스는 소형 LLM의 새로운 성능 표준을 세웠으며, 모델이 노트북을 비롯한 경량 인프라에서 효율적으로 구동되도록 지원함으로써 고급 인공지능에 대한 액세스를 대중화했다. 팔콘 3는 우수한 추론과 향상된 파인 튜닝 기능을 도입하여 AI 모델을 더욱 강력하고 유용하게 만들었다.
팔콘 3는 강력하면서도 효율적인 모델을 제공하는 고성능 AI에 대한 액세스를 대중화하도록 설계되었다. 이전 버전의 5조5000억 개보다 두 배 이상 많은 14조 개의 토큰으로 훈련된 팔콘 3는 다양한 벤치마크에서 우수한 성능을 입증했다. 단일 GPU에서 작동할 수 있는 전 세계 상위 모델 순위에 올랐다는 사실이 주목할 만하다. 팔콘 3는 릴리스되었을 때 허깅페이스(Hugging Face)의 글로벌 써드파티 LLM 리더보드에서 1위를 차지하며, 메타의 라마(Meta's Llama) 변형 버전 등 비슷한 규모의 다른 오픈소스 모델을 앞섰다. 특히 팔콘 3-10B 모델은 해당 카테고리에서 선두를 차지하며 130억 개 미만의 매개변수에서 모든 모델보다 우수한 성능을 보였다.
ATRC 사무총장 겸 UAE 전략연구 및 첨단기술 대통령 자문인 파이살 알 반나이(Faisal Al Bannai)는 “AI의 혁신적 파워는 부인할 수 없다. 오늘 우리는 팔콘 3 텍스트 모델 제품군의 출시를 통해 AI 커뮤니티, 특히 오픈 소스 부문에 대한 기여를 한층 강화했다. 이번 출시는 팔콘 2를 통해 구축한 기반 위에 이루어졌고, 새로운 세대의 AI 모델을 향한 의미 있는 발걸음을 내디딘 것이다. 이러한 강력한 도구를 모든 사람이 어디서나 계속 접근하도록 보장하기 위한 지속적인 노력은 글로벌 형평성과 포용적 혁신에 대한 우리의 헌신을 반영한다”고 말했다.
팔콘 3 제품군
팔콘 3 시리즈에는 Falcon3-1B, -3B, -7B 및 -10B의 네 가지 모델 크기가 있다. 이전 버전에 비해 원활한 통합에 특히 신경을 많이 썼다. 이러한 모델들은 널리 사용되는 API(애플리케이션 프로그래밍 인터페이스) 및 라이브러리와 완벽하게 호환되므로 통합 작업이 크게 줄어들고 사용 편의성이 보장된다. 이로써 궁극적으로 사용자는 필요에 가장 적합한 솔루션을 선택할 수 있다. 추론, 언어 파악, 명령어 이해, 코드 생성, 수학적 작업 전반에 걸쳐 우수한 성능을 제공하는 팔콘 3는 AI 기능의 새로운 표준을 제시할 전망이다.
팔콘 3 소형 모델에는 각자의 베이스(Base)와 인스트럭트(Instruct) 버전이 있으며, 그 각각은 크기 대비 세계에서 가장 강력한 모델 반열에 올랐다. 베이스 모델은 범용 생성형 작업을 허용하는 반면, 인스트럭트는 대화형 애플리케이션을 위해 파인 튜닝된 버전이다. 팔콘 3는 영어, 프랑스어, 스페인어, 포르투갈어로 제공된다. 또한 팔콘 3 모델에는 전문 아키텍처에 최적화된 통합이 가능한 정량화된 버전도 있는데, 리소스 효율적이고 가벼워서 신속한 배포와 추론에 적합하다.
TII의 최고경영자인 나즈와 아라즈 박사(Dr. Najwa Aaraj)는 “선구적인 연구와 최고 수준의 인재 유치에 전념한 결과 팔콘 3의 개발이라는 절정에 이르렀다. 그 결과로 과학적 우수성 추구의 모범 사례인 모델이 탄생해 효율성을 높이고 AI 기술의 새로운 벤치마크를 설정하게 되었다”고 말했다.
TII의 AI 및 디지털과학연구센터(AI and Digital Science Research Center, AIDRC)의 수석연구원 하킴 하시드 박사(Dr. Hakim Hacid)는 “AI는 빠르게 발전하고 있으며, 우리는 이 여정에 활발히 참여하게 되어 기쁘다. 팔콘 3는 소규모 LLM의 경계를 더욱 넓혀 더 나은 성능의 AI에 대한 액세스를 제공함으로써 오픈 소스 커뮤니티에 기여한다. 이 최신 릴리스가 무한한 기회를 열고 엄청난 혜택을 제공해, 기업과 개인이 이전에는 불가능했던 방식으로 AI를 사용할 수 있게 해줄 것이라고 확신한다”고 말했다.
팔콘 3는 벤치마크에 대한 자세한 내용과 함께 허깅페이스와 FalconLLM.TII.ae에서 즉시 다운로드할 수 있다.
또한 TII는 팔콘 플레이그라운드(Falcon Playground)도 출시할 예정인데, 최종 사용자, 프로그래머, 코더, 연구원이 정식 출시 전에 팔콘 3를 체험해보고 피드백을 제공할 수 있는 테스트 환경이다.
팔콘 3는 TII 팔콘 라이선스에 따라 라이선스가 부여되며, 이는 AI의 책임 있는 사용을 촉진하는 이용 목적 제한 방침(acceptable use policy)을 포함하는 퍼미시브 아파치 2.0 기반 소프트웨어 라이선스(permissive Apache 2.0-based software license)이다.
2025년 1월 초, 텍스트, 이미지, 동영상, 음성 모드를 포함한 멀티모달 기능에 중점을 둔 새로운 팔콘 3 제품군이 출시될 예정이다.
뉴스 제공: AETOWire
이 보도자료는 해당 기업에서 원하는 언어로 작성한 원문을 한국어로 번역한 것이다. 그러므로 번역문의 정확한 사실 확인을 위해서는 원문 대조 절차를 거쳐야 한다. 처음 작성된 원문만이 공식적인 효력을 갖는 발표로 인정되며 모든 법적 책임은 원문에 한해 유효하다.
사진/멀티미디어 자료: https://www.businesswire.com/news/home/54167979/en
웹사이트: https://www.tii.ae/