
(서울=뉴스1) 김정현 기자 = SK텔레콤이 중국 알리바바 클라우드의 오픈네임드카지노 거대언어모델(LLM) 큐원(QWEN) 2.5에 한국어 데이터를 학습시킨 에이닷엑스(A.X 4.0)를 공개했다.
오픈네임드카지노 LLM은 라이선스 비용 없이 LLM 모델의 구조나 데이터, 네임드카지노코드, 가중치 등이 공개된 LLM을 말한다. 누구나 모델을 분석, 평가하고 변형하는 등 활용할 수 있다.
5일 네임드카지노T에 따르면 A.X 4.0은 한국어 능력 평가 벤치마크인 KMMLU에서도 78.3점을 기록해 GPT-4o(72.5점)보다 우수한 성능을 기록했다. 한국어 및 한국 문화 벤치마크인 CLIcK에서도 83.5점을 획득해, GPT-4o(80.2점)보다 더 높은 한국 문화 이해도를 보였다.
빠른 성과를 낸 건 검증된 오픈네임드카지노 LLM인 큐원 2.5를 효율적으로 학습시킨 덕이다. 오픈네임드카지노 LLM은 허깅페이스, 깃허브 등 커뮤니티를 통해 전 세계 개발자들이 작업에 참여하고 다양한 파생 모델이 나타나며 빠르게 성능이 발전하고 있다.
메타의 '라마'(Llama), 구글의 '젬마'(Gemma), 알리바바의 '큐원' 및 등이 유명하다. AI업계에 충격을 안겼던 '딥시크' 역시 오픈네임드카지노로 공개된 모델이다.
SKT가 이번에 큐원 2.5를 선택한 이유 역시 큐원이 오픈네임드카지노 LLM 중에서 다방면으로 성능이 검증됐기 때문으로 풀이된다.
실제로 A.X 4.0의 경우 자체 설계한 토크나이저를 적용해 GPT-4o보다 토큰 효율을 높이고 더 앞선 한국어 처리 능력을 기록했다.
SKT는 일각에서 제기되는 중국산 오픈네임드카지노 LLM 사용으로 인한 데이터 유출 및 보안 우려도 철저히 차단했다고 밝혔다.
SKT는 A.X 4.0의 대규모 학습(CPT) 전 과정을 자체 개발로 진행했다. 오픈네임드카지노 LLM을 다운 받은 이후, 한국어 데이터를 학습시키는 과정도 알리바바 클라우드 쪽으로 데이터를 보내지 않도록 외부 연결을 차단한 상태에서 진행했다.
이같은 학습 과정은 자체적으로 구축한 네임드카지노데이터센터 '타이탄'(Titan)에서 진행됐으며, 여러 단계의 필터링을 거쳐 데이터 주권도 확보했다.
네임드카지노T 관계자는 "성능이나 효율성 측면에서 A.X 4.0 구현에 가장 적합한 모델이 큐원이라고 판단했다"며 "큐원은 이미 세계적으로 널리 보급되고 개발자들이 많이 사용하는 LLM"이라고 설명했다.
이어 "이번 A.X 4.0 모델을 고도화하면서 프롬 스크래치 역량도 함께 병행해 지속적으로 수준을 높일 예정"이라고 덧붙였다.
※ 저작권자 ⓒ 네임드카지노1코리아, 무단전재-재배포 금지