크래프톤, ‘Raon’ 공개…음성·비전 멀티모달 AI로 글로벌 기술 경쟁력 입증

하수은 기자 / 기사승인 : 2026-04-02 10:11:09
  • -
  • +
  • 인쇄
- 음성 지원 대규모 언어 모델, 실시간 음성 대화 모델, 텍스트-음성 변환 모델 및 비전 인코더 공개
- 비전 인코더는 프롬 스크래치 학습
▲ 크래프톤, AI 모델 브랜드 Raon CI(이미지=크래프톤)

 

크래프톤이 독자 AI 모델 브랜드 ‘Raon(라온)’을 선보이며 글로벌 인공지능 기술 경쟁에 본격적으로 뛰어들었다. 음성과 시각을 아우르는 멀티모달 AI 모델을 오픈소스로 공개하며 기술력과 개방성을 동시에 강화하는 전략이다.


이번에 공개된 모델은 음성 언어 모델 ‘Raon-Speech’, 실시간 음성 대화 모델 ‘Raon-SpeechChat’, 텍스트-음성 변환 모델 ‘Raon-OpenTTS’, 비전 인코더 ‘Raon-VisionEncoder’ 등이다. 해당 모델들은 글로벌 AI 플랫폼 Hugging Face를 통해 공개돼 연구자와 개발자가 자유롭게 활용할 수 있도록 했다.


Raon은 ‘즐거움’을 의미하는 순우리말에서 착안된 이름으로, AI 기술을 통해 게임의 본질적 재미를 확장하겠다는 기업 철학을 반영하고 있다. 크래프톤은 데이터 수집부터 학습, 평가까지 전 과정을 자체 수행하며 파운데이션 모델 개발 역량을 확보했다는 점에서 의미가 크다.


특히 ‘Raon-Speech’는 약 90억 파라미터 규모의 음성 언어 모델로, 영어와 한국어 모두에서 글로벌 최고 수준의 성능을 기록했다. 음성 인식과 생성, 질의응답 등 다양한 영역에서 경쟁력을 입증하며 음성 AI 분야에서 존재감을 드러냈다.

 

▲ 크래프톤, AI 모델 브랜드 ‘Raon’ 출범… 첫 모델 4종 오픈소스 공개(이미지=크래프톤)


‘Raon-SpeechChat’은 실시간 양방향 대화가 가능한 모델로, 사용자가 대화 중간에 끼어들 수 있는 풀 듀플렉스(Full-duplex) 기술을 적용한 것이 특징이다. 이는 자연스러운 인간형 대화 구현을 가능하게 하는 핵심 기술로 평가된다.


텍스트를 자연스러운 음성으로 변환하는 ‘Raon-OpenTTS’는 공개 데이터 기반 학습과 데이터셋 공유를 통해 재현성을 높였으며, 글로벌 연구용 모델과 비교해도 최상위 수준의 품질을 확보했다.


이미지 이해를 담당하는 ‘Raon-VisionEncoder’ 역시 경쟁력을 입증했다. 일부 시각 인식 분야에서는 SigLIP2를 상회하는 성능을 기록했으며, 전반적으로도 높은 수준의 정확도를 유지했다.


크래프톤은 이번 공개를 계기로 AI 기술을 게임 전반에 확대 적용할 계획이다. AI 에이전트와 상호작용형 캐릭터(CPC) 기술을 통해 새로운 게임 경험을 구현하고, 개인용 AI 비서 ‘KIRA’ 등 기존 기술과의 연계를 통해 생태계를 확장한다는 전략이다.


업계에서는 크래프톤이 게임사를 넘어 AI 기술 기업으로의 전환을 가속화하고 있다는 평가가 나온다. 오픈소스를 통한 기술 공유와 멀티모달 AI 역량 확보를 기반으로 글로벌 경쟁 구도에서도 존재감을 강화할 것으로 전망된다.

 

일요주간 / 하수은 기자 jlist@naver.com 

 

'시민과 공감하는 언론 일요주간에 제보하시면 뉴스가 됩니다'

▷ [전화] 02–862-1888

▷ [메일] ilyoweekly@daum.net

[저작권자ⓒ 일요주간. 무단전재-재배포 금지]

오늘의 이슈

댓글 0

댓글쓰기
  • 이 름
  • 비밀번호

- 띄어 쓰기를 포함하여 250자 이내로 써주세요.
- 건전한 토론문화를 위해, 타인에게 불쾌감을 주는 욕설/비방/허위/명예훼손/도배 등의 댓글은 표시가 제한됩니다.


많이 본 기사