“성능 높고 비용 낮다” 알리바바의 무료 멀티모달 AI 모델 ‘큐웬3 옴니’···분석가가 본 향후 전망

뉴스
2025.09.243분

알리바바가 높은 벤치마크 성능과 무료 오픈소스 라이선스를 앞세운 멀티모달 AI 모델로 서구 경쟁사에 도전장을 내밀었다. 이는 기업의 도입과 관련해 새로운 질문을 부르고 있다.

Alibaba Cloud the front view
Credit: Alibaba Cloud

알리바바가 텍스트, 이미지, 오디오, 비디오를 처리하는 새로운 오픈소스 AI 모델인 큐웬3 옴니(Qwen3-Omni)를 공개했다. 이는 아파치(Apache) 2.0 오픈소스 라이선스 하에 무료로 제공된다.

이번 출시는 기업에게 있어 오픈AI와 구글 외에 비용 부담 없이 대규모 멀티모달 AI를 도입할 선택지가 될 수 있다.

알리바바는 블로그 게시물을 통해 큐웬3 옴니가 ‘씽커-토커(Thinker-Talker) 아키텍처’를 적용했다고 밝혔다. 알리바바는 “씽커는 텍스트 생성을 담당하고, 토커는 씽커에서 직접 전달받은 고차원 표현을 활용해 스트리밍 음성 토큰을 생성한다. 초저지연 스트리밍을 구현하기 위해 토커는 이전 결과를 순차적으로 참고하며 다중 코드북 시퀀스를 예측한다”라고 설명했다.

또한 알리바바는 큐웬3 옴니가 큐웬 시리즈의 단일 모달 모델과 동등한 성능을 보였으며, 오디오 작업에서는 더 우수한 결과를 냈다고 설명했다. 아울러 32개 오픈소스 벤치마크와 22개 종합 벤치마크에서 최고 순위를 기록해, 구글 제미나이 2.5 프로, 시드 ASR(Seed-ASR), 오픈AI GPT-4o-트랜스크라이브(GPT-4o-Transcribe) 등 경쟁 비공개 소스 모델을 앞섰다고 밝혔다.

만약 실제 성능도 이와 같다면 기업은 다른 비공개 소스 경쟁 모델보다 음성 인식, 전사, 멀티모달 추론에서 더 높은 성능을 기대할 수 있다.

오픈소스로 영향력 확대

분석가들은 큐웬3 옴니 공개가 오픈소스 AI 시장에서 알리바바의 입지를 강화하고 글로벌 파트너 생태계 확장에 기여할 수 있을 것이라고 평가했다.

컨설팅 기업 카덴스인터내셔널(Kadence International)의 수석 부사장 툴리카 실은 “아파치 2.0 라이선스로 제공되는 큐웬3 옴니는 기업의 선택지를 근본적으로 바꿀 수 있다. 특히 벤더 종속성을 제거하고 실험과 맞춤화의 장벽을 낮춰 기업이 자체 환경에서 라이선스 제약 없이 모델을 실행, 적용, 통합할 수 있게 한다”라고 분석했다.

다른 전문가들은 알리바바 클라우드(Alibaba Cloud)가 지금까지 공개해 온 모델 수에 주목했다. 옴디아(Omdia)의 수석 애널리스트 리안 제이 수는 “오픈AI와 구글 역시 일부 모델을 오픈소스로 공개했지만, 이 부분에서는 알리바바 클라우드가 앞서 있다”라며, “알리바바 클라우드는 큐웬 모델군을 처음부터 오픈소스로 제공했으며 지금까지 300개 이상의 모델을 내놓았다. 큐웬 모델군은 전 세계적으로 4억 회 이상 다운로드되며 폭넓게 채택됐다”라고 설명했다.

수는 또한 개발자들이 허깅페이스(Hugging Face)에서 14만 개 이상의 큐웬 기반 파생 모델을 제작했다며, 성숙한 오픈소스 옵션을 찾는 기업들이 알리바바 클라우드를 점점 더 유력한 선택지로 보고 있다고 진했다.

기업 AI 전략 재편 가능성

큐웬3 옴니의 하이브리드 추론, 멀티모달 기능, 그리고 강력한 벤치마크 성과가 실제 환경에서도 입증된다면 기업 AI 전략에서 2가지 중요한 변화를 가속화할 수 있다.

실은 “첫 번째 변화는 기업이 과제별 요구에 맞춰 오픈소스와 비공개 소스를 혼합하는 다중 모델 스택을 점점 더 채택하게 될 것이라는 점이다. 둘째는 기업이 고성능 오픈소스 모델을 사내 또는 신뢰할 수 있는 클라우드에서 활용하기 위해 ML옵스, 파인튜닝, 안전성 테스트, 인프라 역량에 대한 투자를 확대할 것이라는 점”이라고 말했다.

수는 하나의 모델에서 모든 데이터 양상을 처리할 수 있다면 자원 소모가 줄고, 여러 도메인 특화 시스템을 훈련 및 관리하는 데 필요한 시간이 단축될 것이라고 설명했다.

그러나 분석가들은 기술 성숙도가 충분히 검증되더라도 반드시 이에 상응하는 안전 장치가 필요하다고 조언했다.

포레스터(Forrester)의 부사장 겸 수석 애널리스트 찰리 다이는 “기술적으로 중국 모델과 글로벌 모델 간에는 차이가 없다. GPT 시리즈, 라마(Llama), 미스트랄(Mistral), 큐웬 등 어떤 모델을 쓰든 기업 리더는 보안, 프라이버시, 규제 준수를 위한 가드레일을 반드시 마련해야 한다”라고 말했다.

다이는 이어 멀티 모델 지원이 앞으로도 핵심 주제로 남을 것이라고 전망했다. 그는 “멀티 모델 지원은 향후 12개월 동안 데이터 인프라부터 에이전틱 AI 애플리케이션에 이르기까지 모델 개발과 관련 기술 분야의 핵심 영역이 될 것으로 보인다. 글로벌 주요 벤더들이 더 많은 성과를 보여줄 가능성이 높다”라고 말했다.
dl-ciokorea@foundryco.com

Prasanth Aby Thomas is a freelance technology journalist who specializes in semiconductors, security, AI, and EVs. His work has appeared in DigiTimes Asia and asmag.com, among other publications.

Earlier in his career, Prasanth was a correspondent for Reuters covering the energy sector. Prior to that, he was a correspondent for International Business Times UK covering Asian and European markets and macroeconomic developments.

He holds a Master's degree in international journalism from Bournemouth University, a Master's degree in visual communication from Loyola College, a Bachelor's degree in English from Mahatma Gandhi University, and studied Chinese language at National Taiwan University.

이 저자의 추가 콘텐츠