산업2026년 3월 31일

알리바바, '시청각 바이브 코딩' 가능한 ‘큐원3.5-옴니’ 출시

알리바바가 텍스트를 넘어 이미지·음성·영상까지 동시에 이해하고 이를 통해 텍스트 입력 없이 바이브 코딩이 가능한 ‘옴니모달’ AI 모델을 공개했다.알리바바는 30일현지시간 차세대 AI 모델 ‘큐원3.5옴니Qwen3.5Omni’를 공개했다. 텍스트뿐 아니라 이미지, 오디오, 영상 데이터를 별도의 변환 과정 없이 동시에 이해하고 생성할 수 있는 구조를 갖췄다.이는 기존 AI 모델들이 음성이나 영상을 텍스트로 변환한 뒤 처리하는 방식과 달리, 모든 입력을 한번에 처리하는 ‘네이티브 옴니모달’ 접근이라는 점에서 차별화된다.모델은

이 콘텐츠는 AI타임스 원본 기사의 요약입니다. 전문은 원본 사이트에서 확인해주세요.

원문 기사 보기 →