2026.02.03 (화)

  실시간 기사

  • 서울시, 도시텃밭 9,016구획 분양…“도심 속 수확의 기쁨”
  • 성수 삼표레미콘 부지, 79층 ‘글로벌 미래업무지구’로 연말 착공
  • 서울형 손주돌봄수당, 서울시 육아정책 만족도 1위
  • 전세 9%줄고, 월세는 6%늘어…작년 전국 주택·오피스텔 거래 조사
  • DL이앤씨·GS건설·SK에코플랜트, ‘구리역 하이니티 리버파크’ 이달 분양
  • “돈이 마귀라더니”…이재명 대통령, 다주택자 눈물론 강하게 비판
  • [오늘의 운세] 2026년 02월 03일 화요일
  • 급한 국토부, 1.29 공급대책 발표 3일만에 장문의 해명자료 배포
  • 회원가입
  • LOGIN
도시경제채널
도시·부동산경제·IT입법·정책오피니언도경채 뉴스
경제·IT IT경제금융·증권AI·통신·유통인프라·신공법
도시경제채널

카카오, 한국형 멀티모달 AI ‘카나나’ 공개… 텍스트·음성·이미지 동시 이해 뛰어나

Home > 경제·IT > IT경제

카카오, 한국형 멀티모달 AI ‘카나나’ 공개… 텍스트·음성·이미지 동시 이해 뛰어나

유주영 기자 / 기사승인 : 2025-12-12 10:08:06
Kanana-v-embedding 벤치마크 성능 비교

[도시경제채널 = 유주영 기자] 카카오가 12일 테크블로그를 통해 한국형 멀티모달 AI 모델 ‘Kanana-o’와 멀티모달 임베딩 모델 ‘Kanana-v-embedding’의 개발 과정과 성능을 공개했다. 카카오는 이번 발표를 통해 자체 AI 모델의 기술적 완성도를 다시 한 번 강조하며 서비스 적용 범위 확장을 예고했다.

카카오가 공개한 Kanana-o는 텍스트, 음성, 이미지 등 여러 입력을 동시에 이해하고 실시간으로 응답하는 통합 멀티모달 언어모델이다. 글로벌 모델 대비 한국어 맥락 이해 능력이 뛰어나며, 자연스러운 표현력과 대화 흐름을 구현할 수 있는 것이 특징이다. 카카오는 멀티모달 모델이 텍스트 입력에는 강하지만 음성 대화에서는 답변이 단순해지고 추론 능력이 떨어지는 한계를 보완하기 위해 Kanana-o의 지시이행 능력과 복잡한 요구 파악 능력을 고도화했다.

자체 구축한 데이터셋을 활용해 다양한 모달리티의 입력을 처리할 수 있도록 학습을 강화했고, 질의응답뿐 아니라 요약, 감정·의도 해석, 오류 수정, 형식 변환, 번역 등 복합적 작업 수행 능력도 끌어올렸다. 고품질 음성 데이터와 DPO 직선호 최적화 방식도 적용해 억양, 감정, 호흡 등 세부 음성 요소를 정교하게 반영할 수 있게 됐다. 카카오는 팟캐스트 형태의 멀티턴 대화 데이터셋도 구축해 끊김 없는 자연스러운 대화 흐름을 구현했다.

벤치마크 결과 Kanana-o는 영어 음성 성능에서 GPT-4o와 유사한 수준을 보였으며, 한국어 음성 인식·합성·감정 인식 능력에서는 더욱 높은 성능을 기록했다. 카카오는 향후 Kanana-o를 동시 대화와 실시간 사운드스케이프 생성까지 가능한 모델로 진화시킬 계획이다.

함께 공개된 Kanana-v-embedding은 텍스트와 이미지를 동시에 이해하는 한국형 멀티모달 임베딩 모델이다. 이미지 기반 검색 기술이 핵심으로, 텍스트로 이미지를 찾거나 이미지를 기반으로 연관 정보를 검색하고 이미지 포함 문서를 찾아내는 기능을 지원한다. 한국 문화 이해도가 높아 ‘경복궁’, ‘붕어빵’ 같은 고유명사뿐 아니라 ‘하멜튼 치즈’처럼 오타가 있는 단어도 문맥을 파악해 정확한 이미지를 찾아준다. ‘한복 입고 찍은 단체 사진’처럼 복합 조건도 정확히 이해해 조건을 일부만 충족하는 이미지는 걸러낼 수 있다.

Kanana-v-embedding은 현재 카카오 내부 광고 심사 시스템에서 활용 중이며, 추후 비디오와 음성 기반 모델로 확장해 다양한 서비스에 적용될 예정이다.

카카오는 지난 5월 공개한 Kanana-1.5를 기반으로 온디바이스 환경에서 동작하는 가벼운 멀티모달 모델 연구를 진행 중이다. 또한 MoE 구조를 적용한 고성능 모델 Kanana-2 개발에도 착수했다.

카카오 김병학 카나나 성과리더는 “카나나는 단순 정보 나열을 넘어 사용자 감정을 이해하고 더 자연스럽게 대화할 수 있는 AI를 지향한다”며 “실제 서비스 환경을 기반으로 한국적 맥락을 반영한 AI 경험을 확장하고 사람과 상호작용하는 AI 개발에 집중하겠다”고 말했다.

[저작권자ⓒ 도시경제채널. 무단전재-재배포 금지]

유주영 기자
유주영 기자
기자 페이지

기자의 인기기사

  • BTS, 광화문광장에서 컴백무대… 서울시 조건부 허가

  • "목동 재건축, 나아가야할 방향은?.... "

  • “정책으로 집값 잡겠다는 말은 허상?”

좋아요
공유하기
  • 페이스북
  • 트위터
  • 카카오톡
  • 라인
  • 밴드
  • 네이버
  • https://www.dokyungch.com/article/1065573278759243 URL복사 URL주소가 복사 되었습니다.
글씨크기
  • 작게

  • 보통

  • 크게

  • 아주크게

  • 최대크게

뉴스댓글 >

- 띄어 쓰기를 포함하여 250자 이내로 써주세요.
- 건전한 토론문화를 위해, 타인에게 불쾌감을 주는 욕설/비방/허위/명예훼손/도배 등의 댓글은 표시가 제한됩니다.

댓글 0

TODAY FOCUS

  • [오늘의 운세] 2026년 02월 03일 화요일
  • 급한 국토부, 1.29 공급대책 발표 3일만에 장문의 해명자료 배포
  • 오세훈 “장동혁 디스카운트, 수도권 대패 우려…노선 바꿔야”
  • GS건설, 송파한양2차 재건축 수주
  • 이재명 정부 수도권 6만호 부정적인 반응이 나오는 이유?
  • 사가정역 인근 도심 공공주택 복합사업

포토뉴스

  • 서울시, 도시텃밭 9,016구획 분양…“도심 속 수확의 기쁨”

    서울시, 도시텃밭 9,016구획 분양…“도심 속 수확의 기쁨”

  • 서울형 손주돌봄수당, 서울시 육아정책 만족도 1위

    서울형 손주돌봄수당, 서울시 육아정책 만족도 1위

  • 오세훈 “장동혁 디스카운트, 수도권 대패 우려…노선 바꿔야”

    오세훈 “장동혁 디스카운트, 수도권 대패 우려…노선 바꿔야”

많이 본 기사

1
BTS, 광화문광장에서 컴백무대… 서울시 조건부 허가
2
작년 서울 아파트 거래 절반이상이 ‘신고가’… 한남더힐 95억 껑충
3
현대차노조 “합의없이 ‘아틀라스’ 도입 못한다"… '피지컬 AI' 앞길에 장애물
4
서울시, 2025년 고액체납 1,566억원에 징수 착수
5
[기자수첩] 중소기업중앙회장은 헌법 위에 있나?

Hot Issue

성수 삼표레미콘 부지, 79층 ‘글로벌 미래업무지구’로 연말 착공

전세 9%줄고, 월세는 6%늘어…작년 전국 주택·오피스텔 거래 조사

DL이앤씨·GS건설·SK에코플랜트, ‘구리역 하이니티 리버파크’ 이달 분양

“돈이 마귀라더니”…이재명 대통령, 다주택자 눈물론 강하게 비판

급한 국토부, 1.29 공급대책 발표 3일만에 장문의 해명자료 배포

매체소개 채용안내 광고문의 기사제보 약관 및 정책 이메일수집거부
도시경제채널
서울특별시 영등포구 63로 40 | 대표전화 : 02-2088-2977
제 호 : 도시경제채널 | 등록번호 : 서울, 아56114 | 등록일 : 2025-08-08 | 발행일 : 2025-08-08
발행·편집인 : (주)뉴미디어온 | 제보메일 : news@dokyungch.com | 청소년보호책임자 : (주)뉴미디어온
Copyright ⓒ 도시경제채널 All rights reserved.
검색어 입력폼
Category
  • 전체기사
  • 도시·부동산 
    • 전체
    • 도시정비
    • 입찰·분양
    • 서울·전국
  • 경제·IT 
    • 전체
    • IT경제
    • 금융·증권
    • AI·통신·유통
    • 인프라·신공법
  • 입법·정책 
    • 전체
    • 정책·법률
    • 정부·상임위
    • 세미나·토론회
  • 오피니언 
    • 전체
    • 사설·칼럼
    • 기자수첩
    • 인사동정
    • 생활·문화
    • 오늘의운세
  • 도경채 뉴스 
    • 전체
    • 만난사람들
    • 도시경제뉴스
    • 도경픽
    • 부동산픽