Binarygap Terminal

제미나이 3.5 라이브 번역 — 매끄럽고 자연스러운 음성 번역

구글, 실시간 음성 대 음성(speech-to-speech) 번역 모델 ‘제미나이 3.5 라이브 번역(Gemini 3.5 Live Translate)’ 출시. 70개 이상 언어를 자동 감지하며 화자의 억양, 속도, 음높이를 유지한 자연스러운 번역 음성을 생성.

핵심 요점

  1. 스트리밍 실시간 번역: 순차적(turn-by-turn) 방식이 아닌, 화자보다 몇 초 뒤에서 번역을 이어가는 스트리밍 방식. 어색한 끊김 없이 맥락을 고려한 번역.
  2. 70개+ 언어 지원: 언어 자동 감지, 2,000개 이상 언어 조합 가능. 기존 5개 언어에서 대폭 확대.
  3. SynthID 워터마크: AI 생성 오디오에 감지 불가능한 워터마크 삽입, 가짜 정보 확산 방지.
  4. 듣기 모드 (안드로이드): 헤드폰 없이 휴대폰 수화기로 번역 청취 가능.

제공 경로

  • 개발자: Gemini Live API / Google AI Studio (퍼블릭 프리뷰)
  • 기업: Google Meet (프라이빗 프리뷰, 5개→70개 언어)
  • 일반 이용자: Android/iOS 구글 번역 앱

파트너사

  • Grab: 픽업 시 운전기사-여행자 간 실시간 다국어 통역 테스트 중 (월 1,000만+ 음성 통화)
  • CJ ENM, LiveKit 등 긍정적 피드백

주요 통합 플랫폼

Agora, Fishjam, LiveKit, Pipecast, VisionAgents


관련 개체: 구글