구글(Google)이 70개 이상 언어를 수 초 이내 지연으로 실시간 통역하는 인공지능 모델 ‘제미나이 3.5 라이브 트랜슬레이트(Gemini 3.5 Live Translate)’를 9일(현지시각) 공개했다. 기존 번역 앱과 달리 상대방 발화가 끝나기를 기다리지 않고 말이 입력되는 즉시 번역 음성을 생성하는 ‘연속 스트리밍’ 방식을 채택했다. 구글은 문맥 파악을 위한 대기와 즉각 번역 사이의 균형을 맞췄다고 설명했으며, 소음이 많은 환경과 여러 언어가 뒤섞인 대화에서도 자동으로 해당 언어를 감지해 작동한다.
음성 품질도 기존 문자음성변환(TTS) 방식과 차별화됐다. 말하는 사람의 억양·속도·음높이를 보존하고 감정 톤까지 살려 번역 음성이 기계적으로 들리지 않도록 설계됐다. 안드로이드 기기에서는 ‘청취 모드’가 새로 추가돼 이어폰 없이 스마트폰을 귀에 대는 것만으로 통역 음성을 혼자 들을 수 있다. 구글은 동남아 차량 공유 플랫폼 그랩(Grab)에 이 기술을 시범 적용했다고 밝혔다. 그랩 앱에서는 운전자와 승객 간 음성 통화가 월 1000만 건 이상 발생해 다국어 소통 수요가 특히 높다. 생성된 번역 음성에는 AI 콘텐츠임을 식별하는 신스아이디(SynthID) 워터마크가 삽입돼 딥페이크 악용을 차단한다.


화상회의 서비스인 구글 미트(Google Meet)에도 이달부터 적용된다. 기존에는 영어를 기준으로 스페인어·프랑스어·독일어·포르투갈어·이탈리아어 등 5개 언어만 지원했으나, 이번에 지원 언어를 70개로 확대한다. 구글은 기업용 구글 워크스페이스(Workspace) 고객을 대상으로 비공개 시사회를 시작했으며 연내 전면 확대할 계획이다. 언어 장벽 없이 일상 대화가 가능한 수준을 목표로 한다는 구글의 선언은 실시간 AI 통역 기술이 범용 커뮤니케이션 인프라로 자리 잡는 과정이 가속화되고 있음을 보여준다.














