• AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
STORIUM
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
No Result
View All Result
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
No Result
View All Result
STORIUM
No Result
View All Result

씽킹머신랩, 풀덱플렉스 AI ‘TML-Interaction-Small’ 공개

STORIUM 편집부 작성: STORIUM 편집부
2026년 05월 30일 21시 11분
Home AI 모델·연구
Share on FacebookShare on Twitter

전 오픈AI(OpenAI) CTO 미라 무라티(Mira Murati)가 이끄는 씽킹머신랩(Thinking Machines Lab)이 5월 11일(현지시간) 첫 번째 모델 ‘TML-Interaction-Small’을 공개했다. 200ms 단위 마이크로턴 구조로 사람처럼 말하면서 동시에 듣는 풀덱플렉스(full-duplex) 음성 대화를 구현하며, 응답 레이턴시 0.40초를 달성했다고 밝혔다.

검은 배경에 네온 컬러 음성 파형 시각화 — 풀덱플렉스 실시간 음성 AI 기술 상징
사진: Jumping Jax / Unsplash

TML-Interaction-Small은 MoE(Mixture of Experts, 전문가 혼합) 아키텍처를 채택해 총 파라미터 276B(억) 중 실제 추론에 활성화되는 파라미터는 12B다. 인코더 없는 얼리 퓨전(early fusion) 방식으로 오디오·비디오·텍스트를 연속 스트림으로 동시 처리한다. 씽킹머신랩이 자체 공개한 실시간 대화 평가 기준 FD-bench V1.5에서 77.8점을 기록했다. 같은 기준으로 지피티 리얼타임-2.0(GPT-realtime-2.0)은 46.8점, 제미나이-3.1-플래시-라이브(Gemini-3.1-flash-live)는 54.3점으로 나타났다. 응답 레이턴시도 TML이 0.40초인 반면, GPT-realtime 계열은 1.18~1.63초 수준으로 측정됐으며, Gemini-3.1-flash-live(minimal)는 0.57초로 TML과 근접한 수준이다. 지능 벤치마크에서도 오디오 멀티챌린지(Audio MultiChallenge) APR 43.4%, 빅벤치 오디오(BigBench Audio) 75.7%/96.5%, IFEval(텍스트) 89.7%를 기록했다.

현재 TML-Interaction-Small은 제한적 리서치 프리뷰 단계다. 씽킹머신랩에 따르면 프리뷰는 수개월 내 시작되며 정식 출시는 2026년 하반기로 예정돼 있다. 씽킹머신랩은 오픈AI 전 CTO 미라 무라티가 2024년 10월 오픈AI를 퇴사한 직후 창업한 스타트업으로(TechCrunch, 2025.02.18), 2025년 6월 20억 달러 규모 시드 라운드를 클로징했다(TechCrunch, 2025.06.20). 풀덱플렉스 AI는 국내 콜센터·고객서비스 자동화 및 음성 에이전트 도입을 검토하는 기업에 실질적인 기술 선택지가 될 것으로 관측된다. 지금까지 실시간 음성 AI의 주요 약점으로 꼽혔던 높은 레이턴시와 끊김 없는 양방향 대화의 한계를 수치상으로 의미 있게 좁혔다는 점에서 업계가 주목하고 있다.

Tags: full-duplexLLMMira MuratiMoEmultimodalrealtime AIThinking Machines Lab
STORIUM 편집부

STORIUM 편집부

STORIUM 편집부 공식 계정

Next Post
표면에 'a' 글자가 새겨진 AI GPU 프로세서 칩 3D 렌더링

앤트로픽, 클로드 에이전트 '드리밍' 기능 공개… 법률·의료 AI 성능 대폭 향상

답글 남기기 응답 취소

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

STORIUM은 트렌드와 인사이트를 전하는 종합 뉴스 매체입니다. 정확성, 균형, 맥락의 편집 원칙으로 신뢰받는 뉴스를 전합니다.

카테고리

  • AI 모델·연구
  • AI 서비스·툴
  • 반도체·인프라
  • 빅테크·기업
  • 산업 적용
  • 스타트업·투자
  • 정책·윤리

태그

AI 검색 AI과학 AI규제 AI안전 AI 에이전트 AI에이전트 AI 인프라 AI 코딩 Anthropic AWS Claude Co-Scientist Gemini IPO LLM OpenAI SynthID 검색 구글 구글 딥마인드 기업공개 노동시장 데이터센터 딥시크 마이크로소프트 멀티모달 멀티에이전트 메타 반도체 생산성 스노우플레이크 스타트업 투자 스페이스X 아마존 앤트로픽 에이전트 엔비디아 오픈AI 오픈소스 오픈소스 로봇 중국 챗GPT 클라우드 클로드 허깅페이스

최근 뉴스

유럽의회 스트라스부르 루이즈 바이스 건물 반원형 의회장 내부

EU AI법 옴니버스 합의: 기한 최대 16개월가량 연장, 딥페이크 신규 금지

2026년 05월 30일 21시 11분
그로크 LPU v1 칩 다이 사진

그로크, 기존 투자자 대상 6.5억 달러 추가 조달 추진

2026년 05월 31일 00시 20분
  • 소개
  • 문의
  • 광고문의
  • 개인정보처리방침
  • 이용약관
  • 청소년보호정책

© 2026 STORIUM. All rights reserved. 트렌드와 인사이트.

No Result
View All Result
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의

© 2026 STORIUM. All rights reserved. 트렌드와 인사이트.