• AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
STORIUM
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
No Result
View All Result
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
No Result
View All Result
STORIUM
No Result
View All Result

스타트업 Subquadratic, 희소 어텐션 LLM SubQ 공개…속도 56배·비용 300분의 1 주장

STORIUM 편집부 작성: STORIUM 편집부
2026년 06월 21일 14시 02분
Reading Time: 1 min read
A A
Home 스타트업·투자
Share on FacebookShare on Twitter

마이애미 기반 AI 스타트업 서브쿼드래틱(Subquadratic)이 대규모 언어 모델(LLM)의 근본적 병목인 ‘밀집 어텐션(dense attention)’ 문제를 해결했다고 주장하는 모델 SubQ를 공개하고 제3자 평가 결과를 내놓았다. AI 평가 전문 기업 에펜(Appen)이 수행한 독립 테스트 결과는 속도, 비용, 컨텍스트 창 길이 세 가지 측면에서 기존 최고 수준 모델들과 현격한 차이를 기록했다는 것이 핵심이다.

SubQ가 풀려는 문제는 트랜스포머 모델의 핵심 연산인 밀집 어텐션에서 비롯된다. 입력 텍스트 길이가 두 배 늘어나면 연산량이 약 네 배 증가하는 2차(quadratic) 확장이 일어나, 긴 텍스트를 처리할수록 연산 비용·전력 소비·속도가 급격히 나빠진다. 서브쿼드래틱의 접근법은 이 밀집 어텐션을 ‘희소 어텐션(sparse attention)’으로 대체하는 것이다. 모든 토큰 쌍을 곱하는 대신 의미 있는 관계를 갖는 일부만 선택해 곱하며, 어떤 쌍이 중요한지를 텍스트마다 동적으로 계산한다는 것이 기존 희소 어텐션 시도들과 다르다고 주장하는 지점이다. 선택 메커니즘의 구체적 방식은 영업 비밀이라고 밝혔다.

A startup claims it broke through a bottleneck that's holding back LLMs
이미지 출처: 원문 (A startup claims it broke through a bottleneck that’s holding back LLMs)

에펜의 독립 평가 결과는 인상적이다. 속도 기준 테스트에서 SubQ는 이전 희소 어텐션 기술인 플래시어텐션(FlashAttention) 대비 56배 빠른 속도를 기록했다. 실제 코딩 대회 문제로 성능을 측정하는 라이브코드벤치(LiveCodeBench)에서는 89.7%를 기록해 최상위권 코딩 모델들과 비슷한 수준을 보였다. 컨텍스트 창 길이는 최대 1,200만 토큰으로 대부분의 최고 수준 모델이 제공하는 100만 토큰의 12배다. 비용 측면에서는 앤트로픽(Anthropic)의 Opus 4.6 모델을 RULER 128로 실행하는 데 2,600달러가 드는 반면, SubQ로 같은 작업을 수행하는 비용은 8달러라고 공동 창업자 겸 CEO 저스틴 당엘(Justin Dangel)이 밝혔다. 에펜 생성형 AI 리서치 디렉터 지닌 시나난-싱(Jeanine Sinanan-Singh)은 “이것은 게임 체인저가 될 수 있지만, 충격적인 결과일수록 스스로 말하게 해서는 신뢰성이 낮다”고 덧붙였다.

회의론은 여전히 상당하다. 인디펜던트 AI 연구자 윌 드퓨(Will Depue, 전 오픈AI 재직)는 희소 어텐션 아이디어 자체는 이미 “해 아래 새것이 없을 만큼 시도됐다”며 성공은 “4분 마일을 깨는 것과 비슷한 수준”이라고 평가했다. 또한 서브쿼드래틱이 SubQ를 처음부터 새로 학습시킨 것이 아니라 중국 오픈소스 모델 Qwen의 가중치를 재사용해 부트스트랩했다는 점은 아키텍처를 완전히 재발명했다는 주장과 상충한다. SubQ가 아직 일반에 공개되지 않아 독립적으로 재현 테스트를 할 수 없다는 점도 신중론의 근거다. 현재 조기 접근 대기자가 수만 명, 기업 고객만 500개 이상에 달한다고 밝혔지만 실제 서비스 접근은 극히 제한적이다.

이 기술이 성숙한다면 국내 AI 시장에도 중요한 시사점을 갖는다. 만약 SubQ가 주장하는 수준의 효율화가 실제 프로덕션 환경에서 재현된다면 동일 예산으로 훨씬 많은 사용자를 처리하거나, 법률 문서·기업 보고서·의료 기록처럼 긴 컨텍스트가 필요한 분야에서 의미 있는 변화가 가능해진다. 공동 창업자 알렉스 웨던(Alex Whedon)은 “몇 년 안에 아무도 트랜스포머 위에서 개발하지 않게 될 것”이라고 자신감을 내비쳤지만, 이 주장의 실현 여부는 오직 더 광범위한 독립 검증을 통해서만 확인될 수 있다. 흥미로운 주장이 나왔다는 것은 분명하지만, 검증이 완료되기 전까지 신중한 관망이 합리적 태도다.

Tags: AI 효율성LLMSubquadratic트랜스포머희소 어텐션
STORIUM 편집부

STORIUM 편집부

STORIUM 편집부 공식 계정

관련 기사

Detailed view of Ethernet and VGA ports on a server highlighting connectivity features.
스타트업·투자

베이스텐, AI 추론 스타트업 15억 달러 투자유치…반년 만에 기업가치 160% 급등

2026년 06월 21일 15시 31분
A vibrant workspace showing computer monitors with code, keyboard, and tech accessories.
스타트업·투자

시스코 AI, FAPO 공개…Claude Code로 LLM 파이프라인 프롬프트 자동 최적화

2026년 06월 21일 13시 34분
Close-up of sleek security cameras ensuring safety and privacy in indoor settings.
스타트업·투자

슈퍼브AI, CVPR 2026 비전AI 챌린지 종합 우승…한국 기업 최초

2026년 06월 20일 08시 19분
Two business professionals shaking hands with financial graphs on digital devices.
스타트업·투자

치화치엔 VC, AI 진짜 승자는 AI를 판매하지 않는 기업

2026년 06월 20일 08시 06분
Next Post
Close-up of an indoor ceiling-mounted security camera for surveillance applications.

드제이원, AI 객체 추적 국제대회 MOT20 세계 1위…HOTA 67.4점 기록

답글 남기기 응답 취소

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

  • 인기 급상승
  • 최신
A 3D rendering of a neural network with abstract neuron connections in soft colors.

퍼플렉시티, 로컬·클라우드 AI를 자동 판단하는 하이브리드 추론 시스템 발표

2026년 06월 04일 08시 53분
Close-up of a GeForce RTX graphics card on a desk, showcasing its design and technology.

엔비디아 RTX Spark, 윈도 노트북 판도 바꿀까…가격 걸림돌

2026년 06월 13일 09시 29분
Contemporary building with a glass facade and geometric patterns, low angle view.

앤트로픽·네이버 개발자 밋업 개최…서울 오피스 개소 앞두고 본사 임원 참석

2026년 06월 15일 20시 45분
책상에서 법률 문서에 서명하는 모습

클로드 ‘드리밍’ 기능 공개…앤트로픽, 법률·의료 AI 성능 대폭 향상

2026년 06월 15일 20시 45분
데이터센터 서버

구글, ‘제미나이 3.5 플래시’·AI 에이전트 ‘스파크’ 공개… 가격·사용자로 추격

2026년 06월 04일 15시 14분
샘 올트먼 오픈AI CEO

샘 올트먼 다룬 영화 ‘아티피셜’, 아마존 MGM 배급 포기…새 배급사 물색

2026년 06월 21일 17시 19분
Stunning aerial view of Apple Park in Cupertino, California during a beautiful sunset.

애플 시리, iOS 27서 독립형 AI 챗봇 앱으로 전면 재설계…GPT·제미나이 전환 지원

2026년 06월 21일 17시 14분
A close-up of a vintage motherboard highlighting microchips and electronic components.

SK하이닉스 HBM4E 12단 샘플 조기 출하…최태원 회장, 머스크와 AI 동맹 추진

2026년 06월 21일 16시 45분
A laptop showing an analytics dashboard with charts and graphs, symbolizing modern data analysis tools.

Data2Story, CSV 파일 하나로 7개 AI 에이전트가 검증된 인터랙티브 기사 자동 생성

2026년 06월 21일 16시 32분
microsoft product copilot chat

마이크로소프트 Windows MXC, AI 에이전트 보안 컨테이너 표준 도전

2026년 06월 21일 16시 28분

검색

No Result
View All Result

인기 태그

AI규제 AI반도체 AI보안 AI안전 AI에이전트 AI연구 AI인프라 AI정책 Anthropic arXiv AWS ChatGPT Claude Gemini IPO LLM MCP Microsoft NVIDIA OpenAI 강화학습 구글 데이터센터 마이크로소프트 멀티모달 멀티에이전트 메타 반도체 벤치마크 사이버보안 삼성전자 생성AI 생성형AI 스타트업 앤트로픽 에이전트 에이전트AI 에이전틱AI 엔비디아 오픈AI 오픈소스 의료AI 자율주행 젠슨황 피지컬AI

카테고리

  • AI 모델·연구 (731)
  • AI 서비스·툴 (382)
  • 반도체·인프라 (291)
  • 빅테크·기업 (334)
  • 산업 적용 (246)
  • 스타트업·투자 (161)
  • 정책·윤리 (275)

STORIUM은 트렌드와 인사이트를 전하는 종합 뉴스 매체입니다. 정확성, 균형, 맥락의 편집 원칙으로 신뢰받는 뉴스를 전합니다.

카테고리

  • AI 모델·연구
  • AI 서비스·툴
  • 반도체·인프라
  • 빅테크·기업
  • 산업 적용
  • 스타트업·투자
  • 정책·윤리

태그

AI규제 AI반도체 AI보안 AI안전 AI에이전트 AI연구 AI인프라 AI정책 Anthropic arXiv AWS ChatGPT Claude Gemini IPO LLM MCP Microsoft NVIDIA OpenAI 강화학습 구글 데이터센터 마이크로소프트 멀티모달 멀티에이전트 메타 반도체 벤치마크 사이버보안 삼성전자 생성AI 생성형AI 스타트업 앤트로픽 에이전트 에이전트AI 에이전틱AI 엔비디아 오픈AI 오픈소스 의료AI 자율주행 젠슨황 피지컬AI

최근 뉴스

샘 올트먼 오픈AI CEO

샘 올트먼 다룬 영화 ‘아티피셜’, 아마존 MGM 배급 포기…새 배급사 물색

2026년 06월 21일 17시 19분
Stunning aerial view of Apple Park in Cupertino, California during a beautiful sunset.

애플 시리, iOS 27서 독립형 AI 챗봇 앱으로 전면 재설계…GPT·제미나이 전환 지원

2026년 06월 21일 17시 14분
  • 소개
  • 문의
  • 광고문의
  • 개인정보처리방침
  • 이용약관
  • 청소년보호정책
  • 정정·반론 보도 안내
  • 편집·윤리강령

주소: 경기 고양시 덕양구 꽃마을로 66, 한일미디어타워 15층
상호: 스토리움 |  사업자등록번호: 579-27-02025 |  대표자: 이국환
발행·편집인: 이국환 |  청소년보호책임자: 이국환 |  발행일자: 2025.01.01
스토리움의 모든 콘텐츠는 저작권법의 보호를 받는 바, 무단 전재·복사·배포 등은 법적 제재를 받을 수 있습니다.
© 2026 STORIUM. All Rights Reserved.

No Result
View All Result
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의

주소: 경기 고양시 덕양구 꽃마을로 66, 한일미디어타워 15층
상호: 스토리움 |  사업자등록번호: 579-27-02025 |  대표자: 이국환
발행·편집인: 이국환 |  청소년보호책임자: 이국환 |  발행일자: 2025.01.01
스토리움의 모든 콘텐츠는 저작권법의 보호를 받는 바, 무단 전재·복사·배포 등은 법적 제재를 받을 수 있습니다.
© 2026 STORIUM. All Rights Reserved.