• AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
STORIUM
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
No Result
View All Result
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
No Result
View All Result
STORIUM
No Result
View All Result

엔비디아 블랙웰, 금융 LLM 추론 STAC-AI 벤치마크 신기록 수립

STORIUM 편집부 작성: STORIUM 편집부
2026년 06월 01일 19시 54분
Home 산업 적용
Share on FacebookShare on Twitter

엔비디아(NVIDIA)의 블랙웰(Blackwell) 아키텍처 기반 HGX B200이 금융 산업 표준 AI 성능 벤치마크인 STAC-AI LANG6에서 신기록을 달성했다. 전략 기술 분석 센터(STAC, Strategic Technology Analysis Center)가 15년 이상 운영해 온 이 벤치마크는 RAG(검색 증강 생성)와 LLM 추론 파이프라인의 종단간 성능을 측정한다.

이번 벤치마크는 라마(Llama) 3.1 8B와 70B 인스트럭트 모델에 EDGAR 10-K 공시 기반의 금융 전용 데이터셋을 적용해 진행됐다. EDGAR4는 중간 길이의 맥락을, EDGAR5는 단일 기업의 전체 연간보고서를 처리하는 장문 맥락 시나리오에 해당한다. 결과적으로 HGX B200은 배치 모드에서 라마 3.1 8B 기준 초당 5만 2,823 단어(WPS), 라마 3.1 70B 기준 초당 1만 2,040 단어를 처리하며 이전 세대 GH200 대비 최대 2.8배 높은 처리량을 기록했다. NVFP4 양자화를 적용한 블랙웰은 기존 FP8 기반 호퍼 아키텍처와 비교해도 뚜렷한 우위를 보였다.

Three NVIDIA GeForce RTX graphics cards stacked on a surface, showcasing their sleek design and branding details.
사진: Andrey Matveev / Pexels

이번 테스트에는 HPE, 슈퍼마이크로(Supermicro), Lambda 세 파트너사의 시스템이 참여했다. HPE ProLiant DL384 Gen12(GH200 기반), Lambda의 클라우드 HGX B200 인스턴스, Red Hat OpenShift 위에서 구동된 슈퍼마이크로의 RTX PRO 6000 블랙웰 2-GPU 구성이 각각 벤치마크를 통과했다. 슈퍼마이크로 시스템은 컨테이너화된 쿠버네티스 환경이 GPU 집약적 LLM 추론에서 측정 가능한 오버헤드를 발생시키지 않는다는 점도 확인했다. 엔비디아는 GH200 기반의 호퍼 세대 역시 출시 3년이 지난 현재에도 금융 기관의 배치 및 인터랙티브 추론 모두에서 유효한 성능을 유지한다고 밝혔다.

금융 기관들은 LLM을 통해 뉴스·소셜미디어 감성·실적 보고서·시장 데이터를 종합 분석해 주가 움직임을 예측하거나 투자 전략을 자동화하는 방향으로 AI 도입을 가속화하고 있다. STAC-AI 벤치마크는 실제 서버 사이드 토크나이징을 포함해 리얼 배포 시나리오를 재현하는 점에서 차별화되며, 블랙웰의 이번 기록은 이러한 금융 업계 수요에 직접적으로 대응한다.

Tags: BlackwellLLM 추론NVIDIASTAC-AI금융 AI벤치마크
STORIUM 편집부

STORIUM 편집부

STORIUM 편집부 공식 계정

Next Post
NVIDIA DSX OS

엔비디아 DSX OS, AI 팩토리 대규모 운영을 위한 오픈 모듈형 소프트웨어 공개

답글 남기기 응답 취소

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

STORIUM은 트렌드와 인사이트를 전하는 종합 뉴스 매체입니다. 정확성, 균형, 맥락의 편집 원칙으로 신뢰받는 뉴스를 전합니다.

카테고리

  • AI 모델·연구
  • AI 서비스·툴
  • 반도체·인프라
  • 빅테크·기업
  • 산업 적용
  • 스타트업·투자
  • 정책·윤리

태그

AI과학 AI규제 AI보안 AI안전 AI에이전트 AI 에이전트 AI인프라 Anthropic AWS ChatGPT Claude Co-Scientist Gemini GPU IPO LLM MCP NVIDIA OpenAI 강화학습 거버넌스 구글 기업공개 데이터센터 마이크로소프트 멀티모달 메타 반도체 벤치마크 보안 생산성 스타트업 스페이스X 시뮬레이션 아마존 앤트로픽 에이전트 엔비디아 엔터프라이즈 오픈AI 오픈소스 중국 클라우드 클로드 허깅페이스

최근 뉴스

Futuristic abstract artwork showcasing AI concepts with digital text overlays.

2026 음성합성 모델 현황: 구글·인월드·카르테시아가 선두

2026년 06월 01일 23시 57분
Smartphone displaying Alipay app on open laptop with online shopping site.

틱톡, 쇼핑·여행·금융 통합 슈퍼앱 전환 가속

2026년 06월 01일 23시 53분
  • 소개
  • 문의
  • 광고문의
  • 개인정보처리방침
  • 이용약관
  • 청소년보호정책

© 2026 STORIUM. All rights reserved. 트렌드와 인사이트.

No Result
View All Result
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의

© 2026 STORIUM. All rights reserved. 트렌드와 인사이트.