• AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
STORIUM
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
No Result
View All Result
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
No Result
View All Result
STORIUM
No Result
View All Result

ChatGPT GPT-5.5 Instant, 건강 응답 팩트 오류 71% 감소…무료 이용자도 적용

STORIUM 편집부 작성: STORIUM 편집부
2026년 06월 23일 15시 01분
Reading Time: 1 min read
A A
Home AI 서비스·툴
Share on FacebookShare on Twitter

OpenAI가 ChatGPT에 적용된 GPT-5.5 Instant 모델의 건강 분야 응답 품질 개선 결과를 공개했다. 최근 두 달간 실제 서비스 트래픽을 분석한 결과, 건강 관련 응답에서 팩트 오류 징후가 발견되는 비율이 71% 감소한 것으로 나타났다. 매주 2억3,000만 명 이상이 건강·의료 관련 질의에 ChatGPT를 사용하는 만큼, 이번 개선의 영향 범위는 상당하다고 OpenAI는 설명했다.

이번 성과의 배경에는 의사 주도(physician-led) 평가 체계가 있다. OpenAI는 60개국, 49개 언어, 26개 의학 전문 분야에 걸친 260명 이상의 의사 네트워크와 협력해 모델 응답의 정확성·명확성·완결성·주의사항 적절성을 평가해왔다. 현재까지 의사들이 검토한 모델 응답 샘플은 70만 건을 넘으며, 수분 간격으로 새로운 응답 검토가 이루어지고 있다. OpenAI는 GPT-5.5 Instant가 HealthBench 및 HealthBench Professional 평가에서 기존 대비 향상된 성과를 보였으며, 가장 어려운 건강 평가 항목에서는 프런티어 추론 모델(Thinking 모델) 수준에 근접하는 성능을 보였다고 밝혔다.

Smartphone displaying ChatGPT interface on a vibrant background, showcasing AI technology.
사진: Shantanu Kumar / Pexels

구체적인 개선 지점으로는 응급 상황 인지 능력 강화, 추가 맥락 정보를 적극적으로 요청하는 태도, 불확실한 상황에서 과도한 자신감을 드러내지 않는 표현 방식 등이 꼽혔다. 의사 응답과 모델 응답을 직접 비교한 평가에서 GPT-5.5 Instant는 지역별 의료 맥락 미반영, 위험 신호 누락, 사용자에게 필요한 추가 정보 요청 미비 등의 실패 항목에서 의사나 기존 모델보다 낮은 오류율을 기록했다. GPT-5.5 Instant는 무료 이용자에게도 제공되고 있어 개선된 건강 응답 품질을 더 광범위한 계층이 활용할 수 있다.

OpenAI는 ChatGPT for Clinicians, OpenAI for Healthcare 등 의료 전문가 대상 별도 서비스도 운영 중이다. 회사는 “인간 건강을 개선하는 것이 AGI(범용인공지능)의 가장 개인적이고 실질적인 영향 영역 중 하나”라며 정확성과 유용성을 지속적으로 높여나가겠다는 입장을 밝혔다. 건강 정보의 특성상 오류가 실질적 피해로 이어질 수 있는 만큼, 의사 참여 평가 체계의 규모와 지속성이 향후 모델 품질 개선의 핵심 변수가 될 전망이다.

Tags: ChatGPTGPT-5.5HealthBenchOpenAI의료AI
STORIUM 편집부

STORIUM 편집부

STORIUM 편집부 공식 계정

관련 기사

노트북 화면의 프로그래밍 코드
AI 서비스·툴

HuggingFace Hub, AI로 릴리스 노트 자동화…주간 배포 주기로 단축

2026년 06월 25일 10시 14분
2026-06-25-b53-cdata-ai-개발자-엔터프라이즈-데이터-접근-도구-3종-공개
AI 서비스·툴

CData, AI 개발자용 엔터프라이즈 데이터 접근 도구 3종 공개

2026년 06월 25일 10시 00분
2026-06-25-b53-멘로시큐리티-ai-에이전트의-과도한-권한이-위협
AI 서비스·툴

멘로시큐리티 MARS, AI 에이전트 3대 보안 위협에 대응하는 플랫폼 소개

2026년 06월 25일 09시 51분
How Businesses Are Building Specialized AI They Can Trust
AI 서비스·툴

엔비디아 Agent Toolkit, 기업용 특화 AI 에이전트 구축 오픈 플랫폼 공개

2026년 06월 25일 09시 17분
Next Post
영화 촬영 현장에 설치된 전문 영상 카메라

구글 딥마인드·A24, AI 영화 제작 연구 파트너십 체결…7500만 달러 투자

답글 남기기 응답 취소

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

  • 인기 급상승
  • 최신
A 3D rendering of a neural network with abstract neuron connections in soft colors.

퍼플렉시티, 로컬·클라우드 AI를 자동 판단하는 하이브리드 추론 시스템 발표

2026년 06월 04일 08시 53분
Close-up of a GeForce RTX graphics card on a desk, showcasing its design and technology.

엔비디아 RTX Spark, 윈도 노트북 판도 바꿀까…가격 걸림돌

2026년 06월 13일 09시 29분
Contemporary building with a glass facade and geometric patterns, low angle view.

앤트로픽·네이버 개발자 밋업 개최…서울 오피스 개소 앞두고 본사 임원 참석

2026년 06월 15일 20시 45분
책상에서 법률 문서에 서명하는 모습

클로드 ‘드리밍’ 기능 공개…앤트로픽, 법률·의료 AI 성능 대폭 향상

2026년 06월 15일 20시 45분
데이터센터 서버

구글, ‘제미나이 3.5 플래시’·AI 에이전트 ‘스파크’ 공개… 가격·사용자로 추격

2026년 06월 04일 15시 14분
노트북 화면의 프로그래밍 코드

HuggingFace Hub, AI로 릴리스 노트 자동화…주간 배포 주기로 단축

2026년 06월 25일 10시 14분
2026-06-25-b53-momentic-AI-코딩-시대-소프트웨어-테스트-플랫폼-업데이트

Momentic, AI 코딩 시대 소프트웨어 품질 검증 플랫폼 대규모 업데이트

2026년 06월 25일 10시 13분
A close-up view of various padlocks secured to a red wire fence, symbolizing security and unity.

클라우드플레어 “AI 해커 시대엔 사후 패치 아닌 사전 보안 구조 설계 필요”

2026년 06월 25일 10시 10분
2026-06-25-b53-cdata-ai-개발자-엔터프라이즈-데이터-접근-도구-3종-공개

CData, AI 개발자용 엔터프라이즈 데이터 접근 도구 3종 공개

2026년 06월 25일 10시 00분
2026-06-25-b53-exploring-the-societal-impacts-of-ai

MIT, AI가 민주주의·일자리에 미치는 영향 종합 포럼 개최

2026년 06월 25일 09시 57분

검색

No Result
View All Result

인기 태그

AI규제 AI반도체 AI보안 AI안전 AI에이전트 AI연구 AI인프라 AI정책 Anthropic arXiv AWS AX ChatGPT Claude Gemini IPO LLM MCP Microsoft NVIDIA OpenAI 강화학습 구글 데이터센터 마이크로소프트 멀티모달 멀티에이전트 메타 반도체 벤치마크 사이버보안 삼성전자 생성AI 생성형AI 스타트업 앤트로픽 에이전트 에이전트AI 에이전틱AI 엔비디아 오픈AI 오픈소스 의료AI 자율주행 피지컬AI

카테고리

  • AI 모델·연구 (755)
  • AI 서비스·툴 (492)
  • 반도체·인프라 (334)
  • 빅테크·기업 (377)
  • 산업 적용 (274)
  • 스타트업·투자 (183)
  • 정책·윤리 (312)

STORIUM은 트렌드와 인사이트를 전하는 종합 뉴스 매체입니다. 정확성, 균형, 맥락의 편집 원칙으로 신뢰받는 뉴스를 전합니다.

카테고리

  • AI 모델·연구
  • AI 서비스·툴
  • 반도체·인프라
  • 빅테크·기업
  • 산업 적용
  • 스타트업·투자
  • 정책·윤리

태그

AI규제 AI반도체 AI보안 AI안전 AI에이전트 AI연구 AI인프라 AI정책 Anthropic arXiv AWS AX ChatGPT Claude Gemini IPO LLM MCP Microsoft NVIDIA OpenAI 강화학습 구글 데이터센터 마이크로소프트 멀티모달 멀티에이전트 메타 반도체 벤치마크 사이버보안 삼성전자 생성AI 생성형AI 스타트업 앤트로픽 에이전트 에이전트AI 에이전틱AI 엔비디아 오픈AI 오픈소스 의료AI 자율주행 피지컬AI

최근 뉴스

노트북 화면의 프로그래밍 코드

HuggingFace Hub, AI로 릴리스 노트 자동화…주간 배포 주기로 단축

2026년 06월 25일 10시 14분
2026-06-25-b53-momentic-AI-코딩-시대-소프트웨어-테스트-플랫폼-업데이트

Momentic, AI 코딩 시대 소프트웨어 품질 검증 플랫폼 대규모 업데이트

2026년 06월 25일 10시 13분
  • 소개
  • 문의
  • 광고문의
  • 개인정보처리방침
  • 이용약관
  • 청소년보호정책
  • 정정·반론 보도 안내
  • 편집·윤리강령

주소: 경기 고양시 덕양구 꽃마을로 66, 한일미디어타워 15층
상호: 스토리움 |  사업자등록번호: 579-27-02025 |  대표자: 이국환
발행·편집인: 이국환 |  청소년보호책임자: 이국환 |  발행일자: 2025.01.01
스토리움의 모든 콘텐츠는 저작권법의 보호를 받는 바, 무단 전재·복사·배포 등은 법적 제재를 받을 수 있습니다.
© 2026 STORIUM. All Rights Reserved.

No Result
View All Result
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의

주소: 경기 고양시 덕양구 꽃마을로 66, 한일미디어타워 15층
상호: 스토리움 |  사업자등록번호: 579-27-02025 |  대표자: 이국환
발행·편집인: 이국환 |  청소년보호책임자: 이국환 |  발행일자: 2025.01.01
스토리움의 모든 콘텐츠는 저작권법의 보호를 받는 바, 무단 전재·복사·배포 등은 법적 제재를 받을 수 있습니다.
© 2026 STORIUM. All Rights Reserved.