• AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
STORIUM
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
No Result
View All Result
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
No Result
View All Result
STORIUM
No Result
View All Result

이미지 속 객체 세기, AI로 해결한다…’카운트 애니씽’ 공개

STORIUM 편집부 작성: STORIUM 편집부
2026년 06월 14일 21시 10분
Reading Time: 1 min read
A A
Home AI 모델·연구
Share on FacebookShare on Twitter

칭화대학교(Tsinghua University) 등 공동 연구팀이 텍스트 프롬프트만으로 이미지 내 객체 수를 세는 AI 모델 ‘카운트 애니씽(Count Anything)’을 공개했다. 군중 속 인원, 위성 사진 속 차량, 의료 영상 속 세포, 배양 접시 속 균 집락 등 서로 이질적인 시각 도메인을 단일 모델로 처리하는 것이 핵심이다.

카운트 애니씽은 두 가지 탐지 방식을 병렬로 운용한 뒤 결과를 통합한다. 하나는 크고 선명한 객체에 바운딩 박스를 그리는 방식이고, 다른 하나는 밀집된 소형 객체 위에 점을 찍는 방식이다. 두 예측이 동일 대상을 가리킬 경우 신뢰도가 높은 쪽만 채택해 중복 집계를 막는다. 모델은 메타(Meta)의 사전학습 모델인 SAM3를 기반으로 하며, 전체 파라미터를 재학습하지 않고 소형 어댑터 모듈만 추가해 계산 효율을 높였다.

연구팀은 이 모델을 훈련하기 위해 기존에 목적별로 분산돼 있던 공개 데이터셋을 통합·정제해 CLOC라는 새 데이터셋을 구축했다. CLOC는 일상 사진, 위성·드론 영상, 의료 조직 샘플, 현미경 세포 이미지, 밀이삭 등 농업 이미지, 세균 배양 사진 등 여섯 개 도메인에 걸쳐 약 22만 장 이미지와 619개 범주, 1500만 개 레이블 객체를 포함한다고 연구팀은 밝혔다. 연구팀은 이를 현재까지 가장 큰 텍스트 유도 계수(text-guided counting) 데이터셋으로 소개했다.

팀이 자체 진행한 비교 실험에서 카운트 애니씽은 CountGD, CLIP-Count, Grounding DINO 등 경쟁 모델을 앞섰다. 카운트 애니씽은 이미지당 쿼리 범주 기준 평균 오차가 약 9개인 반면, 최상위 경쟁 모델의 오차는 그 두 배를 웃돌았다. 다만 군중 전용 계수에서는 특화 모델에 비해 소폭 뒤처진다고 연구팀은 인정했다. 객체 개념이 모호하거나 극도로 밀집된 장면에서 예측이 중복되는 한계도 여전히 남아 있으며, 카운트 애니씽의 코드는 깃허브(GitHub)에 공개됐다. 한편 AI의 시각 기초 역량을 검증하는 베이비비전(BabyVision) 벤치마크에서 구글의 제미나이(Gemini) 3 프로를 포함한 최상위 모델들도 만 3세 어린이 평균에 못 미치는 점수를 기록하는 등, 객체 수 세기와 같은 기초 시각 과제가 AI에게 여전히 난제임을 보여주는 결과가 잇따르고 있다.

Tags: CLOCCount AnythingSAM3객체 인식멀티모달AI칭화대
STORIUM 편집부

STORIUM 편집부

STORIUM 편집부 공식 계정

관련 기사

Image of a cleanroom in a medical facility featuring sterile equipment and a person in protective clothing.
AI 모델·연구

신호처리·기억·발광 한 번에…서울대, 만능 반도체 개발

2026년 06월 14일 19시 35분
Stunning red rock formations against a clear blue sky, showcasing natural texture patterns.
AI 모델·연구

문샷AI, 코딩 특화 Kimi K2.7 Code 공개… GPT-5.5 대비 최대 12배 저렴

2026년 06월 13일 18시 51분
Autonomous delivery robot navigating indoors during a technology event.
AI 모델·연구

NHN, 양철웅 CTO 선임…그룹 AX 전략 본격화

2026년 06월 13일 18시 41분
A modern office building and urban landscape captured at sunset, showcasing architecture and open social space.
AI 모델·연구

앤스로픽, 첫 데이터센터 임대 계약…클로드 인프라 자립 나선다

2026년 06월 13일 18시 20분
Next Post
도시 CCTV 감시 카메라 — AI 감시 일상화

AI가 채용하고 배차하고 평가한다…'감시의 일상화'와 제도 공백

답글 남기기 응답 취소

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

  • 인기 급상승
  • 최신
A 3D rendering of a neural network with abstract neuron connections in soft colors.

퍼플렉시티, 로컬·클라우드 AI를 자동 판단하는 하이브리드 추론 시스템 발표

2026년 06월 04일 08시 53분
Close-up of a GeForce RTX graphics card on a desk, showcasing its design and technology.

엔비디아 RTX Spark, 윈도 노트북 판도 바꿀까…가격 걸림돌

2026년 06월 13일 09시 29분
책상에서 법률 문서에 서명하는 모습

앤트로픽, 클로드 에이전트 ‘드리밍’ 기능 공개… 법률·의료 AI 성능 대폭 향상

2026년 06월 04일 15시 19분
데이터센터 서버

구글, ‘제미나이 3.5 플래시’·AI 에이전트 ‘스파크’ 공개… 가격·사용자로 추격

2026년 06월 04일 15시 14분
아마존 AWS 데이터센터 전경

아마존, ‘AI 사용량 순위표’ 폐기… 직원들 ‘토큰맥싱’에 역효과

2026년 06월 04일 15시 18분
Young woman exploring virtual reality with VR headset indoors, surrounded by colorful lights.

프롬프트로 게임 만드는 시대 왔다…구글·국내 기업 잇달아 도전

2026년 06월 14일 23시 22분
Detailed shot of Ethernet cables connected to server ports highlighting technology infrastructure.

AI가 공격하고 AI가 막는다…’AI 보안주권’ 국가 전략 과제로 부상

2026년 06월 14일 23시 14분
젠슨 황 엔비디아 CEO

엔비디아 AI 팩토리, 기존 데이터센터와 다른 이유

2026년 06월 14일 23시 04분
CPU 프로세서 칩 메인보드 — 인텔 CPU

인텔, 컴퓨텍스 2026서 글로벌 동맹 결집…HP·레노버·네이버와 AI 플랫폼 전략

2026년 06월 14일 22시 50분
Busy indoor electronics market with modern design and engaged shoppers.

중국 선전 화창베이, AI 기기가 커플 기념일 선물 시장 주도

2026년 06월 14일 22시 34분

검색

No Result
View All Result

인기 태그

AI규제 AI반도체 AI보안 AI안전 AI에이전트 AI연구 AI인프라 AI정책 Anthropic arXiv AWS ChatGPT Claude Gemini IPO LLM MCP Microsoft NVIDIA OpenAI 강화학습 구글 데이터센터 마이크로소프트 멀티모달 멀티에이전트 메타 반도체 벤치마크 보안 사이버보안 생성AI 생성형AI 스타트업 앤트로픽 에이전트 에이전트AI 에이전틱AI 엔비디아 오픈AI 오픈소스 의료AI 자율주행 젠슨황 피지컬AI

카테고리

  • AI 모델·연구 (543)
  • AI 서비스·툴 (232)
  • 반도체·인프라 (240)
  • 빅테크·기업 (261)
  • 산업 적용 (190)
  • 스타트업·투자 (127)
  • 정책·윤리 (217)

STORIUM은 트렌드와 인사이트를 전하는 종합 뉴스 매체입니다. 정확성, 균형, 맥락의 편집 원칙으로 신뢰받는 뉴스를 전합니다.

카테고리

  • AI 모델·연구
  • AI 서비스·툴
  • 반도체·인프라
  • 빅테크·기업
  • 산업 적용
  • 스타트업·투자
  • 정책·윤리

태그

AI규제 AI반도체 AI보안 AI안전 AI에이전트 AI연구 AI인프라 AI정책 Anthropic arXiv AWS ChatGPT Claude Gemini IPO LLM MCP Microsoft NVIDIA OpenAI 강화학습 구글 데이터센터 마이크로소프트 멀티모달 멀티에이전트 메타 반도체 벤치마크 보안 사이버보안 생성AI 생성형AI 스타트업 앤트로픽 에이전트 에이전트AI 에이전틱AI 엔비디아 오픈AI 오픈소스 의료AI 자율주행 젠슨황 피지컬AI

최근 뉴스

Young woman exploring virtual reality with VR headset indoors, surrounded by colorful lights.

프롬프트로 게임 만드는 시대 왔다…구글·국내 기업 잇달아 도전

2026년 06월 14일 23시 22분
Detailed shot of Ethernet cables connected to server ports highlighting technology infrastructure.

AI가 공격하고 AI가 막는다…’AI 보안주권’ 국가 전략 과제로 부상

2026년 06월 14일 23시 14분
  • 소개
  • 문의
  • 광고문의
  • 개인정보처리방침
  • 이용약관
  • 청소년보호정책
  • 정정·반론 보도 안내
  • 편집·윤리강령

주소: 경기 고양시 덕양구 꽃마을로 66, 한일미디어타워 15층
상호: 스토리움 |  사업자등록번호: 579-27-02025 |  대표자: 이국환
발행·편집인: 이국환 |  청소년보호책임자: 이국환 |  발행일자: 2025.01.01
스토리움의 모든 콘텐츠는 저작권법의 보호를 받는 바, 무단 전재·복사·배포 등은 법적 제재를 받을 수 있습니다.
© 2026 STORIUM. All Rights Reserved.

No Result
View All Result
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의

주소: 경기 고양시 덕양구 꽃마을로 66, 한일미디어타워 15층
상호: 스토리움 |  사업자등록번호: 579-27-02025 |  대표자: 이국환
발행·편집인: 이국환 |  청소년보호책임자: 이국환 |  발행일자: 2025.01.01
스토리움의 모든 콘텐츠는 저작권법의 보호를 받는 바, 무단 전재·복사·배포 등은 법적 제재를 받을 수 있습니다.
© 2026 STORIUM. All Rights Reserved.