AWS가 멀티모달 AI 모델 Amazon Nova 2 Lite를 활용해 별도의 모델 학습 없이 객체 탐지 애플리케이션을 구축하는 방법을 2026년 6월 공식 머신러닝 블로그에 공개했다. Amazon Bedrock을 통해 Nova 2 Lite에 접근하고, AWS Lambda와 Amazon API Gateway를 결합한 서버리스 아키텍처로 30~45분 내 배포가 가능한 구현 방식이다.
Nova 2 Lite는 “vehicle”이나 “stop sign” 같은 자연어 프롬프트로 이미지 내 객체를 탐지하고, 탐지된 각 객체의 바운딩 박스(bounding box) 좌표를 0~1000 스케일의 정규화된 JSON 형식으로 반환한다. 개발자는 이 좌표를 픽셀 단위로 변환한 뒤 원본 이미지 위에 탐지 결과를 시각화할 수 있다. AWS는 구체적인 프롬프트 템플릿 설계 방법과 함께 전체 소스 코드를 GitHub에 공개했으며, CDK(Cloud Development Kit)로 원클릭 배포가 가능하다. 이미지 1만 장 처리 비용은 약 5.69달러 수준으로 추정된다.

실제 적용 사례로는 제조업의 스크래치·덴트·녹 탐지를 통한 품질 관리, 5000에이커 농지 드론 이미지에서의 병해 판별, 물류 센터의 파손 패키지 자동 분류 등이 제시됐다. 기존에는 이런 업무에 전문 데이터 사이언스 팀과 대규모 훈련 인프라가 필요했지만, Nova 2 Lite를 이용하면 머신러닝 전문 지식 없이도 객체명만 지정하면 바로 탐지가 가능하다.
서버리스 아키텍처를 채택해 인프라 관리 없이 트래픽에 따라 자동 확장되며, Amazon CloudFront와 S3를 통해 정적 프론트엔드를 글로벌 배포하는 완성형 예시 애플리케이션도 함께 공개됐다. AI 기반 비전 기능을 클라우드 인프라에 신속하게 통합하려는 팀에게 실용적인 출발점이 될 전망이다.














