• AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
STORIUM
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
No Result
View All Result
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의
No Result
View All Result
STORIUM
No Result
View All Result

시스코 AI, FAPO 공개…Claude Code로 LLM 파이프라인 프롬프트 자동 최적화

STORIUM 편집부 작성: STORIUM 편집부
2026년 06월 21일 13시 34분
Reading Time: 1 min read
A A
Home 스타트업·투자
Share on FacebookShare on Twitter

시스코 AI(Cisco AI)가 ‘FAPO(Fully Automated Prompt Optimization)’를 오픈소스로 공개했다. FAPO는 다단계 LLM 파이프라인을 초기 프롬프트에서 목표 정확도까지 자동으로 최적화하는 시스템으로, 클로드 코드(Claude Code) 에이전트가 전체 루프를 오케스트레이션한다. 라이선스는 Apache 2.0이며 코덱스(Codex)도 최적화 에이전트로 지원된다.

시스코의 평가에서 FAPO는 현재 최고 수준의 프롬프트 최적화 방법론인 GEPA(Generalized Evolutionary Prompt Architecture)와 비교해 18개 모델-벤치마크 조합 중 15개에서 더 나은 결과를 냈으며 평균 +14.1 퍼센트포인트(pp) 향상을 기록했다. 특히 파이프라인 구조 변경을 선택한 HoVer와 IFBench 벤치마크에서는 6개 쌍 모두에서 이겼으며 GEPA 대비 평균 +33.8pp의 격차를 냈다. 비교는 GPT-4.1-mini, GPT-5.4-mini, Gemma 3-12B 세 가지 태스크 모델과 6개 벤치마크에 걸쳐 이뤄졌으며, 클로드 오퍼스 4.6(Claude Opus 4.6)은 FAPO의 오케스트레이터와 GEPA의 리플렉터로 모두 활용됐다.

FAPO의 핵심 설계 원칙은 실패 귀인(failure attribution)이다. 다단계 파이프라인에서 최종 출력이 틀렸을 때 어느 단계가 원인인지를 규칙 기반 휴리스틱과 LLM 분석으로 분류한다. 실패는 검색 실패, 연쇄 실패, 형식 실패, 추론 실패 네 가지로 나뉜다. FAPO는 프롬프트 편집 → 파라미터 조정 → 체인 구조 변경의 세 단계를 순서대로 시도하며, 낮은 비용의 방법을 먼저 소진한 뒤에만 다음 단계로 올라간다. 과적합 방지를 위해 훈련 분할에서만 개별 케이스를 열람하고, 검증·테스트 분할은 집계 점수만 노출한다. 모든 변형 파일은 불변(immutable) 파일로 저장되며 독립적인 검토 에이전트가 각 제안을 사전 확인한다.

FAPO가 해결하려는 문제는 실제로 LLM 애플리케이션 개발자들이 공통으로 겪는 것이다. 프롬프트 문구를 약간만 바꿔도 정확도가 20%가량 달라질 수 있고, 여러 단계로 구성된 파이프라인에서는 오류가 어느 단계에서 비롯됐는지 추적하는 것 자체가 상당한 시간을 요구한다. FAPO는 이 탐색 작업을 에이전트에게 위임해 자동화하며, 특히 실패가 프롬프트 수준의 문제인지 파이프라인 구조 자체를 바꿔야 하는 문제인지를 자동으로 구분한다는 점이 기존 도구들과 다른 지점이다. DSPy, TextGrad, ProTeGi 등 기존 프롬프트 최적화 프레임워크들이 프롬프트 레벨 최적화에 머무는 것과 대비된다.

한국 AI 개발 생태계 관점에서 FAPO는 주목할 만한 실용 도구다. Apache 2.0 오픈소스 라이선스이므로 상업 활용이 자유롭고, 국내 LLM 서비스 개발팀이 멀티스텝 파이프라인 품질을 높이는 데 직접 도입할 수 있다. 다만 FAPO가 의존하는 클로드 코드 에이전트는 현재 국내에서의 접근성이 제한적일 수 있으며, 최적화 품질이 제공하는 데이터셋의 품질과 커버리지에 크게 좌우된다는 점은 주의해야 한다. 시스코 팀 자체 벤치마크 결과만 공개된 현 시점에서 독립적인 재현 연구가 이뤄지지 않았다는 한계도 있어, 즉각 신뢰하기보다 자체 파이프라인에 직접 테스트해 보는 접근이 권장된다.

Tags: ClaudeFAPOLLM파이프라인시스코프롬프트최적화
STORIUM 편집부

STORIUM 편집부

STORIUM 편집부 공식 계정

관련 기사

Detailed view of Ethernet and VGA ports on a server highlighting connectivity features.
스타트업·투자

베이스텐, AI 추론 스타트업 15억 달러 투자유치…반년 만에 기업가치 160% 급등

2026년 06월 21일 15시 31분
DARPA SyNAPSE 16 Chip Board
스타트업·투자

스타트업 Subquadratic, 희소 어텐션 LLM SubQ 공개…속도 56배·비용 300분의 1 주장

2026년 06월 21일 14시 02분
Close-up of sleek security cameras ensuring safety and privacy in indoor settings.
스타트업·투자

슈퍼브AI, CVPR 2026 비전AI 챌린지 종합 우승…한국 기업 최초

2026년 06월 20일 08시 19분
Two business professionals shaking hands with financial graphs on digital devices.
스타트업·투자

치화치엔 VC, AI 진짜 승자는 AI를 판매하지 않는 기업

2026년 06월 20일 08시 06분
Next Post
현대적 사무실에서 협업하는 팀 - 시스코 AI 인프라 운영 플랫폼

시스코, AI 에이전트 시대 기업 인프라 통합 플랫폼 '클라우드 컨트롤' 공개

답글 남기기 응답 취소

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

  • 인기 급상승
  • 최신
A 3D rendering of a neural network with abstract neuron connections in soft colors.

퍼플렉시티, 로컬·클라우드 AI를 자동 판단하는 하이브리드 추론 시스템 발표

2026년 06월 04일 08시 53분
Close-up of a GeForce RTX graphics card on a desk, showcasing its design and technology.

엔비디아 RTX Spark, 윈도 노트북 판도 바꿀까…가격 걸림돌

2026년 06월 13일 09시 29분
Contemporary building with a glass facade and geometric patterns, low angle view.

앤트로픽·네이버 개발자 밋업 개최…서울 오피스 개소 앞두고 본사 임원 참석

2026년 06월 15일 20시 45분
책상에서 법률 문서에 서명하는 모습

클로드 ‘드리밍’ 기능 공개…앤트로픽, 법률·의료 AI 성능 대폭 향상

2026년 06월 15일 20시 45분
데이터센터 서버

구글, ‘제미나이 3.5 플래시’·AI 에이전트 ‘스파크’ 공개… 가격·사용자로 추격

2026년 06월 04일 15시 14분
샘 올트먼 오픈AI CEO

샘 올트먼 다룬 영화 ‘아티피셜’, 아마존 MGM 배급 포기…새 배급사 물색

2026년 06월 21일 17시 19분
Stunning aerial view of Apple Park in Cupertino, California during a beautiful sunset.

애플 시리, iOS 27서 독립형 AI 챗봇 앱으로 전면 재설계…GPT·제미나이 전환 지원

2026년 06월 21일 17시 14분
A close-up of a vintage motherboard highlighting microchips and electronic components.

SK하이닉스 HBM4E 12단 샘플 조기 출하…최태원 회장, 머스크와 AI 동맹 추진

2026년 06월 21일 16시 45분
A laptop showing an analytics dashboard with charts and graphs, symbolizing modern data analysis tools.

Data2Story, CSV 파일 하나로 7개 AI 에이전트가 검증된 인터랙티브 기사 자동 생성

2026년 06월 21일 16시 32분
microsoft product copilot chat

마이크로소프트 Windows MXC, AI 에이전트 보안 컨테이너 표준 도전

2026년 06월 21일 16시 28분

검색

No Result
View All Result

인기 태그

AI규제 AI반도체 AI보안 AI안전 AI에이전트 AI연구 AI인프라 AI정책 Anthropic arXiv AWS ChatGPT Claude Gemini IPO LLM MCP Microsoft NVIDIA OpenAI 강화학습 구글 데이터센터 마이크로소프트 멀티모달 멀티에이전트 메타 반도체 벤치마크 사이버보안 삼성전자 생성AI 생성형AI 스타트업 앤트로픽 에이전트 에이전트AI 에이전틱AI 엔비디아 오픈AI 오픈소스 의료AI 자율주행 젠슨황 피지컬AI

카테고리

  • AI 모델·연구 (731)
  • AI 서비스·툴 (382)
  • 반도체·인프라 (291)
  • 빅테크·기업 (334)
  • 산업 적용 (246)
  • 스타트업·투자 (161)
  • 정책·윤리 (275)

STORIUM은 트렌드와 인사이트를 전하는 종합 뉴스 매체입니다. 정확성, 균형, 맥락의 편집 원칙으로 신뢰받는 뉴스를 전합니다.

카테고리

  • AI 모델·연구
  • AI 서비스·툴
  • 반도체·인프라
  • 빅테크·기업
  • 산업 적용
  • 스타트업·투자
  • 정책·윤리

태그

AI규제 AI반도체 AI보안 AI안전 AI에이전트 AI연구 AI인프라 AI정책 Anthropic arXiv AWS ChatGPT Claude Gemini IPO LLM MCP Microsoft NVIDIA OpenAI 강화학습 구글 데이터센터 마이크로소프트 멀티모달 멀티에이전트 메타 반도체 벤치마크 사이버보안 삼성전자 생성AI 생성형AI 스타트업 앤트로픽 에이전트 에이전트AI 에이전틱AI 엔비디아 오픈AI 오픈소스 의료AI 자율주행 젠슨황 피지컬AI

최근 뉴스

샘 올트먼 오픈AI CEO

샘 올트먼 다룬 영화 ‘아티피셜’, 아마존 MGM 배급 포기…새 배급사 물색

2026년 06월 21일 17시 19분
Stunning aerial view of Apple Park in Cupertino, California during a beautiful sunset.

애플 시리, iOS 27서 독립형 AI 챗봇 앱으로 전면 재설계…GPT·제미나이 전환 지원

2026년 06월 21일 17시 14분
  • 소개
  • 문의
  • 광고문의
  • 개인정보처리방침
  • 이용약관
  • 청소년보호정책
  • 정정·반론 보도 안내
  • 편집·윤리강령

주소: 경기 고양시 덕양구 꽃마을로 66, 한일미디어타워 15층
상호: 스토리움 |  사업자등록번호: 579-27-02025 |  대표자: 이국환
발행·편집인: 이국환 |  청소년보호책임자: 이국환 |  발행일자: 2025.01.01
스토리움의 모든 콘텐츠는 저작권법의 보호를 받는 바, 무단 전재·복사·배포 등은 법적 제재를 받을 수 있습니다.
© 2026 STORIUM. All Rights Reserved.

No Result
View All Result
  • AI 모델·연구
  • 빅테크·기업
  • 반도체·인프라
  • 산업 적용
  • AI 서비스·툴
  • 정책·윤리
  • 스타트업·투자
  • 문의

주소: 경기 고양시 덕양구 꽃마을로 66, 한일미디어타워 15층
상호: 스토리움 |  사업자등록번호: 579-27-02025 |  대표자: 이국환
발행·편집인: 이국환 |  청소년보호책임자: 이국환 |  발행일자: 2025.01.01
스토리움의 모든 콘텐츠는 저작권법의 보호를 받는 바, 무단 전재·복사·배포 등은 법적 제재를 받을 수 있습니다.
© 2026 STORIUM. All Rights Reserved.