AI 에이전트 핵심 용어 정리 — 하네스·스캐폴드는 무엇이 다른가

허깅페이스가 AI 에이전트 분야에서 혼용되고 있는 핵심 용어들을 정리한 공식 글로사리를 발표했다. 에이전틱 AI 시스템 개발이 빠르게 확산되면서 하네스(harness), 스캐폴드(scaffold), 에이전트 루프(agent loop) 등의 용어가 서로 다른 의미로 쓰이거나 혼동되는 사례가 늘어난 데 따른 대응이다. 이 글로사리는 현장에서 통용 중인 실질적 정의를 제시하며, 커뮤니티 전반의 기준점을 만들려는 시도다.

핵심 구분은 모델·스캐폴드·하네스 세 층위 사이의 역할 분리에 있다. 모델은 텍스트를 입력받아 출력하는 LLM(대규모 언어 모델) 자체로, 호출 간 기억이 없고 스스로 루프를 형성하지 않는다. 스캐폴드는 모델이 세상을 바라보고 행동하는 방식을 형성하는 계층으로, 시스템 프롬프트·도구 설명·출력 파싱·컨텍스트 관리 등이 포함된다. 하네스는 에이전트를 실제로 실행하는 계층으로, 모델 호출·도구 실행·중단 조건 판단 등의 실행 루프를 담당한다. 즉, 스캐폴드는 “모델이 무엇을 보고 어떻게 행동하는가”를 정의하고, 하네스는 “에이전트가 어떻게 작동하는가”를 구현한다.

A construction worker stands on a scaffolding at a high-rise building under a blue sky. — 사진: Tamil Vanan / Pexels

글로사리는 이 외에도 컨텍스트 엔지니어링(context engineering), 정책(policy), 스킬(skill), 서브에이전트(sub-agent), 롤아웃(rollout), 보상(reward) 등 에이전트 개발과 훈련에 자주 등장하는 개념들도 포괄적으로 다룬다. 특히 강화학습 기반 에이전트 훈련 맥락에서 쓰이는 RL 환경(RL environment), 트레이너(trainer), 궤적(trajectory) 등의 개념도 별도로 정리했다. 동일한 LLM을 기반으로 해도 하네스 설계 방식에 따라 에이전트의 실제 동작과 사용자 경험이 크게 달라진다는 점도 강조했다.

AI 에이전트 생태계는 아직 표준 용어가 확립되지 않은 단계로, 같은 단어가 연구자·개발자·제품 팀에 따라 다른 의미로 사용되는 혼란이 지속돼 왔다. 허깅페이스의 이번 글로사리는 보편 정의를 강제하기보다 실무에서 통용되는 의미를 정리하는 방향을 택했다. 에이전트 시스템을 설계하거나 팀 간 소통을 위한 공통 언어가 필요한 개발자에게 유용한 참고 자료로 활용될 전망이다.