레이블 확보 비용이 높은 전문 도메인에서 LLM(대규모 언어 모델)의 성능 한계를 극복하는 프레임워크 EvoPool이 제안됐다. 대형 언어 모델은 범용 과제에서 뛰어난 성과를 보이지만, 훈련 레이블 확보가 어려운 생의학, 법률 등 고위험 특수 분야에서는 소규모 지도 학습 모델에 뒤처지는 경우가 많다. EvoPool은 다윈의 진화론에서 영감을 받아 설계된 진화적 멀티에이전트 프레임워크로 이 간극을 메운다.
작동 방식은 세 가지 전문 에이전트가 실행 가능한 주석기(annotator) 코드를 반복적으로 제안하는 것에서 출발한다. 소규모 검증 세트가 적합도 신호를 제공하고, 결정론적 게이트가 생존 가능성·다양성·한계 기여도 기준을 통과한 주석기만 세대를 거쳐 유지하도록 걸러낸다. 이렇게 선발된 주석기 풀의 투표 결과는 EvoAgg라는 텍스트 인식 집계 모듈이 소프트 훈련 레이블로 변환한다. 완성된 주석기 풀은 예제당 비용이 거의 없어 100만 건 기준으로 LLM 직접 주석 방식 대비 4500배에서 최대 3만 1000배 빠른 처리 속도를 달성했다.
생의학 관계 추출, 법률 조항 분류, 복잡 추론, 고밀도 멀티레이블 생의학 분류 등 LLM이 약한 8개 전문·복잡 과제 중 7개에서 EvoPool은 가장 강한 LLM 주석 기준선 대비 평균 0.141 매크로-F1 향상을 기록했다. 특히 ChemProt 데이터셋에서 +0.301, PubMed에서 +0.265의 성능 격차를 보였다. 코드는 깃허브(github.com/tianyi0216/EvoPool)에 공개됐다.
훈련 레이블 확보에 막대한 전문가 비용이 드는 임상, 법률, 과학 분야에서 EvoPool은 실질적인 대안으로 주목받는다. 소수의 검증 레이블만으로 도메인 특화 주석기를 자율적으로 진화시키는 이 방식은 레이블 효율적 학습 연구의 새로운 방향을 제시한다.














