엔비디아(NVIDIA)가 연합학습(FL, Federated Learning) 연구를 가속하기 위한 자동화 프레임워크 FLARE Auto-FL을 공개했다. AI 에이전트가 제한된 실험 설계 안에서 후보 전략을 자율적으로 반복 검증하고 결과를 원장(ledger)에 기록하도록 설계됐다. 연구자가 직접 모든 실험을 수동으로 실행하는 대신 에이전트가 반복 작업을 처리하면서, 연구자는 방향 결정과 결과 검토에 집중할 수 있는 구조다.
Auto-FL의 핵심은 비교 가능한 벤치마크 기반의 통제된 실험 루프다. 에이전트는 고정된 훈련 예산과 명확한 연구 제어 플레인(program.md)에서 시작해 변경 가능한 범위를 허용된 표면으로 제한한 뒤 동일 벤치마크 조건에서 후보를 실행한다. 모든 결과는 results.tsv 원장에 점수·실행 시간·상태·설명과 함께 저장된다. 이 원장을 통해 에이전트와 연구자 모두 어떤 아이디어가 효과를 냈고 어떤 것이 실패했는지 추적할 수 있다. 지원 전략 범위에는 FedAvg, FedOpt 방식의 서버 업데이트, FedAdam, SCAFFOLD, 중앙값 집계, FedProx 훅이 포함된다.
성능 개선이 정체될 때를 위한 문헌 기반 복구(literature-grounded recovery) 경로도 포함됐다. 원장이 검색 방향의 정체를 감지하면, 에이전트는 지역적 변형 시도를 중단하고 구조화된 문헌 검토 루프로 전환한다. 이 루프에서 에이전트는 관련 방법론을 검색해 도전 카드와 제안 카드를 작성하고, 기대 효과·구현 위험·계약 안전성·증거·신규성·실행 비용을 기준으로 후보를 점수화한 뒤 다시 동일한 통제 실험 루프에 투입한다. 기본 CIFAR-10 시뮬레이션 외에 세 개 의료 데이터 사이트를 가상의 연합 환경으로 구성한 의료 시각-언어 모델(VLM) 태스크 프로파일도 예시로 제공된다.
캠페인이 종료되면 보고 스킬이 최종 보고서를 자동 생성한다. 보고서는 기준선과 최고 점수, 절대·상대적 성능 향상, 실행 비용, 최종 구성, 실패 노트, 무효화된 아이디어, 권장 후속 실험 항목을 담는다. 엔비디아는 Auto-FL을 고정된 틀이 아닌 출발점으로 제공하며, 데이터셋·지표·변형 제약을 담은 태스크 프로파일을 교체해 다양한 연합학습 연구 주제에 적용할 수 있다고 밝혔다.














