TimeCopilot로 구축하는 시계열 예측 파이프라인, 파운데이션 모델과 이상 탐지 통합

시계열(time series) 예측 라이브러리 TimeCopilot을 활용해 통계 모델부터 파운데이션 모델(foundation model)까지 하나의 파이프라인으로 통합하는 구체적인 구현 방법이 공개됐다. 이 파이프라인은 실제 항공 승객 데이터와 이상값이 주입된 합성 계절 시계열을 패널 데이터셋으로 구성하고, 롤링 교차 검증으로 모델을 평가한 뒤 최적 모델을 자동 선택하는 흐름으로 설계됐다.

모델 풀에는 AutoARIMA, AutoETS, SeasonalNaive, Theta 등의 고전 통계 모델과 Prophet, 아마존의 Chronos(크로노스), 구글의 TimesFM이 함께 포함됐다. TimeCopilotForecaster가 단일 인터페이스로 이들 모델을 관리하며, GPU 가용 여부에 따라 Chronos 모델 크기를 자동으로 조정한다. 롤링 교차 검증은 3개 윈도우에 걸쳐 MAE, RMSE, MAPE를 산출하며 리더보드 형태로 모델 성능을 비교한다. 이후 최적 모델을 기준으로 80%·95% 예측 구간을 포함한 12개월 확률적(probabilistic) 예측을 생성하고, 99% 구간 기반 이상 탐지 결과를 시각화한다.

파이프라인의 마지막 단계에서는 LLM(대규모 언어 모델) 에이전트가 선택적으로 결합된다. OpenAI 또는 앤트로픽의 API 키가 제공되면 TimeCopilot 에이전트가 자동으로 모델을 선택하고 SeasonalNaive 대비 성능 우위를 평가한 뒤, 사용자 질의에 대한 자연어 해석을 생성한다. 에이전트가 없는 환경에서도 예측·이상 탐지 단계는 API 키 없이 완전히 실행 가능하다. 파이프라인 실행 환경은 pip 기반으로 설치하며, numpy 1.26.4와 scipy 1.13.1 버전을 명시적으로 지정해 바이너리 충돌을 방지하도록 구성됐다.

이 접근법의 실용적 의미는 단일 프레임워크 안에서 전통적 통계 방법과 최신 파운데이션 모델을 객관적 오차 지표로 직접 비교할 수 있다는 점이다. 기업 현장에서 수요 예측이나 이상 탐지에 활용할 때, 각 도메인에 맞는 최적 모델을 체계적으로 선별하는 절차를 표준화할 수 있다. 전체 코드와 노트북은 공개 형태로 제공됐다.