XGBoost 모델과 TreeSHAP 기여도 분석을 결합한 해석 가능한 머신러닝 파이프라인으로 중국 A주 시장의 횡단면 주식 수익 예측력을 검증한 연구가 발표됐다. 연구진은 2009년부터 2019년까지 3,632개 A주 종목을 대상으로 60개월 롤링 윈도우와 55개월 아웃오브샘플 데이터를 활용해 분석을 수행했다.
XGBoost 모델은 평균 AUC 0.547을 기록했으며, 상위 대 하위 퀀타일 롱-숏 스프레드는 월 평균 +2.38%(Newey-West t=5.94, 연환산 샤프지수 2.23)를 달성했다. 이 알파는 카르하트(Carhart) 4팩터 모델 조정 후에도 월 +2.31%(t=7.48)로 지속됐다. SHAP 분해 결과 행동 시그널인 거래회전율과 모멘텀이 55개 산업 그룹 전반에 걸쳐 예측 기여도의 평균 58.2%를 차지했으며, 밸류에이션 비율은 10.7%에 그쳤다. 제거 분석(ablation analysis)은 SHAP 기여도와 다른 방향을 가리키는 경우도 있었는데, 이는 두 방법을 단독으로 쓰면 드러나지 않는 특성 간 대체 가능성 구조가 존재함을 시사한다.
이 연구의 핵심 기여는 예측력의 원천을 감사 가능한 팩터 기여도로 분해하는 해석 가능성에 있다. 블랙박스 모델이 좋은 예측 성능을 내더라도 어떤 팩터가 기여했는지 설명하지 못하면 실무 적용이 어렵다는 한계를 극복하기 위해, TreeSHAP을 통한 투명한 귀속 분석과 스트레스 테스트를 결합했다. 행동 시그널이 밸류에이션 지표를 압도하는 A주 시장의 특성은 개인 투자자 비중이 높은 중국 시장 구조와 맞닿아 있다는 점에서 의의가 있다.
AI를 활용한 퀀트 투자 전략에서 모델의 예측력만큼이나 해석 가능성에 대한 규제·운용 요건이 강화되는 추세다. 이 연구는 XGBoost와 SHAP 조합이 복잡한 금융 시장 환경에서 예측 성능과 해석 가능성을 동시에 확보할 수 있는 실용적 경로를 제시한 사례로 평가된다.














