마이크로소프트 리서치가 기업 데이터 분석을 위한 AI 기반 오픈소스 도구 ‘Data Formulator 0.7’을 공개했다. 이 도구는 데이터베이스, 데이터 웨어하우스, BI 시스템, 오브젝트 스토리지, 로컬 파일 등 다양한 기업 데이터 소스를 단일 작업 공간에서 연결하는 ‘Data Connectors’ 기능과, 분석 맥락을 이해하는 AI 에이전트, 반복 탐색이 가능한 멀티모달 인터페이스를 통합 제공한다. SQL이나 프로그래밍 지식 없이도 데이터 탐색과 시각화를 수행할 수 있다는 점이 특징이다.
핵심 구성 요소는 문맥 인식 AI 에이전트다. 기존 챗 인터페이스 방식과 달리, 이 에이전트는 연결된 데이터 소스, 이미 불러온 테이블, 이전에 생성된 차트, 사용자 목표 전반을 분석 작업 공간으로 인식하고 그 맥락 안에서 추론과 행동을 수행한다. 단일 인터랙션 안에서 데이터를 직접 검사하고, 격리된 환경에서 코드를 작성·실행하고, 차트 명세를 생성하고, 중간 단계를 설명하는 복합 작업이 가능하다. 요청이 모호할 경우 에이전트가 추가 질문을 통해 의도를 확인한 뒤 진행한다. ‘Data Thread’라 불리는 구조화된 채팅 인터페이스는 분석 과정의 모든 질문, 중간 발견, 차트를 순서대로 기록해 긴 세션도 맥락을 유지할 수 있게 한다.

Data Connectors 기능은 기업 플랫폼 팀이 반복적인 데이터 연결 작업을 줄일 수 있도록 설계됐다. 인증, 지속 연결, 미리보기, 메타데이터 관리를 데이터 소스 유형과 무관하게 통합된 방식으로 처리하며, 중앙에서 관리되는 재사용 가능한 연결 설정을 지원한다. 사용자가 매번 수동으로 파일을 업로드하는 번거로움을 없애는 것이 목표다. 기업 데이터 분석 워크플로에서 흔히 발생하는 파편화 문제, 즉 여러 저장 시스템과 도구에 데이터가 분산된 상태에서 코딩 역량 없이 통합 분석을 수행하기 어려운 문제를 해소하는 데 초점을 맞췄다.
Data Formulator 0.7은 GitHub에 오픈소스로 공개됐으며, 데모도 제공된다. 기업 환경에서 AI 기반 분석 워크플로를 구축하려는 팀이라면 이 프로젝트를 기반으로 자체 시스템에 맞게 기능을 확장해 활용할 수 있다. 마이크로소프트 리서치는 코딩 전문성을 갖추지 않은 도메인 전문가와 분석가가 데이터를 직접 탐색하는 환경을 만드는 데 이 도구가 기여하길 기대한다고 밝혔다.


