마이크로소프트 리서치가 2026년 5월 28일 오픈소스 AI 데이터 분석 도구 ‘Data Formulator 0.7’을 공개했다. 이 도구는 데이터 연결과 에이전트 기반 탐색, 시각화 정제를 하나의 작업 공간에서 결합한 기업용 데이터 분석 시스템이다. SQL이나 프로그래밍 전문 지식이 없어도 분석가와 도메인 전문가가 데이터를 탐색하고 시각화할 수 있도록 설계됐으며, GitHub 저장소(microsoft/data-formulator)를 통해 공개됐다.
이번 버전의 핵심은 ‘Data Connectors’ 기능이다. 데이터베이스와 데이터 웨어하우스, BI 시스템, 오브젝트 스토리지, 로컬 파일에 걸쳐 권한이 관리되는 재사용 가능한 연결을 지원한다. 마이크로소프트 리서치는 기업 데이터가 여러 저장 시스템과 도구에 흩어져 있어 분석에 앞서 연결 설정과 메타데이터 준비, 권한 관리 작업이 반복된다고 지적하며, 이 기능이 플랫폼 팀의 통합 부담을 줄여 준다고 설명했다. 사용자는 매번 파일을 수동으로 업로드하는 대신 중앙에서 관리되는 연결을 통해 작업할 수 있다.

핵심 구성 요소는 맥락을 인식하는 AI 에이전트다. 단일 프롬프트와 달리 에이전트는 연결된 데이터 소스, 불러온 테이블, 이전에 생성한 차트, 사용자의 목표까지 작업 공간 전체에 접근한다. 한 번의 상호작용으로 데이터를 점검하고, 격리된 환경에서 코드를 작성·실행하며, 차트 명세를 생성하고 중간 단계를 보여 주며 결과를 설명한다. 요청이 모호할 경우 에이전트는 작업을 진행하기 전에 사용자에게 명확히 묻는다.
에이전트는 ‘Data Thread’라는 구조화된 대화 인터페이스와 결합된다. 분석 과정의 모든 질문과 중간 결과, 차트가 기록되므로 긴 세션에서도 이전 단계로 돌아가거나 대안적 분석으로 분기해 나란히 비교할 수 있다. 다만 마이크로소프트 리서치 블로그는 지원하는 데이터 소스의 구체적 명칭이나 개수, 설치 방식, 라이선스 조건은 명시하지 않았다. 사내 도입을 검토하는 팀이라면 GitHub 저장소에서 지원 범위와 라이선스를 직접 확인할 필요가 있다.


