브레인트러스트, Codex·GPT-5.5로 고객 요청을 코드로

AI 품질 관측 플랫폼 브레인트러스트(Braintrust)가 오픈AI(OpenAI)의 Codex와 GPT-5.5를 개발 워크플로에 전면 도입한 결과, 한 달 만에 팀 구성원의 절반이 해당 도구로 전환하고 고객 기능 요청을 실시간으로 코드화하는 방식으로 개발 방식을 바꿨다고 밝혔다. 브레인트러스트는 AI 제품 출시 품질을 높이기 위한 평가·관측 플랫폼으로, 스스로 Codex의 활용 사례를 직접 실증하는 위치에 있다.

가장 두드러진 변화는 고객 피드백 루프의 속도다. 기존에는 고객이 기능 요청을 제출하면 해당 요청이 백로그에 쌓이고 우선순위에 따라 처리됐다. Codex 도입 이후 브레인트러스트 팀은 고객 요청을 Codex에 직접 입력해 프리뷰 브랜치를 수 분 안에 생성하고, 완성된 기능을 고객에게 실시간으로 보여주며 함께 검토하는 방식으로 전환했다. 창업자 겸 최고경영자(CEO) 앤쿠르 고얄(Ankur Goyal)은 “Codex의 가장 큰 강점은 속도”라며 “터미널에서 텍스트를 속도 저하 없이 빠르게 출력하는 것은 다른 모델이 따라할 수 없는 특성”이라고 말했다.

Smartphone screen showing ChatGPT introduction by OpenAI, showcasing AI technology. — 사진: Sanket Mishra / Pexels

고얄이 강조하는 변화는 단순한 코딩 속도 향상에 그치지 않는다. Codex를 활용하면 문제를 정의하고 테스트를 작성한 뒤 샌드박스 환경에서 자율적으로 실행하는 방식이 가능해, 엔지니어가 특정 문제를 단계별로 모델에게 안내해야 하는 부담이 사라진다는 것이다. 이 방식은 실험의 진입 비용을 낮춰 개발팀이 더 다양한 아이디어를 빠르게 시도할 수 있게 한다. 브레인트러스트 측은 Codex를 통해 고객과 함께 아이디어를 실시간으로 구체화하고 반복할 수 있게 됐다고 설명했다.

이번 사례는 오픈AI가 Codex의 엔터프라이즈 확산을 가속화하는 시점에 공개됐다. 오픈AI에 따르면 Codex는 현재 주간 400만 명 이상의 개발자가 사용하는 제품으로 성장했으며, 브레인트러스트처럼 자체 AI 스택을 운영하는 팀부터 전통 기업 엔지니어링 조직에 이르기까지 코드 검토·테스트·리팩터링 전반에 걸쳐 활용 범위가 넓어지고 있다. Codex와 GPT-5.5의 조합은 대규모 코드베이스를 빠르게 추론하는 역량에서 차별화를 꾀하고 있다는 평가를 받는다.