Liquid AI, LFM2.5 임베딩·ColBERT 모델 공개…11개 언어 다국어 검색 지원

Liquid AI가 2026년 6월 다국어 정보 검색 전용 모델 두 종을 출시했다. LFM2.5-Embedding-350M과 LFM2.5-ColBERT-350M이 그것으로, 두 모델 모두 3억 5000만 파라미터 규모다. 아랍어·독일어·영어·스페인어·프랑스어·이탈리아어·일본어·한국어·노르웨이어·포르투갈어·스웨덴어 등 11개 언어에 걸친 다국어 및 교차 언어 검색을 지원하며, Hugging Face에서 LFM 오픈 라이선스 v1.0 하에 즉시 내려받을 수 있다.

두 모델은 같은 백본을 공유하지만 텍스트를 표현하는 방식이 다르다. LFM2.5-Embedding-350M은 밀집 이중 인코더(dense bi-encoder) 방식으로 문서 전체를 단일 벡터로 압축해 인덱스 크기가 작고 검색 속도가 빠르다. LFM2.5-ColBERT-350M은 후기 상호작용(late-interaction) 방식으로 각 토큰을 개별 벡터로 변환해 정확도와 일반화 성능이 높다. 아키텍처 측면에서는 인과적 디코더인 LFM2.5-350M-Base에 양방향 패치를 적용해 각 토큰이 좌우 문맥을 모두 볼 수 있도록 했으며, 두 모델 모두 기존 RAG(검색 증강 생성) 파이프라인에 드롭인 교체 형태로 바로 쓸 수 있다.

이미지 출처: 원문 (Liquid AI Introduces LFM2.5-Embedding-350M and LFM2.5-ColBERT-350M: Dense Bi-Encoder and Late-Interaction Models for Fast Multilingual Search Across 11 Languages)

성능 검증은 다국어 검색 벤치마크 NanoBEIR와 교차 언어 QA 벤치마크 MKQA-11에서 이뤄졌다. NanoBEIR에서 LFM2.5-ColBERT-350M은 NDCG@10 기준 0.605, LFM2.5-Embedding-350M은 0.577을 기록했다. MKQA-11 Recall@20에서는 각각 0.694와 0.691이었다. 비교 대상인 Qwen3-Embedding-0.6B(NanoBEIR 0.556, MKQA-11 0.638)는 파라미터 수가 더 많음에도 두 모델 모두에 뒤처졌다. H100 GPU에서는 Embedding 쿼리 지연이 1.5ms p50을 기록했다.

GPT-4급 LLM이 보편화되면서 기업들의 AI 도입 병목은 모델 성능보다 검색 품질로 이동하고 있다. 한국어가 11개 지원 언어 중 하나로 명시됐다는 점도 실용적 의의를 갖는다. 한국어 쿼리로 영어 제품 카탈로그를 검색하거나, 영문 내부 문서를 한국어로 질의하는 시나리오에서 추가 번역 단계 없이 교차 언어 검색을 구현할 수 있다. 경쟁 모델인 알리바바의 Qwen3·gte-multilingual, BAAI의 bge 시리즈보다 파라미터 수에서 불리하지만, 더 큰 Qwen3-Embedding-0.6B를 앞선 벤치마크 결과는 효율성 중심 설계의 가능성을 보여준다. GGUF 빌드를 통해 개인정보보호 규제가 엄격한 금융·의료·공공 분야 온프레미스 도입도 수월해진다.