K-AI 모델 1차 결과 초읽기…성낙호 네이버 총괄 "담담하게 결과 기다린다"

[사진=유대길 기자 dbeorlf123@ajunews.com ]
과학기술정보통신부(과기정통부)가 추진하는 '독자 인공지능(AI) 파운데이션 모델(독파모)' 선정 발표가 막바지에 들어갔다. 과기정통부가 한국형 소버린AI 생태계 구축을 목표로 내건 가운데 최종 평가 기준을 둘러싼 공정성 논란도 막판까지 이어지고 있다.

14일 성낙호 네이버클라우드 하이퍼스케일AI 기술 총괄은 서울 강남구 한국과학기술회관에서 열린 '2026년 과학기술인·정보방송통신인 신년인사회'에서 "담담하게 결과를 기다리고 있다"며 "공정한 평가가 이뤄지길 바란다"고 말했다.

과기정통부에 따르면 독파모 사업에 참여한 5개 팀의 최종 평가는 15일까지 진행한다.

이번 평가는 추론·코딩·수학·과학 등 AI 기초 성능을 검증하는 13종의 '공통 벤치마크'와 각 기업이 강점을 제시한 2종의 '선택 벤치마크'로 이뤄진다. 여기에 모델의 독자성과 기술 완성도를 살피는 '전문가 평가', 수요 기업을 대상으로 한 '실 사용성 평가'가 더해져 최종 1팀이 탈락한다.

업계는 거대언어모델(LLM)의 핵심 역량인 텍스트 처리 능력을 평가하는 공통 벤치마크가 주요 판단 기준이 될 것으로 예상했다. 컨소시엄에 참여한 한 업계 관계자는 "LLM은 기본적으로 텍스트 기반 모델인 만큼, 공통 지표만으로도 모델 간 기술적 변별력을 가릴 수 있다"고 말했다.

이런 가운데 AI모델을 처음부터 직접 개발한다는 의미인 '프롬 스크래치(from Scratch)' 원칙을 둘러싼 논란도 불거지고 있다. 네이버클라우드가 제출한 모델이 프롬 스크래치 기준에 부합하는지를 두고 업계 내에서 이견이 제기되고 있기 때문이다. 앞서 과기정통부는 독파모 사업 공모 당시 프롬 스크래치와 관련해 '타사 모델에 대한 라이선스 이슈가 부재해야 한다'고 명시한 바 있다.

네이버클라우드의 경우 멀티모델AI 개발 과정에서 중국 알리바바 '큐웬(Qwen) 2.5'의 비전·오디오 인코더와 가중치 사실을 인정했다. 다만 해당 인코더가 파운데이션 모델의 부수적 기능에 해당하며 모델 핵심 판단과 추론을 담당하는 구조는 독자적으로 설계했다는 입장이다.

이에 대해 컨소시엄에 참여한 다른 기업들은 우려를 내비치고 있다. 오픈소스 활용이 허용될 경우, 막대한 비용과 시간을 들여 독자 모델을 구축해 온 기업들이 상대적으로 불리한 위치에 놓일 수 있다는 지적이다. 평가 기준 해석에 따라 형평성 논란으로 번질 가능성도 제기된다.

일각에서는 생성형 AI가 아직 초기 단계에 있는 만큼, 모든 성능 지표에서 동일한 완성도를 요구하는 것은 현실적이지 않다는 의견도 나온다. 각 기업이 추론 능력, 코딩, 창의성, 응답 속도 등 특정 영역에 가중치를 두고 모델을 개발해 온 만큼, 이번 1차 평가에서는 단순한 성능 비교보다 각 사의 기술적 방향성과 개발 전략을 어떻게 구현했는지를 함께 살펴봐야 한다는 것이다.
아주경제=나선혜 기자 hisunny20@ajunews.com