'국산 AI' 타이틀의 함정 — 오픈소스 커뮤니티가 공공기관 AI를 검증하는 시대
리우데자네이루시가 '자체 개발 LLM'을 발표한 지 48시간 만에 GitHub 개발자 커뮤니티가 의문을 제기했습니다. 공공기관 AI 국산화 선언이 반복되는 지금, 기술 독자성과 PR 정직성을 어떻게 구분하고 평가해야 하는지 실무 관점에서 짚어봅니다.

'국산 AI' 타이틀의 함정 — 오픈소스 커뮤니티가 공공기관 AI를 검증하는 시대
TL;DR 공공기관이 '자체 개발 AI'를 발표할 때 국산 AI 검증 없이 예산이 집행되는 구조적 문제가 브라질과 한국 모두에서 반복되고 있습니다. 오픈소스 커뮤니티는 이제 48시간 안에 AI 모델의 실체를 검증하는 비공식 감시 인프라로 기능합니다. 공공 AI 투명성을 확보하려면, 기술 독자성의 정의와 검증 기준을 제도화하는 것이 시급합니다.
공공기관이 '자체 개발 AI'를 발표했습니다. 국산 AI 검증 없이 언론은 받아쓰고, 예산은 집행됐어요. 그런데 발표 48시간 만에 GitHub 이슈 스레드에 개발자들이 몰려들었거든요. "이거 기존 오픈소스 모델 그냥 붙인 거 아닌가요?" 이 한 줄짜리 질문이, 오늘 이야기의 시작입니다.
발표는 화려했다 — 그런데 GitHub 이슈가 올라왔다

2025년, 브라질 리우데자네이루시 산하 기관 Nex-AGI는 Nex-N2라는 이름의 LLM을 공개 발표했습니다. 공식 보도자료엔 "브라질 최초 지방정부 자체 AI 모델"이라는 타이틀이 붙었고, 현지 언론은 이를 대대적으로 다뤘어요. 'AI 주권'이라는 단어까지 등장했죠.
그런데 공개 직후, 예상치 못한 곳에서 반응이 터졌습니다. GitHub 이슈 스레드에 개발자들이 모델 가중치와 메타데이터를 직접 뜯어보기 시작한 거예요. "학습 로그가 없다", "모델 카드에 베이스 모델 정보가 빠져 있다", "이 가중치 패턴은 기존 오픈소스 모델 병합(merge)과 유사하다"는 지적이 이어졌습니다. Nex-AGI 측도, 리우데자네이루시도 해당 스레드에 공식 반론을 남기지 않았어요. 무응답이 답이 되어버린 셈이죠.
이 에피소드에서 주목할 건 사실 관계보다 구조적 변화입니다. 공식 보도보다 개발자 커뮤니티의 기술 검증이 더 빠르게, 더 정밀하게 이루어지는 시대가 됐다는 것. 그리고 이 이야기가 브라질만의 문제가 아닐 수 있다는 것.
오픈소스 LLM 머지(Merge)란 무엇인가 — 기술 자체는 죄가 없다

오픈소스 LLM을 합치는 건 전혀 이상한 일이 아닙니다
모델 머지(model merging)는 Mergekit 같은 도구를 이용해 복수의 오픈소스 LLM 가중치를 결합하는 기법입니다. Hugging Face 플랫폼에서도 머지 방식으로 만들어진 모델이 수백 건 넘게 공개 배포돼 있어요. 커뮤니티 안에서 활발히 쓰이는, 기술적으로 유효한 방법론이죠.
그렇다면 무엇이 문제였을까요? 핵심은 '머지를 했느냐'가 아닙니다. "우리가 자체 개발했다"고 공식 발표했을 때, 그 발표 어디에도 베이스 모델 출처가 없었다는 거예요. 오픈소스 라이선스—Apache 2.0이든 MIT든, 혹은 Meta의 Llama Community License든—는 모두 귀속 표시(attribution) 의무를 명시하고 있습니다. 코드를 가져다 쓰려면 원래 출처를 밝혀야 한다는, 신뢰 계약이거든요.
이건 AI 실력 문제가 아닙니다. PR 정직성의 문제예요. 오픈소스 생태계는 기여를 공유하고 귀속을 인정하는 상호 신뢰 위에 서 있습니다. 공공기관이 그 생태계의 성과를 활용하면서 기여를 지운다면, 무임승차에 가깝죠.
공공 AI 투명성을 확보하는 새로운 감시자 — 오픈소스 커뮤니티

48시간 안에 국산 AI 검증은 어떻게 이루어졌나
Nex-N2 사례에서 개발자들이 사용한 검증 방법은 그리 복잡하지 않았습니다. AI 모델 카드를 읽고, 가중치 파일의 해시값을 비교하고, 학습 로그 공개 여부를 확인하는 것—공개된 정보만으로 수십 명의 자발적 기여자들이 48시간 이내에 의문을 정리했어요.
언론 보도보다 빠른 기술 검증. 이게 오픈소스 투명성의 역설입니다. 공개했기 때문에 검증이 가능했고, 검증이 가능했기 때문에 과장이 드러났거든요. 만약 이 모델이 비공개로만 운영됐다면 아무도 몰랐을 겁니다. 오픈소스 생태계 자체가 사실상 기술 감시 인프라로 기능하고 있는 셈이에요.
다만, 여기에는 구조적 인센티브 문제도 있습니다. 공공기관 입장에서 "오픈소스 모델 기반으로 파인튜닝했습니다"보다 "자체 개발 AI입니다"가 예산 확보나 정치적 성과로서 훨씬 유리하게 들리거든요. 이 인센티브 구조가 바뀌지 않는 한, 비슷한 패턴은 반복될 가능성이 높습니다.
공공기관 AI 도입 시 국산 AI 검증 — 이 패턴, 한국에서도 낯설지 않습니다

브라질 이야기라고 해서 먼 나라 얘기는 아닙니다. 한국에서도 2024~2025년 사이 과학기술정보통신부, 행정안전부 등 공공 영역에서 'AI 국산화', '공공 LLM 자체 구축'을 내건 프로젝트 발표가 이어졌어요. '국산 AI'라는 타이틀이 붙은 모델과 서비스도 다수 등장했죠.
그런데 '기술 독자성'을 어떤 기준으로 정의하고 검증할 것인지에 대한 제도적 기준은 아직 명확하지 않습니다. 공공 예산이 투입된 AI 프로젝트가 어느 오픈소스 모델을 어떤 라이선스 조건 아래 사용했는지, 어느 수준의 자체 학습이 이루어졌는지를 독립적으로 검증하는 기준이 제도화되지 않은 공백이 존재해요 (과학기술정보통신부 AI 신뢰성 가이드라인, 2024).
AI 모델 카드와 기술 투명성 — 실무자가 던져야 할 질문은?
AI 솔루션 도입을 검토하는 실무자 관점에서, 다음 다섯 가지를 기준으로 삼아보시길 권합니다.
- AI 모델 카드가 공개되어 있는가 — 모델의 목적, 한계, 평가 방식이 문서화되어 있는지 확인해보세요.
- 학습 데이터와 베이스 모델 출처가 명시되어 있는가 — "자체 개발"이라는 표현 뒤에 어떤 모델이 있는지 물어볼 수 있어야 합니다.
- 오픈소스 라이선스 귀속이 표기되어 있는가 — 오픈소스를 활용했다면, 그 사실이 투명하게 공개되어 있는지 확인하세요.
- 제3자 기술 감사(audit) 결과가 공개되어 있는가 — 내부 주장이 아닌 외부 검증 여부를 물어보세요.
- 성능 벤치마크가 표준화된 방식으로 비교 제시되어 있는가 — "우리 모델이 최고"가 아닌, 비교 가능한 수치를 요구할 수 있어야 합니다.
이 체크리스트는 공공 AI 프로젝트 평가뿐 아니라, 어떤 AI 솔루션이나 기술 파트너를 검토할 때도 바로 적용할 수 있어요.
기술보다 솔직함이 더 어렵다 — 그래서 더 중요하다

저희 팀도 오픈소스 생태계 위에서 제품을 만들고 있습니다. 그래서 이 이슈가 남의 이야기처럼 느껴지지 않아요. 오픈소스를 활용하는 건 전략적으로 현명한 선택일 수 있거든요. 문제는 그 사실을 숨기거나 과장하는 방식에 있습니다.
'국산 AI'라는 타이틀보다 "어떤 기술을 어떤 목적으로 어떻게 썼는가"를 명확하게 설명하는 기관과 기업이 장기적으로 더 강한 신뢰를 얻는다고 생각해요. 그 신뢰는 PR 자료에서 오지 않고, 투명한 커뮤니케이션에서 옵니다. 오픈소스 커뮤니티가 감시자 역할을 자처하는 시대라면, 솔직함은 이제 선택이 아니라 생존 조건에 가까워졌거든요.
저희가 발견한 건 이겁니다. B2B 신뢰의 핵심은 "어떤 기술을 쓰는가"보다 "그 사실을 얼마나 정직하게 설명하는가"에 있다는 것. 이건 공공기관만의 이야기가 아니라, AI 솔루션을 도입하고 파트너를 선택하는 모든 조직에 해당합니다.
글쓴이 · RINDA 수출영업 리서치팀 (해외 바이어 발굴·수출 영업 자동화 리서치 에디터)
200+ 한국 수출기업의 해외 바이어 발굴 파이프라인 데이터와 RINDA 플랫폼 내부 관찰을 기반으로, 수출 실무에서 즉시 활용할 수 있는 전략·체크리스트를 편집합니다.
AI 솔루션 도입이나 기술 파트너 선택을 앞두고 "이 팀이 쓰는 기술이 진짜 그들의 것인지"를 어떻게 판단해야 할지 고민된다면, 그린다에이아이 팀이 정리한 기준들이 참고가 될 수 있어요. 해외 바이어 발굴 자동화 솔루션 RINDA도 같은 원칙 위에서 만들어지고 있습니다. 기술 독자성과 신뢰성을 어떤 기준으로 평가해야 할지 팀과 이야기 나눠보고 싶다면, 부담 없이 무료 상담으로 시작할 수 있습니다.
Q. 공공기관이 오픈소스 LLM을 사용하는 것 자체가 잘못인가요? A. 아닙니다. 오픈소스 LLM 활용은 전 세계 정부와 공공기관에서 활발히 이루어지고 있어요. 문제는 활용 자체가 아니라, 그 사실을 투명하게 공개하고 라이선스 조건(귀속 표시 등)을 준수하느냐에 있습니다. "자체 개발"이라는 표현을 쓰려면, 어느 수준의 자체 학습·커스터마이징이 이루어졌는지를 문서화해서 공개하는 것이 신뢰의 기본 조건이에요.
Q. 모델 머지(merge) 방식으로 만들어진 AI가 실제로 쓸 만한가요? A. 기술적으로는 충분히 유효합니다. Hugging Face 오픈 리더보드에서 상위권을 차지한 모델 중에도 머지 방식으로 만들어진 사례가 다수 존재해요. 중요한 건 성능이 나오는지, 그리고 어떤 구성으로 만들어졌는지가 투명하게 공개되어 있는지입니다. 활용 목적과 라이선스 준수 여부가 더 실질적인 판단 기준이에요.
Q. 한국 공공기관 AI 도입 시 기술 독자성을 검증하는 공식 기준이 있나요? A. 2026년 6월 현재 기준으로, 공공 예산이 투입된 AI 프로젝트의 기술 독자성을 독립적으로 검증하는 표준화된 제도적 기준이 공식 제정됐다고 확인하기 어렵습니다. 과학기술정보통신부와 행정안전부에서 AI 품질 및 신뢰성 가이드라인을 지속 업데이트하고 있으나, '자체 개발' 기준의 정의와 검증 절차는 여전히 기관별로 달리 적용되는 상황이에요. 실무자 입장에서는 본문의 체크리스트를 직접 질문 형태로 활용하는 것이 현재로선 가장 현실적인 방법입니다.
Q. 공공 AI 투명성을 높이려면 어떤 제도적 장치가 필요한가요? A. 핵심은 세 가지입니다. 첫째, AI 모델 카드 공개를 공공 조달 요건으로 의무화하는 것. 둘째, '국산 AI' 또는 '자체 개발'의 정의를 기술 기여 비율 등 정량 지표로 명문화하는 것. 셋째, 제3자 독립 감사 결과를 예산 집행 보고서와 함께 공개하도록 제도화하는 것입니다. 오픈소스 커뮤니티의 비공식 검증에만 의존하는 현 상황은, 공공 AI 투명성 확보를 위한 최소한의 제도적 기반도 갖추지 못한 상태라고 볼 수 있습니다.
