Hacker News 2026.06.22 45

스위스가 만든 '완전 공개' AI, Apertus — '주권형 AI'가 뭐길래?

스위스에서 온 '완전 공개' AI, Apertus

요즘 '오픈소스 AI'라고 하면 메타의 라마(Llama)나 프랑스의 미스트랄(Mistral)을 많이 떠올리실 거예요. 그런데 이 모델들이 정말 완전히 열려 있느냐 하면, 사실 좀 애매하거든요. 학습이 끝난 모델의 가중치(weights, 쉽게 말하면 AI의 '두뇌'에 해당하는 숫자 덩어리예요)는 내려받을 수 있지만, 정작 '어떤 데이터로, 어떻게 학습시켰는지'는 공개를 안 하는 경우가 대부분이에요. 그래서 엄밀히 말하면 '공개 가중치(open weights)' 모델이지, '오픈소스'라고 부르기엔 좀 부족했죠.

스위스에서 나온 Apertus는 바로 이 지점을 정면으로 건드린 모델이에요. 이름부터가 라틴어로 '열려 있다'는 뜻인데, 진짜로 이름값을 하더라고요. 가중치는 물론이고, 학습에 쓴 데이터, 학습에 사용한 코드와 레시피, 중간 체크포인트(학습 도중 저장해 둔 모델 상태)까지 전부 다 공개했거든요. 누군가 마음만 먹으면 똑같은 모델을 처음부터 다시 만들어 볼 수 있을 정도로요.

누가, 어떻게 만들었나

Apertus는 스위스의 두 명문 공대인 EPFL과 ETH 취리히, 그리고 스위스 국립슈퍼컴퓨팅센터(CSCS)가 손잡고 만들었어요. 학습은 '알프스(Alps)'라는 슈퍼컴퓨터에서 돌렸는데요, 엔비디아의 최신 칩을 잔뜩 묶어 만든 유럽에서도 손꼽히는 규모의 컴퓨터예요.

모델은 두 가지 크기로 나왔어요. 80억 개(8B) 파라미터짜리 가벼운 버전과, 700억 개(70B) 파라미터짜리 큰 버전이죠. 파라미터라는 게 뭐냐면, AI가 학습하면서 조정하는 '손잡이'의 개수라고 생각하면 돼요. 손잡이가 많을수록 더 똑똑해질 여지가 있지만 그만큼 무거워지죠. 8B는 어지간한 서버에서도 굴려볼 만하고, 70B는 제대로 된 GPU가 필요한 본격적인 모델이에요.

학습에 쓴 데이터 양도 어마어마해요. 약 15조(15T) 개의 토큰으로 학습시켰는데요, 토큰은 AI가 글자를 쪼개서 인식하는 단위예요. 특히 눈에 띄는 건 1,000개가 넘는 언어를 다뤘다는 점이에요. 보통 큰 모델들은 영어 데이터가 압도적으로 많고 나머지 언어는 구색만 맞추는데, Apertus는 평소 AI가 잘 못하던 소수 언어까지 꽤 신경 써서 챙겼어요.

'주권형 AI(Sovereign AI)'라는 키워드

이 모델을 이해하려면 '주권형 AI'라는 말을 알아야 해요. 이게 뭐냐면, '우리나라(혹은 우리 지역)의 AI를 남의 손에 맡기지 말고 직접 갖자'는 생각이에요. 지금 강력한 AI는 대부분 미국의 빅테크나 중국 기업이 쥐고 있잖아요. 그러다 보니 유럽 입장에선 불안한 거죠. 우리 기업과 공공기관이 쓰는 핵심 인프라를 외국 회사의 비공개 모델에 의존해도 되나? 그 회사가 갑자기 정책을 바꾸거나 서비스를 끊으면? 데이터는 안전한가? 이런 고민이요.

Apertus는 그 답으로 '그럼 투명하게, 규칙 지켜가면서, 공공이 직접 만들자'고 한 셈이에요. 그래서 학습 데이터를 모을 때도 웹사이트가 '내 데이터 쓰지 마세요(opt-out)'라고 표시한 건 존중하고, 유럽의 데이터·저작권 규정을 지키려고 신경을 많이 썼어요. 단순히 성능 숫자만 자랑하는 게 아니라 '어떻게 만들었는지 떳떳하게 보여줄 수 있는' 모델을 지향한 거죠.

업계 맥락에서 보면

비슷한 흐름이 곳곳에 있어요. 아랍에미리트의 Falcon, 프랑스의 Mistral, 중국의 Qwen이나 DeepSeek처럼 각 지역이 자기 모델을 내놓는 게 요즘 트렌드거든요. 다만 이들 대부분은 '성능'이나 '공개 가중치'에 초점을 맞췄지, Apertus처럼 데이터·코드·과정까지 통째로 까는 '완전 공개'를 내세운 경우는 드물어요. 성능만 놓고 보면 최상위 비공개 모델(GPT나 Gemini 같은)에는 아직 못 미치는 게 사실이지만, '투명성'과 '재현 가능성'이라는 가치에서는 독보적인 위치에 있어요.

연구자 입장에서 이건 굉장히 큰 의미예요. 그동안은 '이 모델이 왜 이렇게 답하지?'를 파고들고 싶어도 안이 깜깜한 블랙박스라 손을 못 댔거든요. Apertus처럼 데이터부터 다 열려 있으면, 편향이 어디서 생겼는지, 특정 능력이 어떤 데이터에서 왔는지 추적해 볼 수 있어요.

한국 개발자에게는?

우리에게도 시사점이 많아요. 한국도 '한국어를 잘하면서, 우리가 통제할 수 있는 AI'에 대한 수요가 분명히 있잖아요. 공공기관이나 금융·의료처럼 데이터를 외부로 못 빼는 분야에서는 비공개 클라우드 모델을 쓰기 부담스러울 때가 많거든요. 이럴 때 Apertus 같은 완전 공개 모델은 '안을 다 들여다보고, 내 서버에서 직접 돌리고, 필요하면 우리 데이터로 추가 학습(파인튜닝)까지' 할 수 있는 선택지가 돼요.

당장 한국어 성능이 최고 수준은 아닐 수 있지만, 다국어를 폭넓게 다뤘다는 점에서 한국어 파인튜닝의 출발점으로 실험해 볼 가치는 충분해요. 무엇보다 '이렇게 투명하게 만들 수도 있구나' 하는 하나의 본보기로서 배워둘 만하죠.