처리중입니다. 잠시만 기다려주세요.
TTJ 코딩클래스
정규반 단과 자료실 테크 뉴스 코딩 퀴즈
테크 뉴스
Hacker News 2026.06.23 38

30억 파라미터가 Opus 4.5를 이겼다? VibeThinker의 반란

Hacker News 원문 보기

거대 모델 경쟁에 균열이 생겼습니다. VibeThinker는 단 30억(3B) 파라미터의 소형 모델이지만, 수학·코딩 등 추론 벤치마크에서 수백 배 큰 Opus 4.5급 모델을 앞섰다고 주장합니다. 비결은 모델 크기가 아니라 학습 방식에 있습니다. 핵심은 새로운 SFT(지도학습 미세조정)와 GRPO(그룹 상대 정책 최적화) 강화학습을 결합한 파이프라인입니다. 먼저 다양한 풀이 경로를 폭넓게 탐색하도록 SFT로 기반을 다진 뒤, GRPO로 정답에 이르는 추론 과정을 집중 강화해 '작지만 깊게 생각하는' 모델을 만들어냈습니다. 한국 IT 종사자에게 시사점은 분명합니다. 추론 성능이 더 이상 GPU 물량과 파라미터 수에 비례하지 않을 수 있다는 것, 그리고 잘 설계된 RL 학습만으로 온디바이스·저비용 환경에서도 고성능 추론이 가능해진다는 점입니다. 막대한 인프라 없이도 특화 모델로 승부할 수 있는 길이 열리고 있습니다. 물론 벤치마크 수치는 실제 업무 환경과 다를 수 있으니, 도입 전 자사 과제로 검증해보는 자세가 필요합니다.

이 뉴스가 유용했나요?

TTJ 코딩클래스 정규반

월급 외 수입,
코딩으로 만들 수 있습니다

17가지 수익 모델을 직접 실습하고, 1,300만원 상당의 자동화 도구와 소스코드를 받아가세요.

144+실전 강의
17개수익 모델
4.9수강생 평점
정규반 자세히 보기

"비전공 직장인인데 반년 만에 수익 파이프라인을 여러 개 만들었습니다"

실제 수강생 후기
  • 비전공자도 6개월이면 첫 수익
  • 20년 경력 개발자 직강
  • 자동화 프로그램 + 소스코드 제공

매일 AI·개발 뉴스를 받아보세요

주요 테크 뉴스를 매일 아침 이메일로 전해드립니다.

스팸 없이, 언제든 구독 취소 가능합니다.