
가격표는 안 바뀌었는데, 청구서는 왜 늘었을까
Claude Opus 4.7로 업그레이드된 이후 "어? 토큰이 더 많이 나오는 것 같은데?" 하는 이야기가 개발자들 사이에서 돌고 있었어요. 실제로 측정해본 분의 결과가 공유됐는데요, 같은 세션을 돌려봤을 때 비용이 20~30% 정도 올라간다는 수치가 나왔어요. 모델 가격표는 그대로인데 왜 이런 일이 생길까, 원인은 바로 토크나이저에 있었어요.
토크나이저가 뭐고 왜 중요한가
토크나이저 이야기 먼저 간단히 풀고 갈게요. AI 모델은 "글자"나 "단어"를 그대로 읽지 않아요. 문장을 잘게 쪼개서 "토큰"이라는 단위로 만든 다음, 그 토큰들을 숫자로 바꿔서 처리하거든요. 그리고 대부분의 API는 이 토큰 개수로 요금을 매겨요. 즉, 토크나이저가 문장을 얼마나 잘 쪼개느냐가 곧 요금이 되는 셈이에요.
예를 들어 "안녕하세요"라는 문장이 있을 때, 어떤 토크나이저는 이걸 2개 토큰으로 쪼개고, 어떤 건 5개로 쪼갤 수 있어요. 같은 내용을 전달하는데 토큰이 많아지면? 당연히 돈이 더 나가죠. 가격표는 "백만 토큰당 얼마"로 정해져 있어도, 실제 청구액은 토크나이저 효율에 크게 좌우되는 거예요.
Opus 4.7에서 뭐가 바뀌었나
측정 결과를 보면, 4.7 버전에서 토크나이저가 새로 바뀌었어요. 새 토크나이저는 특정 언어나 특정 포맷(특히 코드, JSON, 긴 컨텍스트)에서 토큰 수가 눈에 띄게 늘어나요. 영어 일반 텍스트는 비슷하거나 약간 줄기도 하는데, 코드나 구조화된 데이터에서는 확실히 손해예요.
재미있는 건 한국어, 일본어 같은 CJK 언어에서도 토큰이 더 많이 잡힌다는 점이에요. 원래 CJK는 토크나이저가 불리한 언어였거든요. 한 글자가 여러 토큰으로 쪼개지는 경우가 많았는데, 4.7에서는 이게 조금 더 심해졌다는 보고가 있어요. 한국어 중심으로 서비스를 돌리는 팀이라면 이게 체감 비용으로 바로 이어져요.
거기에 더해서 Claude Code 같은 에이전트성 제품은 한 세션 안에서 여러 번의 도구 호출이 일어나잖아요. 도구 호출마다 메타데이터가 붙고, 그 메타데이터도 전부 토큰으로 카운트되기 때문에 세션 단위로 보면 20~30%라는 증가폭이 나오는 거예요.
실무에서 어떻게 대응해야 할까
첫째, 모니터링을 꼭 걸어두세요. 모델을 업그레이드할 때마다 "같은 요청이 몇 토큰으로 찍히는지"를 측정하는 테스트를 돌려두면, 비용 폭탄을 미리 잡을 수 있어요. 회귀 테스트랑 비슷한 개념인데 대상이 성능이 아니라 토큰 수인 거죠.
둘째, 프롬프트를 간결하게 다듬는 습관이 더 중요해졌어요. 예전에는 "컨텍스트 많이 넣을수록 좋다"는 분위기였는데, 이제는 불필요한 문장 하나가 그대로 요금으로 찍혀요. 같은 효과를 내는 짧은 프롬프트를 찾는 게 진짜 스킬이 되고 있어요.
셋째, 프롬프트 캐싱을 적극적으로 쓰세요. 앤트로픽은 반복되는 시스템 프롬프트를 캐시해서 할인해주는 기능이 있는데, 이걸 잘 쓰면 상승분을 상당 부분 상쇄할 수 있어요.
넷째, Sonnet과 Haiku로 적절히 분산하세요. 모든 요청을 Opus로 돌리는 건 낭비인 경우가 많아요. 분류, 요약 같은 단순 작업은 Haiku로 빼고, 진짜 추론이 필요한 것만 Opus로 보내는 라우팅 구조가 점점 중요해지고 있어요.
다른 모델과의 비교
GPT-4 계열도 비슷한 흐름이 있었어요. 버전이 올라갈 때 가끔 토크나이저가 조용히 바뀌어서 요금이 변하는 경우가 있었거든요. 구글 Gemini는 상대적으로 CJK에 좀 더 유리한 편이고, 오픈소스 진영의 Llama 3.x 계열은 토크나이저 어휘집이 커서 한국어 효율이 꽤 좋아요.
결국 모델 선택할 때 "벤치마크 점수"만 보면 안 되고, "내가 다룰 데이터에서 이 토크나이저가 얼마나 효율적인가"를 같이 봐야 해요. 이건 앞으로도 계속 체크해야 할 부분이고요.
마무리
Opus 4.7의 20~30% 비용 상승은 가격 인상이 아니라 토크나이저 변경의 부수 효과예요. 그런데 청구서에 찍히는 금액은 똑같이 오르니까, 실무에서는 "세션당 얼마"를 직접 측정하는 습관이 필요해요. 여러분은 모델 업그레이드할 때 어떤 비용 모니터링 방법을 쓰시는지 궁금해요.
🔗 출처: Hacker News
"비전공 직장인인데 반년 만에 수익 파이프라인을 여러 개 만들었습니다"
실제 수강생 후기- 비전공자도 6개월이면 첫 수익
- 20년 경력 개발자 직강
- 자동화 프로그램 + 소스코드 제공