멀티 에이전트 AI 개발, 결국 분산 시스템 문제였다
## AI 에이전트 여러 개를 동시에 쓰면 무슨 일이 벌어질까 요즘 AI 코딩 에이전트를 활용한 소프트웨어 개발이 빠르게 확산되고 있잖아요. Claude Code, Cursor, Copilot 같은 도구들이 코드를 자동으로 작성해주는 시대인데요, 여...
디퓨전 모델이 텍스트를 생성한다고? Introspective Diffusion이 바꾸는 언어 모델의 패러다임
## 언어 모델, 새로운 방식으로 글을 쓰기 시작하다 우리가 쓰는 ChatGPT나 Claude 같은 대형 언어 모델(LLM)은 전부 **자기회귀(autoregressive)** 방식으로 작동해요. 이게 뭐냐면, 글자를 왼쪽에서 오른쪽으로 하나씩 ...
LLM이 실제 코드베이스에서 진짜 보안 취약점을 찾아낼 수 있을까? N-Day-Bench 이야기
## AI가 보안 감사관을 대체할 수 있을까? 요즘 AI 코딩 도구가 코드를 짜주는 건 이제 놀랍지도 않죠. 근데 한 발 더 나아가서, **AI가 이미 존재하는 코드에서 보안 취약점을 찾아낼 수 있을까**요? 그것도 장난감 예제가 아니라 실제 오픈소...
AMD가 만든 GAIA — 내 컴퓨터에서 AI 에이전트를 돌리는 오픈소스 프레임워크
## AI 에이전트, 클라우드 없이도 가능할까? AI 에이전트라는 말, 요즘 정말 많이 들리죠. 단순히 질문에 답하는 챗봇이 아니라, 스스로 계획을 세우고, 도구를 사용하고, 여러 단계를 거쳐 복잡한 작업을 수행하는 AI를 말하는 건데요. 문제는 대...
테크 뉴스를 읽는 당신,
직접 만들어볼 준비 되셨나요?
17가지 수익 모델 실습 · 144+ 강의 · 자동화 소스코드 제공
AMD ROCm, CUDA의 아성에 도전하다 — 지금 어디까지 왔을까?
## GPU 컴퓨팅의 절대 강자, CUDA AI와 딥러닝이 폭발적으로 성장하면서, GPU를 활용한 병렬 컴퓨팅은 이제 선택이 아니라 필수가 됐어요. 그런데 이 분야에서 NVIDIA의 CUDA는 거의 독점적인 위치를 차지하고 있거든요. CUDA가 뭐냐...
프론티어 모델의 시대는 끝나가고 있는 걸까? AI 발전 속도에 대한 냉정한 시선
## 계속 빨라지기만 할 줄 알았는데 GPT-3가 나왔을 때 세상이 놀랐고, GPT-4가 나왔을 때 또 한번 놀랐죠. 그래서 많은 사람들이 이 속도로 계속 가면 GPT-5, GPT-6은 얼마나 대단할까 기대했어요. 그런데 최근 들어 업계 안팎에서 조...
Anthropic, 프롬프트 캐시 TTL을 1시간에서 5분으로 조용히 축소 — API 비용에 미치는 영향은?
## 무슨 일이 있었나요? Claude API를 사용하는 개발자들에게 꽤 중요한 변경사항이 하나 발견됐어요. Anthropic이 지난 3월 6일에 **프롬프트 캐시(Prompt Cache)의 TTL(Time To Live)을 기존 1시간에서 5분...
Marimo Pair: AI 에이전트가 리액티브 노트북 안에서 직접 코드를 짜주는 세상
## 노트북 환경이 에이전트의 작업 공간이 된다면? 요즘 AI 코딩 에이전트 이야기가 끊이지 않죠. Cursor, Copilot, Devin 등 다양한 도구들이 나오고 있는데요, 대부분은 IDE나 터미널 환경에서 동작해요. 그런데 데이터 분석이나...
AI 코딩 에이전트, 코드 치기 전에 논문부터 읽히면 어떻게 될까?
## 코딩 에이전트의 한계, 느끼고 계시죠? 요즘 AI 코딩 에이전트가 정말 많아졌어요. Cursor, Copilot, Claude Code 같은 도구들이 코드를 대신 짜주고, 버그도 잡아주고, 리팩토링도 해주죠. 근데 쓰다 보면 한 가지 답답한...
KL 발산이 도대체 뭔데? 직관적으로 이해하는 6.5가지 방법
## 머신러닝 하다 보면 꼭 만나는 그 녀석 머신러닝을 공부하다 보면 손실 함수(loss function) 이야기가 빠지지 않잖아요. 그중에서도 **KL 발산(Kullback-Leibler Divergence)**이라는 개념은 정말 여기저기서 등...
ML의 미래는 '기묘함' 그 자체 — AI가 만드는 세상은 왜 이상해질 수밖에 없는가
## 무슨 이야기인가요? 분산 시스템 전문가로 유명한 **Kyle Kingsbury**(Aphyr)가 머신러닝과 AI의 미래에 대해 꽤 도발적인 글을 썼어요. 그의 핵심 주장은 이래요 — ML 시스템이 우리 생활 곳곳에 스며들수록, 세상은 점점 더 ...
178개 AI 모델의 '글쓰기 지문'을 분석했더니, 놀라운 유사성 지도가 나왔다
## AI 모델도 필체가 있다? 사람마다 글쓰기 스타일이 다르듯, AI 모델에도 고유한 '문체 지문'이 있다는 사실을 아시나요? rival.tips라는 리서치 팀이 무려 178개의 AI 모델을 대상으로 글쓰기 스타일을 분석하고, 서로 얼마나 비슷한지...
GPU 한 장으로 1000억 파라미터 LLM을 풀 정밀도 학습한다고? — MegaTrain 논문 해설
## GPU 한 장으로 초거대 모델을 학습시킨다? 대규모 언어 모델(LLM)을 학습시키려면 보통 수십~수백 대의 GPU가 필요해요. GPT-3 급(1750억 파라미터) 모델을 학습하려면 수천 개의 A100 GPU를 몇 달간 돌려야 하는 수준이죠....
256바이트로 보스전을 만들었다 — 극한의 사이즈코딩 세계
## 256바이트, 진짜 이게 전부 프로그래밍을 하다 보면 최적화에 대해 생각하게 되잖아요. 번들 사이즈를 줄이고, 메모리를 아끼고, 응답 속도를 높이고. 그런데 이걸 극단까지 밀어붙인 사람들이 있어요. 단 **256바이트** — 그러니까 영문 ...
2019년 "GPT-2는 너무 위험해서 공개 못 한다"던 OpenAI, 그 후 7년이 지났다
## 되돌아보는 AI 역사의 한 장면 2019년 2월, OpenAI가 흥미로운 발표를 했어요. 자신들이 만든 텍스트 생성 AI 모델 **GPT-2**가 "너무 위험해서" 전체 모델을 공개할 수 없다는 거였죠. 당시 GPT-2는 15억 개의 파라미...
AI 시대에 '안목'이 더 중요해진 이유 — 코드를 잘 짜는 것만으로는 부족해요
## 누구나 코드를 생성할 수 있는 시대가 왔어요 ChatGPT, Claude, Copilot 같은 AI 도구들이 코드를 뚝딱 만들어주는 시대가 됐잖아요. 이제 프롬프트 몇 줄이면 웬만한 함수는 바로 나오고, 심지어 전체 앱 구조까지 잡아주기도 ...
AI로 1만 장의 역사 사진을 지도 위에 되살리다 — OldNYC 프로젝트 이야기
## 오래된 사진 수만 장, 지도 위에 올리는 프로젝트가 있어요 OldNYC라는 프로젝트를 들어보신 적 있나요? 뉴욕 공공도서관(NYPL)이 소장하고 있는 수십 년 전 뉴욕 거리 사진들을 디지털화해서 지도 위에 핀으로 찍어주는 웹사이트인데요. 사...
Google, AI 에이전트 오케스트레이션 테스트베드 'Scion' 오픈소스로 공개
## AI 에이전트가 여러 개 동시에 일하려면? AI 에이전트 하나가 똑똑한 건 이제 놀랍지 않은 시대가 됐어요. 진짜 어려운 건 여러 에이전트를 동시에 돌리면서 서로 협력하게 만드는 거예요. 이메일 처리하는 에이전트, 일정 잡는 에이전트, 코드...
맥북에서 Gemma 4 멀티모달 모델을 파인튜닝하자 — Apple Silicon 전용 도구 등장
## 맥북으로 멀티모달 AI를 파인튜닝할 수 있게 됐어요 오픈소스 프로젝트 **Gemma 4 Multimodal Fine-Tuner**가 GitHub에 공개됐어요. 이름에서 알 수 있듯이, Google의 오픈소스 모델인 **Gemma 4의 멀티모...
중국 Zhipu AI의 GLM-5.1 — '긴 호흡의 작업'을 해내는 AI 에이전트를 향해
## Zhipu AI가 GLM-5.1을 공개했어요 중국의 AI 기업 **Zhipu AI**(智谱AI)가 자사 대규모 언어모델의 최신 버전인 **GLM-5.1**을 발표했어요. 이번 모델의 부제가 "Towards Long-Horizon Tasks", ...