Multi-Stream LLM, 프롬프트와 사고와 입출력을 분리해서 병렬로 돌린다
## 무슨 논문인가 arXiv에 "Multi-Stream LLMs"라는 제목의 새 논문이 올라왔어요. 핵심 아이디어를 한 줄로 요약하면, 지금 우리가 쓰는 LLM은 프롬프트 처리, 추론(thinking), 입출력(I/O)을 한 줄로 줄 세워서 처...
맥북 한 대로 1년치 영상을 다 색인했다고? - Gemma 3 27B와 50GB 스왑의 무모한 도전
## 로컬에서 영상 검색 엔진을 만든 사람 이야기 Simbastack 블로그를 운영하는 어떤 개발자가 정말 흥미로운 실험을 공개했어요. **2021년형 맥북** 한 대로 **1년치 개인 영상 아카이브를 전부 색인**해서 검색 가능하게 만든 거예요. ...
AI를 미워하는 건 정당한 감정이다 — 기술 회의론의 새로운 흐름
## 'AI를 사랑하라'는 압박에 지친 사람들 요즘 어딜 가든 AI 이야기뿐이에요. 회사에서는 "AI를 안 쓰면 도태된다"고 하고, 친구들은 ChatGPT로 뭘 했는지 자랑하고, 뉴스는 매일 새로운 AI 모델 출시 소식으로 도배되거든요. 그런데 ...
Rmux — Playwright처럼 코드로 조종하는 새로운 터미널 멀티플렉서
## tmux를 코드로 조종할 수 있다면? 터미널을 자주 쓰는 분이라면 tmux나 screen 같은 도구를 한 번쯤 만져보셨을 거예요. 창 하나에 여러 세션을 띄워놓고 분할해서 쓰는 그 도구들이요. 그런데 이게 진짜 편한 만큼, 자동화하려고 하면...
테크 뉴스를 읽는 당신,
직접 만들어볼 준비 되셨나요?
17가지 수익 모델 실습 · 144+ 강의 · 자동화 소스코드 제공
OpenAI, 드디어 상장 준비 시작하나… 곧 IPO 서류 제출 임박
## 무슨 일이 벌어지고 있나요 OpenAI가 곧 미국 증권거래위원회(SEC)에 기업공개(IPO) 신청 서류를 제출할 준비를 하고 있다는 소식이 나왔어요. 월스트리트저널의 보도에 따르면, 그동안 비영리 재단 형태로 시작했다가 영리 자회사를 운영하며 ...
인튜이트가 3,000명을 정리해고하며 AI에 올인하는 진짜 이유
## 회계 소프트웨어 회사가 왜 갑자기 칼을 빼들었나 터보택스(TurboTax), 퀵북스(QuickBooks), 민트(Mint), 크레딧 카르마(Credit Karma)를 만드는 회사 인튜이트(Intuit)가 전체 직원의 약 20%에 해당하는 3...
LoRA와 Weight Decay, 작은 모델 파인튜닝의 숨은 함정
## LoRA가 표준이 된 지금, 다시 짚어볼 디테일 LLM(거대 언어 모델)을 직접 파인튜닝(fine-tuning, 자기 데이터로 추가 학습시키기)해본 분들이라면 **LoRA(Low-Rank Adaptation, 저차원 적응)** 라는 단어를 한 ...
구글이 자사 AI 검색에 대한 조작 공격과 조용히 싸우고 있다
## AI 검색이 새로운 전쟁터가 됐어요 구글이 검색 결과 페이지 맨 위에 AI가 정리해주는 답변(AI Overviews, AI 개요)을 보여준 지도 이제 꽤 됐죠. 예전엔 "링크 10개를 보여주고 알아서 골라 가세요" 방식이었다면, 지금은 "제...
Qwen3.7-Max 공개 — 알리바바가 정조준한 '에이전트 프론티어'
## Qwen이 무엇이고, 왜 지금 주목해야 할까 알리바바의 Qwen 시리즈는 그동안 오픈웨이트 LLM 분야에서 가장 활발하게 모델을 내놓는 라인 중 하나였어요. Qwen2, Qwen2.5, Qwen3 시리즈로 이어지면서 베이스 모델, 코더, 매...
"초당 N토큰"이 진짜로 얼마나 빠른 건지 직접 체감해 보자
## 토큰 속도, 숫자 너머의 체감 LLM API 문서나 모델 발표 글을 보면 "초당 50토큰", "초당 200토큰" 같은 표현이 자주 나와요. 이게 뭔지 어렴풋이 알긴 하는데, 막상 "그래서 사용자 입장에서 얼마나 빠른 거야?"라고 물으면 답하기가...
OpenAI 모델이 60년 묵은 기하학 난제를 무너뜨렸다 — '추론하는 AI'가 수학에 가져온 충격
## AI가 수학자의 추측을 반증한 사건 수학에서 "추측(conjecture)"이라는 말은 흔히 나오는데요, 이게 뭐냐면 '아직 증명은 안 됐지만 아마도 참일 거야'라고 학계가 오랫동안 믿어온 명제예요. 수십 년, 길게는 수백 년씩 풀리지 않은 채로...
MiniMax M2.7, 실제 ML과 코딩 작업에서 써보니
## 또 새로운 모델? 이번엔 좀 달라요 중국 AI 스타트업 MiniMax가 M2.7이라는 새 모델을 API로 풀었는데요, 단순 벤치마크 점수 자랑이 아니라 실제 머신러닝과 코딩 워크플로우 세 가지에서 직접 돌려본 후기가 공유돼서 흥미로워요. 요...
25년 전 폴 그레이엄이 적어둔 'Lisp로 웹앱 만든 이야기'를 지금 다시 읽는 이유
## 옛날 글이 다시 회자되는 이유 1995년쯤 폴 그레이엄(Paul Graham)이라는 사람이 친구와 둘이서 **Viaweb**이라는 웹 기반 쇼핑몰 빌더를 만들었어요. 브라우저만 켜면 누구나 온라인 가게를 만들 수 있게 해주는 서비스였는데, 이게...
Mercury, 30년 묵은 논리형 언어가 아직도 살아있는 이유
## 잠깐, 논리형 언어가 뭐였더라? 프로그래밍 언어 분류를 학교에서 배울 때 "명령형, 함수형, 객체지향형, **논리형**"이라고 나오는 거 기억하시나요? 거기서 논리형 언어로 항상 등장하는 게 Prolog였는데요, 사실 실무에서 Prolog를...
구글 'Era', 논문 한 편이었던 연구 보조 AI가 실험실 도구로 진화하다
## 무슨 일이 있었나 구글 리서치가 **ERA(Empirical Research Assistance)** 프로젝트를 본격적으로 확장하고 있어요. 원래는 Nature 저널에 게재된 연구 논문 형태였는데, 이번에 일반 연구자들이 쓸 수 있는 실용 ...
구글 딥마인드 'Gemini Omni' 공개, 진짜 옴니모달의 시대를 여는가
## 무슨 일이 벌어졌나 구글 딥마인드가 **Gemini Omni**라는 새로운 모델을 공개했어요. 이름에서 짐작이 되시겠지만, '옴니(omni)'는 '모든 것'이라는 뜻이거든요. 그러니까 텍스트, 음성, 영상, 이미지를 한 번에 다 처리하는 모델이...
세포처럼 자라는 신경망, Growing Neural Cellular Automata 다시 보기
## 도마뱀 꼬리처럼 스스로 복원되는 그림 이미지 한 장을 떠올려 보세요. 그 이미지를 가위로 반쯤 잘라낸 다음, "알아서 다시 자라봐"라고 하면 어떻게 될까요? 말이 안 되는 얘기처럼 들리지만, 2020년에 Distill 저널에 발표된 **Gr...
안드레이 카파시가 Anthropic으로 — AI 업계 지도가 또 한 번 흔들리다
## 카파시가 누구길래 어제 트위터에 짧은 한 문장이 올라왔어요. "I've joined Anthropic." (Anthropic에 합류했습니다.) 보낸 사람은 **안드레이 카파시(Andrej Karpathy)**. 이름은 들어봤지만 정확히 누군지 ...
8B 모델이 가드레일 하나로 53%에서 99%로 — Forge가 보여준 작은 모델의 가능성
## 작은 모델로 큰 모델 이기는 법 요즘 LLM 에이전트 만들어보신 분들 많을 텐데, 한 번이라도 "왜 이렇게 자꾸 엉뚱한 도구를 호출하지", "왜 JSON 형식을 자꾸 깨먹지" 같은 답답함을 겪어보셨을 거예요. 특히 GPT-4나 Claude ...
Mistral이 Emmi AI를 인수했다, 유럽 AI가 '풀스택'으로 가는 이유
## 무슨 일이 있었나 프랑스의 AI 스타트업 **Mistral AI**가 오스트리아 린츠에 본사를 둔 **Emmi AI**를 인수한다고 발표했어요. Mistral은 'ChatGPT의 유럽판 대항마'로 자주 거론되는 회사고요, Emmi AI는 일...