GPU 한 대를 여러 개발자가 나눠 쓴다 — sllm으로 LLM 추론 비용 줄이기
## GPU 비용, 개발자의 영원한 고민 LLM(대규모 언어 모델)을 다뤄본 분이라면 공감하실 텐데요, GPU 비용이 정말 어마어마해요. OpenAI나 Anthropic의 API를 쓰면 토큰당 과금이 되니까 프로토타이핑할 때는 괜찮지만, 본격적으로 ...
AI 코딩 에이전트는 어떻게 만들어질까? 핵심 구성 요소 완전 해부
요즘 Cursor, GitHub Copilot, Claude Code 같은 AI 코딩 도구를 써보신 분 많으시죠? 코드를 짜달라고 하면 알아서 파일을 읽고, 수정하고, 심지어 터미널 명령어까지 실행하는 모습을 보면 "이거 어떻게 만든 거지?" 하는...
Apple이 드디어 NVIDIA eGPU를 허락했다 — Arm Mac에서 NVIDIA 외장 GPU 사용 가능
## Mac에서 NVIDIA를? 진짜요? Mac 사용자, 특히 개발자나 크리에이터라면 한 번쯤 이런 생각을 해보셨을 거예요. "Mac에 NVIDIA GPU를 달 수 있으면 얼마나 좋을까." Apple Silicon(M1, M2, M3, M4 칩)...
Microsoft 'Copilot'이 대체 몇 개야? — 이름은 하나, 제품은 산더미
## Copilot, Copilot, Copilot… 다 같은 거 아니었어? Microsoft 제품을 쓰다 보면 요즘 여기저기서 'Copilot'이라는 이름을 마주치게 되는데요, 처음에는 GitHub Copilot 하나만 있던 것 같았는데 어느새 W...
테크 뉴스를 읽는 당신,
직접 만들어볼 준비 되셨나요?
17가지 수익 모델 실습 · 144+ 강의 · 자동화 소스코드 제공
GPU를 직접 설계해보는 브라우저 게임, 'Mvidia'를 아시나요
## GPU가 뭔지, 게임으로 배운다고? 요즘 AI 시대를 맞이하면서 GPU라는 단어를 정말 많이 듣게 되죠. NVIDIA 주가가 오르네 내리네, GPU 클러스터가 필요하네… 그런데 정작 "GPU가 정확히 어떻게 동작하는 건데?"라고 물으면 명확하게...
Claude Code가 리눅스 커널에 숨어있던 23년 된 취약점을 찾아냈다
## AI가 사람 대신 보안 취약점을 찾는 시대 리눅스 커널에 23년 동안 숨어있던 보안 취약점을 AI 코딩 도구가 발견했다는 소식이 전해졌어요. Anthropic의 AI 코딩 에이전트인 Claude Code를 활용해 코드를 분석하던 중, 수십 ...
CMS는 죽었다, CMS 만세! — 전통적 CMS의 종말과 새로운 시대
## 우리가 알던 CMS, 정말 끝난 걸까요? 웹 개발을 해본 분이라면 CMS라는 단어를 수도 없이 들어봤을 거예요. CMS는 Content Management System, 그러니까 콘텐츠 관리 시스템인데요. 쉽게 말하면 코딩을 잘 몰라도 웹사...
성당, 시장, 그리고 윈체스터 미스터리 하우스 — 소프트웨어 개발 방법론의 세 번째 모델
## 에릭 레이먼드의 비유를 넘어서 소프트웨어 개발 방법론 이야기를 할 때 빠지지 않는 고전이 있어요. 에릭 레이먼드(Eric Raymond)의 1997년 에세이 《성당과 시장(The Cathedral and the Bazaar)》이에요. 이 에...
알고리즘 면접에서는 안 나오지만, 현실에서 쓰이는 독특한 트리 자료구조 이야기
## 트리, 이진 탐색 트리 말고 뭐가 있을까요? 개발자라면 누구나 트리(Tree) 자료구조를 배워요. 이진 탐색 트리(BST), 힙(Heap), AVL 트리 정도는 알고리즘 공부하면서 한 번쯤 만나보셨을 거예요. 그런데 컴퓨터 과학의 세계에는 ...
코드 생성 AI, 스스로를 가르치면 더 똑똑해진다 — Self-Distillation 기법 해부
## 무슨 일이 있었나요? 코드를 생성하는 AI 모델을 더 잘 만들려면 보통 어떻게 할까요? 더 큰 모델을 쓰거나, 더 많은 데이터로 학습시키거나, 사람이 직접 피드백을 주는 RLHF 같은 복잡한 파이프라인을 돌리는 게 일반적이에요. 그런데 최근...
[심층분석] 모든 LLM을 하나로 묶는 오픈소스 AI 플랫폼, Onyx가 바꿀 업무 환경의 미래
## 왜 지금 Onyx 이야기를 해야 할까 AI 챗봇 하나쯤은 다들 써보셨을 거예요. ChatGPT, Claude, Gemini… 선택지가 정말 많아졌죠. 그런데 막상 회사에서 본격적으로 AI를 도입하려고 하면 골치 아픈 문제들이 쏟아져요. "우리 ...
LLM도 감정을 '이해'할까? Anthropic이 밝혀낸 대형 언어 모델 속 감정 개념의 작동 원리
## 기계가 감정을 느끼는 건 아니지만, 뭔가 흥미로운 일이 벌어지고 있어요 Anthropic이 대형 언어 모델(LLM) 내부에서 감정 개념이 어떻게 표현되고 기능하는지를 분석한 연구를 공개했어요. 우리가 ChatGPT나 Claude 같은 AI에...
라즈베리 파이로 나만의 다이얼업 ISP 만들기 — 모뎀 소리 기억나시나요?
## 삐-삐리릭-쮸쮸쮸, 그 시절의 인터넷 2000년대 초반 인터넷을 경험한 분이라면 전화선으로 인터넷에 접속하던 시절을 기억하실 거예요. 전화기를 들고 ISP(인터넷 서비스 제공업체) 접속 번호를 누르면, 모뎀이 "삐이이-쮸르르르륵" 하는 특유의 ...
QEMU로 빅엔디안 환경을 테스트하는 방법 — 바이트 순서 버그, 에뮬레이터로 잡자
## 빅엔디안이 뭔데, 왜 지금 이야기할까요? 혹시 코드를 작성할 때 "엔디안(endianness)"이라는 단어를 들어본 적 있나요? 컴퓨터가 메모리에 숫자를 저장할 때, 바이트를 어떤 순서로 배치하느냐를 뜻하는 개념이에요. 예를 들어 `0x12...
큰 모니터를 포기했더니 오히려 집중력이 올라갔다는 이야기
## 모니터가 클수록 좋다는 공식, 정말 맞을까 개발자 책상 하면 뭐가 떠오르시나요? 아마 많은 분들이 울트라와이드 모니터나 듀얼 모니터 셋업을 떠올리실 거예요. "모니터는 클수록 좋다", "화면이 넓어야 생산성이 올라간다"는 게 개발자 커뮤니티...
루팅 없이 안드로이드에서 리눅스 컨테이너를 돌린다? Podroid 프로젝트
## 안드로이드 폰이 리눅스 서버가 된다 안드로이드 폰에서 리눅스를 돌리고 싶다는 생각, 개발자라면 한 번쯤 해보셨을 거예요. 남는 옛날 폰으로 간단한 서버를 돌린다거나, 외출 중에 리눅스 환경이 급하게 필요할 때라거나요. 그동안에도 Termux...
TinyGo: Go 언어로 임베디드 시스템과 웹어셈블리를 개발할 수 있다고?
## Go 언어의 영역 확장, TinyGo라는 프로젝트 Go 언어 좋아하시는 분들 많으시죠? 간결한 문법, 강력한 동시성 지원, 빠른 컴파일 속도까지. 서버 사이드 개발에서는 이미 확고한 입지를 가지고 있는데요. 그런데 Go로 아두이노 같은 마이...
RAG를 버리고 가상 파일시스템을 도입했더니 AI 문서 어시스턴트가 완전히 달라졌다
## AI가 문서를 이해하는 방식, 근본부터 다시 생각하다 AI 기반 문서 어시스턴트를 만들어본 분이라면 RAG(Retrieval-Augmented Generation)라는 개념을 한 번쯤 들어보셨을 거예요. RAG는 쉽게 말하면 "AI가 대답하...
C로 직접 만든 초경량 RTOS, TinyOS가 Cortex-M 임베디드 세계에 던지는 질문
## 임베디드 개발, RTOS가 왜 필요한 걸까요? 임베디드 시스템을 개발해본 적 있으신가요? 아두이노로 LED 깜빡이는 정도가 아니라, 여러 센서를 동시에 읽고 모터도 제어하고 통신도 해야 하는 상황을 떠올려보세요. 이런 환경에서는 코드를 순서...
리눅스 서버를 라우터로 바꾸려면 뭘 설정해야 할까? 생각보다 손댈 게 많아요
## 네트워크 인터페이스 두 개 꽂았다고 라우터가 되는 건 아니에요 집이나 회사에서 쓰는 공유기, 그러니까 라우터가 하는 일을 한번 생각해보면요. 하나의 장비가 여러 네트워크(예를 들어 인터넷과 내부 LAN)를 연결해주면서, 패킷을 이쪽에서 저쪽...