Tonghyun Kim의 기술 블로그 — 한국어, 일본어, 영어로 씁니다.
프로젝트
최근 글
-
MAI-Code-1-Flash 와 MAI-Thinking-1 — Microsoft 가 Claude Code 를 끊은 자리에 무엇을 깔았는가
2026-06-03, Microsoft 가 MAI-Code-1-Flash 와 MAI-Thinking-1 두 모델을 동시에 발표했다. 5월 22일의 'Microsoft 가 사내 Claude Code 라이선스를 6월 30일자로 종료한다' 는 The Verge 보도의 정확히 6주 뒤다. Code-1-Flash 는 GitHub Copilot 의 디폴트 모델로 즉시 롤아웃됐고, SWE-Bench Pro 에서 Claude Haiku 4.5 를 16 점 차로 앞선다고 주장한다. Thinking-1 은 35B active / 1T total 의 MoE 추론 모델이고, AIME 2026 에서 94.5 %, Claude Sonnet 4.6 과 SWE-Bench Pro 에서 동률, blind 인간 평가에서 우세라고 주장한다. 'Claude 의존' 의 다음 챕터인가, 마케팅의 첫 발자국인가.
-
Adafruit 가 받은 Fenwick 의 편지 — Flux.ai 의 CFAA 카드와 오픈 하드웨어 커뮤니티의 위축 효과
2026-06-01, Adafruit 가 자사 블로그에 한 줄의 발표를 올렸다. 5월 22일자로 Flux.ai (Defy Gravity, Inc.) 의 법률 대리인 Fenwick & West 가 '명예훼손 가능성' 과 '컴퓨터 사기 및 남용법 (CFAA)' 을 동시에 거론하는 cease-and-desist 편지를 보냈다는 내용이다. Adafruit 의 응답은 단호하다 — '우리는 Flux 의 서버 설정 오류로 공개된 정보만 접근했고, 책임 있는 공개 (responsible disclosure) 의 통상적 절차를 따랐다'. HN 의 613 점·248 코멘트가 이 한 통의 편지에 모이는 이유는, 그것이 단일 회사의 다툼이 아니라 오픈 하드웨어 커뮤니티의 운영 자체에 던지는 신호이기 때문이다.
-
Bonsai Image 4B — 1.125 비트 가중치로 iPhone 위에 들어간 4B 디퓨전 모델
2026-06-01, PrismML 이 발표한 Bonsai Image 4B 가 HN 261 점·92 코멘트를 모았다. 4B 파라미터 디퓨전 트랜스포머의 가중치를 {-1, +1} 의 1.125 effective bits 또는 {-1, 0, +1} 의 1.71 effective bits 로 양자화해, 7.75 GB 모델을 0.93 GB (1-bit) 또는 1.21 GB (ternary) 로 줄였다. iPhone 17 Pro Max 에서 512×512 이미지를 9.4 초에 생성한다. FLUX.2 Klein 의 88 ~ 95 % 정확도를 보존하면서 8.3 × 의 모델 크기 감소. '클라우드 디퓨전' 의 단가가 0 에 가까워지는 시간이 다가오고 있는가.
-
'도메인 전문성이 늘 진짜 해자였다' — Brethorst 가 짚은 코드의 무가치화와 검증의 새 단가
2026-05-31, Brett Brethorst 의 짧은 블로그 글이 HN 에 올라 810 점·508 코멘트를 모았다. 주장은 한 줄이다 — '소프트웨어 엔지니어링의 진짜 해자는 코드 작성 능력이 아니라 도메인 전문성이었고, AI 가 그 둘을 분리해 도메인 전문성만 남겨 놓았다'. 결제 시스템의 압류 규정, 의료 코딩, 보험 통계, 물류 디스패치 — 'AI 가 만든 코드가 컴파일되고 테스트를 통과해도 미묘하게 비싸게 틀린' 영역들. 이 진단이 엔지니어의 다음 10 년에 던지는 무게는 무엇인가.
-
13만 5천 별의 마크다운 변환기 — Microsoft markitdown 이 짚은 'LLM 시대 문서 인제스천' 의 새 표준
2026-05-30 GitHub Trending 의 일간 2 위에 microsoft/markitdown 이 2,798 stars-today 로 다시 올라왔다. 누적 별 13만 5천 개. PDF·PPT·Word·Excel·이미지·오디오·YouTube URL 까지 16 종 이상의 파일을 마크다운으로 변환한다. 그러나 이 도구의 진짜 가치는 변환 기능 자체가 아니다. 'LLM 이 가장 잘 이해하는 형식이 마크다운이다' 라는 단일 전제 위에서, Unstructured / LlamaParse / Apryse 같은 기존 시장과 정반대 방향의 디자인 결정을 내렸다는 점이다. 무엇이 정반대인가, 그리고 그 결정의 함의는 무엇인가.
-
'Postgres 면 충분하다' — DBOS 가 짚은 지속 실행 엔진의 탈(脫)전용화
2026-05-29, DBOS 의 블로그 글 '내구 실행에는 Postgres 면 충분하다' 가 HN 에 올라 289 점·123 코멘트를 모았다. 주장은 한 줄로 정리된다 — 워크플로 엔진의 가장 본질적 가치 (체크포인팅, 단일 실행 보장, 장애 복구) 를 외부 오케스트레이터 없이 Postgres 의 락과 무결성 제약만으로 구현할 수 있다. Temporal·Airflow·Step Functions 의 시대가 끝나는 신호인가, 아니면 또 하나의 '데이터베이스 위 만능론' 인가.
-
에이전트 승인 피로 — 'Continue? Y/N' 게임이 짚은 자동화의 역설
2026-05-28, 'Continue? Y/N' 이라는 60 초짜리 브라우저 게임이 HN 에 올라 265 점·115 코멘트를 모았다. 게임의 질문은 한 줄이다 — '당신은 AI 명령을 얼마나 주의 깊게 읽는가'. 그러나 그 한 줄이 건드린 것은 에이전틱 코딩 도구의 가장 깊은 모순이다. 승인 프롬프트는 안전을 만드는가, 아니면 무심한 'Yes' 의 습관을 만드는가. 그리고 에이전트가 승인 단계 이전에 이미 악성 코드를 심을 수 있다면, 그 프롬프트는 보안인가 연극인가.
-
Claude Skills 의 폭발 — GitHub Trending 의 절반이 스킬팩이 된 일주일의 의미
2026 년 5 월 27 일 오전, GitHub Trending 의 일간 / 주간 상위에 'skill' 또는 'skills' 가 이름에 들어간 리포가 일곱 개 동시에 올라왔다. 'taste-skill' 이 1430 stars-today, 'anthropic-cybersecurity-skills' 가 880, 'stop-slop' 이 539, 'academic-research-skills' 가 주간 8422 stars. 패키지 매니저도, 공식 마켓플레이스도 없는 상태에서 일어난 이 폭발이 무엇을 의미하는가. 그리고 이 생태계의 다음 단계는 어디인가.
-
Stripe 와 'friendly fraud' — 결제 플랫폼이 분쟁 시그널을 공유하지 않는 진짜 이유
2026-05-26, 한 셀러의 짧은 블로그 글이 HN 248 점과 158 코멘트를 모았다. 자신이 운영하는 작은 쇼핑몰에서 같은 구매자가 두 차례 'friendly fraud' (도착한 물건을 안 받았다며 챠지백을 거는 행위) 를 친 사례에 대해 Stripe 가 '우리는 한 가맹점의 분쟁 증거를 다른 가맹점의 사기 시그널로 사용하지 않는다' 고 답했다는 진술이다. 단일 사례지만 그 진술의 의미는 결제 인프라 전반의 구조적 비대칭을 가리킨다.
-
AI 로 더 좋게, 그러나 더 느리게 — Nolan Lawson 이 깬 '생산성 그래프' 의 가정
Nolan Lawson 의 짧은 글이 2026 년 5 월 25 일 HN 최상단을 차지하며 1167 점·433 코멘트를 모았다. 주장은 한 줄로 정리된다 — 'AI 는 빠르게 코드를 쓰게 해 주는 것이 아니라, 같은 시간 안에 더 꼼꼼히 검토하게 해 준다'. 그러나 이 한 줄의 무게는 가볍지 않다. AI 코딩 도구 평가에서 줄곧 단일 변수로 간주돼 온 '속도' 라는 가정 자체가 깨지기 때문이다. 다중 에이전트 리뷰의 실제 워크플로와, 그 워크플로가 가져오는 '의도된 느림' 의 의미를 짚는다.
-
100만 대 AI 서비스 스캔의 충격 — Intruder 보고서가 드러낸 '속도와 보안의 비대칭'
보안 기업 Intruder 가 200만 호스트를 스캔해 100만 대의 노출된 AI 서비스를 분석한 결과가 5월 24일자로 일본 엔지니어 커뮤니티에 번역·정리됐다. Ollama API 의 31% (약 1,600 인스턴스) 가 인증 없이 접근 가능하고, 그 가운데 518 대는 OpenAI / Google / Anthropic 의 유료 모델을 무방비로 감싸고 있다. 정부·금융권의 n8n / Flowise 인스턴스 90 여 대가 공개 인터넷에 노출되어 있다는 사실까지 더해진다. 이는 단일 보고가 아니라 시대의 진단이다 — 배포 속도가 보안 절차를 추월한 첫 사례.
-
Microsoft 가 Claude Code 를 끊은 진짜 이유 — '발로 투표' 와 '12개월 예산 몇 달 소진' 의 단위경제학
2026-05-22, The Verge 가 Microsoft 의 내부 Claude Code 라이선스가 6월 30일자로 종료된다고 보도했다. 표면의 이유는 'GitHub Copilot CLI 로 이관' 이지만, HN 의 227 코멘트가 밝힌 진짜 사정은 두 갈래다 — 개발자들이 발로 투표해 Copilot 대신 Claude Code 를 골랐다는 사실, 그리고 그 결정이 2026년 회사 AI 예산을 단 몇 달에 소진시켰다는 단위경제학. 토큰의 시대에 도구는 어떻게 평가되는가.
-
yt-dlp 가 Bun 을 끊은 진짜 이유 — 1.3.14 라는 분기점과 'vibe-coded' 의 정치학
2026-05-22, yt-dlp 가 Bun 의 지원 범위를 1.2.11 ~ 1.3.14 의 좁은 구간으로 강제 제한했다. 공식 이슈는 두 가지 이유를 든다 — npm lockfile 이 무시되는 공급망 위험과, Bun 이 Claude 로 Rust 재작성되면서 'vibe-coded' 가 됐다는 신뢰 손실. HN 의 514 코멘트가 매달린 진짜 질문은 작은 1.3.14 라는 숫자가 아니라, AI 가 코드를 짜는 시대의 오픈소스 신뢰 모델이 어디로 가는가다.
-
uv 의 UX 는 무너졌는가 — 속도 1위 도구가 사람을 위한 명령어를 잊은 자리
Astral 의 uv 는 Python 패키지 도구의 속도 표준을 새로 썼지만, 같은 시기 HN 의 324 점 스레드는 'uv 는 환상적이지만 패키지 관리 UX 는 엉망' 이라는 제목으로 144 개의 코멘트를 모았다. 빠름이 표준이 된 다음 단계에서, uv add 의 상한 부재와 uv lock --upgrade 의 핵폭탄 의미론은 사람을 위한 도구인가 기계를 위한 도구인가.
-
Railway-GCP 8시간 정지 — 멀티클라우드의 컨트롤 플레인 단일 장애점
2026-05-19 22:20 UTC, Google Cloud 의 사전 통지 없는 자동화가 Railway 의 프로덕션 계정 전체를 정지시켜 8시간 동안 모든 리전·모든 워크로드의 503 과 콘솔 로그인 차단을 만들었다. GCP·AWS·Metal 의 멀티클라우드 메시는 1시간을 버텼지만 라우트 캐시 만료와 함께 무너졌다. 멀티클라우드는 진짜 멀티인가, 아니면 컨트롤 플레인이 어디에 있느냐의 문제인가.
-
agentmemory 가 던지는 질문 — AI 에이전트의 '기억' 은 윈도우인가 압축인가
rohitg00/agentmemory 가 GitHub Trending 주간 7,976 스타로 폭주했다. 4 단계 메모리 구조와 Ebbinghaus decay, BM25·벡터·그래프 하이브리드 검색이 mem0 의 단순 벡터 대비 R@5 95.2% 를 찍는다. AI 에이전트의 기억 문제는 컨텍스트 윈도우 확장으로 풀리는가, 의식적 압축으로 풀리는가.
-
Qwen 3.7 Preview — 오픈 가중치의 정체성과 'Arena 점수' 라는 통화
Qwen3.7-Max 가 Text Arena 13위에 진입했다. 알리바바는 텍스트 6번, 비전 5번 랩이 됐다. 그러나 'Preview' 라는 단서, 파라미터 미공개, 라이선스 미공개는 무엇을 말하는가. 오픈 가중치 진영의 챔피언이 폐쇄 모델 쪽으로 한 발 옮기는 신호일 수 있다.
-
Project Glasswing 과 Mythos — 취약점을 사냥하는 LLM 의 시대가 열릴 때
Anthropic 이 통제된 파트너에게만 공개한 Mythos Preview 는 PoC 까지 만들어 내는 공격 보안 전문 LLM 이다. Cloudflare 가 5월에 공개한 평가 보고서는 두 가지 사실을 말한다. 모델 자체의 거부 행동만으로는 안전 경계가 안 되며, 일반 코딩 에이전트로는 의미 있는 취약점 발견이 불가능하다는 것이다.
-
Modal 이 cold start 를 40배 줄인 방법 — serverless GPU 의 새 경제학
33분이 50초로 줄었다. LP·FUSE·C/R·CUDA-checkpoint 가 네 층으로 쌓인 결과다. Modal 의 5월 발표는 단순한 최적화 자랑이 아니라, GPU 추론 인프라가 'serverless' 라는 단어를 처음으로 진지하게 가질 수 있게 된 변곡점이다.
-
Files.md 와 '두 번째 뇌' 의 해체 — PKM 이 다시 작아지는 이유
5월 14일 HN 상단을 차지한 Files.md 는 단순한 Obsidian 대안이 아니다. 'AI 가 채워 주는 두 번째 뇌'에 정면으로 반대하는 선언이고, Memory.md 패턴과 정확히 반대편에 선 PKM 철학이다. 같은 마크다운 파일을 다루면서도 완전히 다른 미래를 그리는 두 흐름을 비교한다.