Live · 테크씬 frontline 한국어 브리프

LatticeAI Intelligence PlatformAI 인텔리전스 플랫폼

5월 1일 이전 슬롯

← 최신으로

4월 30일 (목)

밤 10:00 슬롯

5건·AI 3 / 일반 2

퍼머링크

AI · Models

64일 전

Cohere Command R+ v2 공개

Cohere가 Command R+ v2를 공개했다. RAG 특화 모델로 검색→재정렬→생성 파이프라인 전체를 한 모델 안에서 처리한다. 가격이 R+ v1 대비 35% 인하, 평가에서 GPT-5.4와 검색 지연 추론 단계만 비교하면 거의 동급이다.

왜 지금RAG 특화 모델이 비용 우위로 다시 매력적.

써먹기내 RAG 파이프라인 1개 라우터에 R+ v2 추가, A/B.

Cohere MCPBrave Search MCP

AI · Models

64일 전

긴 컨텍스트 평가법, 새 표준

arxiv cs.CL 신착이 NIAH 류 needle-in-haystack 평가의 한계를 정리하고 후속 표준을 제안한다. 'multi-needle reasoning' 메트릭 도입, 1M 컨텍스트에서 모델 간 차이를 더 명확히 본다. 평가 코드 공개됨.

왜 지금1M 컨텍스트 모델 비교 시 NIAH만으론 부족했음.

써먹기내 도메인 데이터 1만 토큰 분량으로 multi-needle 평가 시도.

arxiv cs.CL 스킬스펙 → 테스트

AI · Models

64일 전

Interconnects — DPO vs PPO 정리

Nathan Lambert의 새 글이 DPO와 PPO 비교 논쟁을 정리했다. 결론은 '데이터 품질이 알고리즘 선택보다 5배 중요', 다만 high-stakes safety tuning에는 PPO가 여전히 안전 마진 우위. 표 한 장 요약이 매우 깔끔하다.

왜 지금alignment 알고리즘 선택할 때 가장 정직한 정리.

써먹기DPO 시도해보기 전에 데이터 품질 점검 체크리스트부터.

Interconnects

Dev · Tools

64일 전

llama.cpp v0.5, GGUF v3

ggerganov/llama.cpp가 v0.5로 점프했다. GGUF v3 포맷이 도입되며 KV-cache 양자화 옵션이 정식 노출됐다. M3/M4 Max에서 70B 모델 추론 속도가 22% 향상됐다는 벤치도 함께 발표됐다.

왜 지금로컬 추론 속도/메모리 트레이드오프가 의미있게 개선.

써먹기기존 GGUF 모델 v3로 변환, llama-bench로 비교.

llama.cpp

Dev · Tools

64일 전

Continue v0.10, 워크스페이스 인덱스

continuedev/continue가 v0.10을 냈다. 핵심은 워크스페이스 단위 임베딩 인덱스가 IDE 확장 안에서 자동으로 갱신된다는 점. Cursor의 codebase 검색에 가까운 경험을 오픈소스로 무료로 제공한다.

왜 지금코드 에이전트 IDE 확장의 OSS 옵션이 한 단계 성숙.

써먹기VS Code에 Continue 설치하고 내 프로젝트에 인덱스 빌드.

Continue 스킬코드 닥터 리뷰

4월 30일 (목)

오후 6:00 슬롯

5건·AI 3 / 일반 2

퍼머링크

AI · Models

64일 전

Imagen 4, 텍스트 안에 텍스트

Google AI가 Imagen 4를 발표했다. 가장 큰 변화는 이미지 안의 텍스트 렌더가 거의 SOTA에 도달했다는 점. 한국어/일본어 글자도 정확히 그린다. 디자인 목업, 광고 소재, OG 이미지 자동 생성 워크플로우의 진입 장벽이 또 한 번 낮아졌다.

왜 지금한국어 텍스트 이미지 자동 생성이 처음으로 안정적.

써먹기OG 이미지 라우트에 Imagen 4 폴백 시도.

Google AI

AI · Models

64일 전

Import AI #420 — 칩 부족 다각화

Jack Clark의 Import AI 420호. 칩 부족 대응으로 노드 다각화(중국 산업 GPU, AMD MI300 도입 사례)가 메인 토픽. AGI 정책 동향 두 줄 요약과 로봇 학습 페이퍼 한 편 추천이 따라온다. 늘 그렇듯 톤이 차분해서 신뢰감 있다.

왜 지금GPU 외 옵션이 실제 운영 단계로 진입 중.

써먹기내 추론 워크로드의 H100 외 폴백 가능성 평가.

Import AI

AI · Models

64일 전

Chip Huyen, LLM eval 책 출간

Chip Huyen의 신간 'AI Engineering: Production LLMs' 출간. 평가/관측/배포에 200쪽 이상 할애한 게 차별점. 실제 회사들의 사례(예: 사례 5 — 텍스트→SQL 평가 셋 만들기)가 풍부해 책장보다 옆에 두고 자주 펼쳐 보는 매뉴얼에 가깝다.

왜 지금프로덕션 LLM 평가의 정본 후보.

써먹기사례 5 모방해서 내 텍스트→쿼리 평가셋 50문항 직접 작성.

Chip Huyen 스킬스펙 → 테스트

Dev · Tools

64일 전

토스 tech — 사내 AI assistant

토스 기술블로그가 사내용 AI assistant 빌드 회고를 공개했다. 임베딩 인덱스 설계, 사내 슬랙/노션 데이터 권한 가드, 비용 가시성 대시보드까지 전체 스택을 다룬다. 비슷한 사내 도구 만드는 팀이라면 거의 그대로 복사 가능한 청사진.

왜 지금한국 핀테크에서 검증된 사내 RAG 구조.

써먹기권한 가드 패턴(Notion ACL → 임베딩 메타) 그대로 차용.

토스 tech MCPNotion MCP

Dev · Tools

64일 전

Naver D2 — 검색에 LLM 도입

Naver D2가 자사 검색 결과 요약에 LLM을 어떻게 도입했는지 글로 풀었다. 검색 latency 예산 안에 LLM 호출을 넣기 위한 캐싱 전략과 fail-soft 폴백 설계가 핵심. 한국어 검색 UX 사례 중 가장 디테일이 풍부하다.

왜 지금검색 latency 안에 LLM 끼워넣기 표준 사례.

써먹기SSE 스트리밍 + 캐시 패턴을 내 검색 UX에도 시도.

Naver D2 MCPBrave Search MCP

4월 30일 (목)

오후 2:00 슬롯

5건·AI 3 / 일반 2

퍼머링크

AI · Models

65일 전

xAI Grok 4 베타 시작

xAI가 Grok 4 베타를 X 프리미엄 사용자 대상으로 열었다. 멀티모달 강화, 실시간 X 데이터 통합이 핵심. 평가 점수보다 '실시간 SNS 컨텍스트가 답에 자연스럽게 들어간다'는 UX 차이가 더 화제가 된다.

왜 지금실시간 데이터 + LLM 결합의 첫 대중 사례.

써먹기X 프리미엄으로 1주일 굴려보고 실시간 답변 일관성 메모.

xAI

AI · Models

65일 전

Test-time training, 작은 모델 SOTA

arxiv cs.LG 신착 페이퍼가 test-time training으로 작은 모델이 큰 모델을 일부 작업에서 따라잡았다. 추론 시점에 입력 컨텍스트로 가벼운 어댑터 갱신을 하는 게 핵심. 추가 비용은 일반 추론의 1.4배 수준이라 운영 가능성도 있다.

왜 지금온디바이스 LLM 품질이 한 번 더 점프할 신호.

써먹기TTT 어댑터 코드를 작은 8B 모델에 시도해보기.

arxiv cs.LG

AI · Models

65일 전

smol AI Daily #530

smol.ai 데일리 #530은 Mistral Large 3 루머, Cursor 차트, 그리고 RAG 평가 새 도구들을 정리했다. 가장 흥미로운 건 'eval-as-a-service' 스타트업 5곳 비교 표. 분기 안에 한두 곳은 합병/실패 가능성이 높아 보이지만 시장 매핑 자체로 가치 있음.

왜 지금RAG eval 도구 시장이 빠르게 정리되는 중.

써먹기비교 표에서 무료 티어 있는 도구 1개 직접 시도.

smol.ai

Dev · Tools

65일 전

Open Interpreter 0.4 메이저

OpenInterpreter/open-interpreter 0.4가 나왔다. local-os 모드가 안정화되며 macOS/Linux에서 자동 셸 액션 권한 모델이 명확해졌다. 보안 sandbox 옵션이 디폴트로 켜져 있어 이전 0.3 vs 안전성 격차가 크게 줄어들었다.

왜 지금OI를 데일리에 굴려도 될 수준의 안전성에 도달.

써먹기local-os 모드로 작은 자동화(파일 정리) 한 개 시도.

Open Interpreter MCPFilesystem MCP

Dev · Tools

65일 전

block/goose v0.3, MCP 우선

block/goose v0.3은 MCP 서버 등록 UX를 개선했다. Claude Desktop과 같은 형식의 mcp.json을 그대로 사용 가능. Block의 OSS 에이전트답게 SDK 호환성을 진지하게 챙기는 방향이 보인다.

왜 지금MCP 생태계 안에서 호환 가능한 OSS 에이전트 옵션 추가.

써먹기내 MCP 서버를 Claude Desktop과 goose 두 곳에 모두 연결 테스트.

Goose MCPFilesystem MCP MCPGitHub MCP

4월 30일 (목)

오전 10:00 슬롯

8건·AI 5 / 일반 3

퍼머링크

AI · Models

65일 전

HF Blog — 서버리스 파인튜닝

HuggingFace 블로그 메인 글이 서버리스 파인튜닝 가이드. 데이터셋 업로드부터 LoRA 저장, 배포까지 5분 안에 마무리되는 워크플로우를 풀어준다. 가격 페이지가 같이 공개돼 진입 장벽이 한 번 더 낮아졌다.

왜 지금내 데이터로 작은 LoRA 만들기가 진짜로 쉬워짐.

써먹기내 도메인 텍스트 100건으로 7B 모델 LoRA 한 번 학습.

HF Blog

AI · Models

65일 전

Reka Flash, 멀티모달 1B

Reka가 1B 멀티모달 모델 Reka Flash를 공개했다. 이미지/비디오/오디오 입력을 모두 받으면서 모바일 디바이스에서 동작 가능한 첫 멀티모달 SOTA. 평가 점수는 GPT-5.4-mini 멀티모달과 비교할 만한 수준이라는 게 화제.

왜 지금온디바이스 멀티모달의 첫 실용 임계점.

써먹기내 사이드 앱에 Reka Flash 임베딩 시도.

Reka

AI · Models

65일 전

Together Inference v3, 가격 컷

Together AI가 Inference v3을 공개했다. 자체 라우팅으로 같은 모델을 더 싼 호스트로 자동 전환, 평균 32% 비용 절감. 오픈웨이트 모델을 SaaS에서 굴리는 팀에는 즉시 영향이 있다. 마이그레이션 비용 거의 0.

왜 지금오픈웨이트 추론 비용 곡선이 한 번 더 꺾임.

써먹기Together v3로 라우팅 변경, 일주일 비용 차이 측정.

Together MCPVercel MCP

AI · Models

65일 전

Eugene Yan — RecSys with LLMs

Eugene Yan의 새 글이 추천 시스템에 LLM을 끼워 넣는 5가지 패턴을 정리했다. retrieval-rerank-generate 외에 user understanding 단계에서만 LLM을 쓰는 hybrid 패턴이 가장 비용 효율적이라는 결론. 실무 회사 사례 인용이 풍부하다.

왜 지금추천 시스템 운영 비용 안에서 LLM 도입 청사진.

써먹기내 추천 시스템에 user-understanding LLM 단계 PoC.

Eugene Yan

AI · Models

65일 전

a16z AI — '엔터프라이즈 AI 네이티브'

a16z가 분기 보고서로 'AI native enterprise'를 정의했다. 단순 도입 단계를 넘어 워크플로우 자체가 LLM 가정 위에 설계된 회사들의 패턴 분석. 가장 흥미로운 건 'AI hire' 카테고리 — 사람보다 에이전트를 먼저 고용 결정하는 사례 8곳을 인터뷰했다.

왜 지금엔터프라이즈 AI 채택 곡선의 변곡점 신호.

써먹기내 사이드 프로젝트의 어떤 워크플로우가 'AI 우선'인지 라벨.

a16z AI

더 이전 슬롯 보기

테크씬 frontline,
진짜 혁신만 담아서.

5월 1일 이전 슬롯

4월 30일 (목)

Cohere Command R+ v2 공개

긴 컨텍스트 평가법, 새 표준

Interconnects — DPO vs PPO 정리

llama.cpp v0.5, GGUF v3

Continue v0.10, 워크스페이스 인덱스

4월 30일 (목)

Imagen 4, 텍스트 안에 텍스트

Import AI #420 — 칩 부족 다각화

Chip Huyen, LLM eval 책 출간

토스 tech — 사내 AI assistant

Naver D2 — 검색에 LLM 도입

4월 30일 (목)

xAI Grok 4 베타 시작

Test-time training, 작은 모델 SOTA

smol AI Daily #530

Open Interpreter 0.4 메이저

block/goose v0.3, MCP 우선

4월 30일 (목)

HF Blog — 서버리스 파인튜닝

Reka Flash, 멀티모달 1B

Together Inference v3, 가격 컷

Eugene Yan — RecSys with LLMs

a16z AI — '엔터프라이즈 AI 네이티브'

claude-code v2.4.1 핫픽스

HN — '대형 모노레포 후회'

Pragmatic Eng — 'Senior+ 인터뷰'

테크씬 frontline, 진짜 혁신만 담아서.

Cohere Command R+ v2 공개

긴 컨텍스트 평가법, 새 표준

Interconnects — DPO vs PPO 정리

llama.cpp v0.5, GGUF v3

Continue v0.10, 워크스페이스 인덱스

Imagen 4, 텍스트 안에 텍스트

Import AI #420 — 칩 부족 다각화

Chip Huyen, LLM eval 책 출간

토스 tech — 사내 AI assistant

Naver D2 — 검색에 LLM 도입

xAI Grok 4 베타 시작

Test-time training, 작은 모델 SOTA

smol AI Daily #530

Open Interpreter 0.4 메이저

block/goose v0.3, MCP 우선

HF Blog — 서버리스 파인튜닝

Reka Flash, 멀티모달 1B

Together Inference v3, 가격 컷

Eugene Yan — RecSys with LLMs

a16z AI — '엔터프라이즈 AI 네이티브'

claude-code v2.4.1 핫픽스

HN — '대형 모노레포 후회'

Pragmatic Eng — 'Senior+ 인터뷰'

테크씬 frontline,
진짜 혁신만 담아서.