Live · 2026년 6월 10일 오후 6:00 슬롯 · AI/개발 한국어 큐레이션

LatticeAI Intelligence PlatformAI 인텔리전스 플랫폼

Live · 2026년 6월 10일 오후 6:00 슬롯 · AI/개발 한국어 큐레이션 · Lattice

AI · Models

46일 전

Grok/Gemini, 쓸모없는 벤치마크의 함정

Grok과 Gemini는 실제 개발 작업에서 '최고의 모델'로 평가받은 적이 없다. 이들은 쓸모없는 벤치마크에서 근소한 우위를 점했을 뿐이다. 심각한 개발 작업에 이 모델들을 주력으로 사용했다면, 그 판단력을 신뢰하기 어렵다. LLM 선택 시 실질적인 성능과 유용성을 고려해야 함을 시사한다.

왜 지금AI 모델 성능 경쟁 속에서 실제 효용성을 간과하기 쉽기에 지금 이 시점에 주목할 필요가 있다.

써먹기vibe-coder는 LLM 선택 시 벤치마크 점수보다는 실제 코드 생성 및 문제 해결 능력을 직접 테스트해본다.

x_lattice_live 프롬프트에이전틱 코더 레포자율 리서치 에이전트, 자고 일어나면 모델이 좋아져 있음 스킬리팩터링 및 정리 전문가

AI · Models

46일 전

RelayOps, 텔레콤 지원 AI 오픈소스 공개

RelayOps는 텔레콤 및 구독 결제 관련 고객 지원 큐를 위한 AI 에이전트다. 54% 자동 해결율과 0건의 위험한 자동 조치를 달성했다. Qwen2.5 모델 기반으로 RAG와 독립적인 가드레일을 결합하여 신뢰도를 높인다. 전체 의사 결정 과정을 추적하고 감사할 수 있는 콘솔을 제공한다. 현재 큐를 운영 중인 기업을 대상으로 디자인 파트너를 모집 중이다.

왜 지금AI 에이전트의 실제 운영 환경 적용 사례와 성능 지표가 공개되어, 개발 및 운영 효율성 개선에 대한 기대를 높인다.

r_machinelearning

AI · Models

47일 전

Claude Fable 5 가격 커스텀 설정

Wes McKinney의 AgentsView는 로컬 코딩 에이전트 토큰 사용량을 시각화하는 도구다. Claude Fable 5 출시 후 AgentsView에 아직 미포함돼 가격 데이터베이스에 수동으로 추가해야 했다. Simon Willison은 Fable 5를 역분석해 AgentsView에서 커스텀 가격을 설정하는 방법을 알아냈다. 이를 통해 다양한 LLM 모델의 비용을 정확하게 추적하고 관리할 수 있다.

왜 지금다양한 LLM 모델의 등장으로 비용 추적 및 관리가 중요해진다.

써먹기새로운 LLM 모델의 비용을 AgentsView에 등록해 토큰 사용량을 정확히 파악한다.

Simon Willison MCPGitHub 스킬계획 수립

2026년 6월 10일 수,
frontline 정리.

Grok/Gemini, 쓸모없는 벤치마크의 함정

RelayOps, 텔레콤 지원 AI 오픈소스 공개

Claude Fable 5 가격 커스텀 설정

OCaml 런타임, C에서 Rust로 이식

Obsidian으로 나만의 LLM 위키 구축

2026년 6월 10일 수,frontline 정리.

Grok/Gemini, 쓸모없는 벤치마크의 함정

RelayOps, 텔레콤 지원 AI 오픈소스 공개

Claude Fable 5 가격 커스텀 설정

OCaml 런타임, C에서 Rust로 이식

Obsidian으로 나만의 LLM 위키 구축

2026년 6월 10일 수,
frontline 정리.