GitHub 트렌딩을 그대로 나열하지 않고, Claude Code · RAG · 로컬 AI · 에이전트 워크플로우 · 평가 도구 · AI 앱 빌더 관점에서 실제 빌더가 쓸 만한 오픈소스 스택을 다시 정리합니다.
모드 필터는 Lattice가 상위 후보군에서 선별한 큐레이션 뷰입니다.
노코드에 가깝게 LLM 앱을 만드는 비주얼 워크플로우 플랫폼. RAG·툴·observability가 한 곳에 묶여 있어요.
Open-source LLMOps platform — visual workflow builder for AI apps with RAG, agents, and observability.
LLM 앱의 trace·prompt·eval을 한 곳에서. 프로덕션 LLM 디버깅 필수 도구.
Open source LLM engineering platform — observability, prompts, evals.
Stable Diffusion 만든 사람들이 만든 새 모델. SDXL을 능가하는 품질로 화제.
Inference repo for FLUX — high-quality image generation.
에러 모니터링 사실상 표준. Vercel·Next.js와의 통합이 매끄럽고 alert 워크플로우가 정교.
Cross-platform application monitoring, with a focus on error reporting.
한국어 포함 다국어 TTS. 추론이 빠르고 CPU에서도 실시간 가능.
High-quality multi-lingual text-to-speech library by MyShell.
소형 LLM에 최적화된 AI 코딩 에이전트다. 4B 파라미터 모델로 87% 벤치마크 성능을 달성하여, 리소스 제약이 있는 환경에서도 고성능 AI 코딩을 구현할 때 효과적이다.
AI coding agent optimized for small LLMs. 87% benchmark with 4B-active model.
OpenAI 공식 평가 프레임워크. 커스텀 eval 만들기 쉬움.
Evals is a framework for evaluating LLMs and LLM systems.
ISO 26262, ISO/SAE 21434, Automotive SPICE 등 자동차 엔지니어링 분야를 포괄하는 100개 이상의 Claude AI 스킬을 제공한다. 자동차 산업의 기능 안전, 사이버 보안, 품질 관리 표준을 Claude AI로 다루는 데 활용된다.
100+ installable Claude skills covering Engineering areas such as, ISO 26262 functional safety, ISO/SAE 21434 cybersecurity, ISO 21448 SOTIF, AIAG-VDA quality (APQP/PPAP/FMEA), Automotive SPICE, and continuous improvement tools — every builder paired with a confirmation reviewer.
RAG(Retrieval-Augmented Generation) 시스템의 평가 및 최적화를 위한 오픈소스 프레임워크다. AutoML 방식의 자동화를 통해 RAG 성능을 향상시킨다.
AutoRAG: An Open-Source Framework for Retrieval-Augmented Generation (RAG) Evaluation & Optimization with AutoML-Style Automation
iOS, Android, Progressive Web Apps을 위한 강력한 크로스 플랫폼 UI 툴킷입니다. HTML, CSS, JavaScript을 사용하여 고급 UI를 구축할 수 있습니다.
A powerful cross-platform UI toolkit for building native-quality iOS, Android, and Progressive Web Apps with HTML, CSS, and JavaScript.
고품질의 TypeScript 정의를 제공하는 레포지토리입니다. TypeScript 정의를 지원합니다.
The repository for high quality TypeScript type definitions.
노드.js 프로덕션 프로세스 관리자. 내장 로드 밸런서가 포함.
Node.js Production Process Manager with a built-in Load Balancer.
GNU/Linux, BSD, macOS, Windows를 위한 `top`/`htop` 대체 시스템 모니터링 도구이다. 시스템 리소스 사용량을 실시간으로 직관적으로 보여준다.
Glances an Eye on your system. A top/htop alternative for GNU/Linux, BSD, Mac OS and Windows operating systems.
스타일이 없는 헤드리스 컴포넌트의 표준. shadcn/ui가 이 위에서 동작하니 사실상 필수 의존성.
Radix Primitives is an open-source UI component library for building high-quality, accessible design systems and web apps. Maintained by @workos.
실시간 글로벌 지능형 대시보드. AI 기반 뉴스 집계, 지리정치 모니터링, 인프라 추적.
Real-time global intelligence dashboard. AI-powered news aggregation, geopolitical monitoring, and infrastructure tracking in a unified situational awareness interface
다양한 데이터 소스에서 메트릭, 로그, 트레이스를 시각화하는 오픈 소스 플랫폼.
The open and composable observability and data visualization platform. Visualize metrics, logs, and traces from multiple sources like Prometheus, Loki, Elasticsearch, InfluxDB, Postgres and many more.
OpenMMLab에서 개발한 객체 탐지 툴박스이자 벤치마크이다. 다양한 최신 객체 탐지 알고리즘을 구현하고 평가하는 데 사용된다.
OpenMMLab Detection Toolbox and Benchmark
Rust로 작성된 오픈 소스 결제 스위치. 빠른, 신뢰할 수 있는, 저렴한 결제.
Open source, composable payments platform | PCI compliant | SaaS and Self-host options | Enables connectivity to multiple payment, payout, fraud, vault and tokenization providers | Uplifts authorization with intelligent routing and revenue recovery | Reduce payment processing costs with cost observability | Reduces payment ops with reconciliation
메트릭스, 이벤트, 실시간 분석에 적합한 스케일링 데이터 스토어.
Scalable datastore for metrics, events, and real-time analytics
LLM 벤치마크 표준. HellaSwag·MMLU 같은 평가를 한 번에 돌리는 프레임워크.
A framework for few-shot evaluation of language models.
Claude Code, Codex, Cursor 등 AI 코딩 도구의 토큰 사용량과 비용을 시각화하는 대화형 TUI 대시보드다. 비용 효율적인 AI 코딩을 돕는다.
See where your AI coding tokens go. Interactive TUI dashboard for Claude Code, Codex, and Cursor cost observability.