GitHub 트렌딩을 그대로 나열하지 않고, Claude Code · RAG · 로컬 AI · 에이전트 워크플로우 · 평가 도구 · AI 앱 빌더 관점에서 실제 빌더가 쓸 만한 오픈소스 스택을 다시 정리합니다.
모드 필터는 Lattice가 상위 후보군에서 선별한 큐레이션 뷰입니다.
코드, 문서, SQL 스키마 등을 통합된 지식 그래프로 변환하는 AI 도구.
AI coding assistant skill (Claude Code, Codex, OpenCode, Cursor, Gemini CLI, and more). Turn any folder of code, SQL schemas, R scripts, shell scripts, docs, papers, images, or videos into a queryable knowledge graph. App code + database schema + infrastructure in one graph.
이 레포는 코드 기반 지식 그래프 생성을 자동화해 줌. 코드와 문서를 연결해 줘서 전체 시스템의 구조를 한눈에 볼 수 있어 좋다. 다른 도구보다 설정이 간단해서 바로 적용할 수 있음.
PDF·표·차트까지 깊게 파싱하는 RAG 엔진. 복잡 문서가 많은 기업 KMS용.
RAGFlow — open-source engine based on deep document understanding.
엔터프라이즈 RAG 파이프라인 표준. 컴포넌트 모듈화가 정교해서 큰 시스템에 강해요.
AI orchestration framework to build customizable, production-ready LLM applications.
LLM 기초부터 멀티 에이전트 시스템까지, Agentic AI 학습의 모든 것을 담은 로드맵이다. 엄선된 240개 이상의 자료와 실습 예제로 심층 학습이 가능하다.
A trilingual (繁中 / English / 简中) learning roadmap for agentic AI: from LLM basics to multi-agent systems, with 240+ curated resources and hands-on examples. 中文 AI agent 學習地圖。
웹 파싱 대신 픽셀 데이터를 직접 활용하는 새로운 RAG 검색 방식이다. 복잡한 UI나 멀티모달 정보에서 확장성 높은 검색을 구현할 때 유용하다.
The end of web parsing. The beginning of scalable pixel-native search. link: https://pixelrag.ai/
AI 에이전트와 RAG(Retrieval Augmented Generation) 시스템을 위해 비정형 데이터를 구조화된 청크로 추출, 파싱하여 제공한다. 복잡한 데이터를 LLM이 쉽게 소비하도록 전처리하는 데 특화되어 있다.
Knowhere extracts, parses, and outputs structured chunks ready for AI Agents and RAG.
RAG(Retrieval-Augmented Generation) 시스템의 평가 및 최적화를 위한 오픈소스 프레임워크다. AutoML 방식의 자동화를 통해 RAG 성능을 향상시킨다.
AutoRAG: An Open-Source Framework for Retrieval-Augmented Generation (RAG) Evaluation & Optimization with AutoML-Style Automation
생체 모방 인지 메모리 엔진으로, 새로운 Graph RAG 패러다임을 제시한다. AI 에이전트의 추론 및 장기 기억 능력을 강화하는 데 초점을 맞춘다. 지식 그래프 기반의 향상된 RAG 구현을 원할 때 주목한다.
A bio-inspired cognitive memory engine — a new paradigm for Graph RAG.
지식 그래프와 RAG 기반 AI 에이전트 구축을 위한 실용적 튜토리얼.
📚 《从零开始构建智能体》——从零开始的智能体原理与实践教程
언어 에이전트 그래프
Build resilient agents.
LLM 기반 앱을 만들 때 사실상 표준이 된 파이썬/JS 프레임워크. RAG·에이전트·툴콜 패턴을 쉽게 합성할 수 있어요.
The agent engineering platform.
모든 LLM과 연동되는 고급 기능을 갖춘 오픈소스 AI 챗 플랫폼이다. 사용자 친화적인 UI로 AI 상호작용 경험을 최적화한다.
Open Source AI Platform - AI Chat with advanced features that works with every LLM
로컬 Ollama에 ChatGPT 같은 UI를 붙이는 인기 프로젝트. RAG·툴·아바타까지 풀 패키지.
User-friendly AI Interface (Supports Ollama, OpenAI API, ...)
PDF·DOCX·PPTX·이미지·오디오 등 모든 걸 LLM에 먹이기 좋은 깨끗한 마크다운으로 변환. RAG 전처리에서 압도적으로 편함.
Python tool for converting files and office documents to Markdown.
문장, 단락, 이미지 등의 임베딩을 위한 최첨단 프레임워크. 의미 검색, 클러스터링, 중복 제거 등 다양한 NLP 작업을 효율적으로 수행하게 돕는다.
State-of-the-Art Embeddings, Retrieval, and Reranking
MS의 그래프 기반 RAG. 일반 RAG보다 multi-hop 추론이 강해서 복잡 도메인에 적합.
A modular graph-based Retrieval-Augmented Generation (RAG) system
AI 에이전트가 데이터를 안전하게 조회할 수 있는 데이터 보관소.
AI Data Vault - A query engine for AI Agents to securely query data from any datasource
RAG 시작용으로 가장 쉬운 vector DB. Python에서 5줄로 임베딩 저장·검색.
Chroma — the open-source embedding database.
에이전트를 위한 빠르고 정확한 코드 검색 도구로, 기존 방식 대비 토큰 사용량을 약 98% 절감한다. LLM 에이전트가 코드 컨텍스트를 효율적으로 활용하게 돕는다.
Fast and Accurate Code Search for Agents. Uses ~98% fewer tokens than grep+read
Retrieval-Augmented Generation (RAG)을 위한 모듈형 파이썬 프레임워크이다. 다양한 LLM, 임베딩, 벡터 스토어를 유연하게 연결하며, MCP 통합으로 외부 도구 및 데이터 소스 연동을 지원한다.
RAGLight is a modular framework for Retrieval-Augmented Generation (RAG). It makes it easy to plug in different LLMs, embeddings, and vector stores, and now includes seamless MCP integration to connect external tools and data sources.
GenAI를 앱에 통합하는 데 도움이 되는 도구. 다양한 LLM 및 Vectorstore 지원.
Opiniated RAG for integrating GenAI in your apps 🧠 Focus on your product rather than the RAG. Easy integration in existing products with customisation! Any LLM: GPT4, Groq, Llama. Any Vectorstore: PGVector, Faiss. Any Files. Anyway you want.
내 노트·이메일·문서를 자연어로 검색하는 개인 AI. Obsidian·이메일 통합이 강점.
Your AI second brain. Self-hostable. Get answers from the web or your docs. Build custom agents, schedule automations, do deep research. Turn any online or local LLM into your personal, autonomous AI (gpt, claude, gemini, llama, qwen, mistral). Get started - free.
Python로 작성된 문서 분석 도구. PDF, Office 문서를 분석하여 LLM-ready markdown/JSON을 생성합니다.
Transforms complex documents like PDFs and Office docs into LLM-ready markdown/JSON for your Agentic workflows.
Streamlit 기반으로 RAG 파이프라인의 다양한 구성 요소와 파라미터를 실험한다. Llamaindex를 활용하여 RAG 설정별 성능을 쉽게 비교하고 최적화할 수 있도록 돕는다.
RAGArch is a Streamlit-based application that empowers users to experiment with various components and parameters of Retrieval-Augmented Generation (RAG) pipelines. Utilizing the power of Llamaindex, RAGArch facilitates the testing of different configurations to see how they perform.
운영 환경 AI 시스템을 구축하고 배포하는 오픈소스 플랫폼이다. 사용자가 AI를 완전히 제어하고 확장하며 어디든 배포할 수 있도록 설계된다.
General-purpose AI designed for knowledge workers — creators, strategists, and operators — and individuals seeking AI systems they can truly control to help them get work done, with full flexibility to extend and deploy anywhere (VPC, on-prem, or cloud).
진정한 오픈소스 AI 프로젝트, 모델, 툴, 인프라를 엄선하여 목록화한다. 최신 AI 기술 스택을 탐색하고 검토할 때 첫 참고 자료가 된다.
Curated list of the best truly open-source AI projects, models, tools, and infrastructure.
벡터 데이터베이스 없이 추론 기반 RAG를 위한 문서 인덱싱 시스템이다. LLM 에이전트의 컨텍스트 이해와 활용 능력을 향상시킨다.
📑 PageIndex: Document Index for Vectorless, Reasoning-based RAG
LangChain의 RAG 특화 라이브러리. 인덱싱·쿼리·에이전트 패턴이 RAG에 최적화됨.
LlamaIndex is the leading document agent and OCR platform
실제로 실행 가능한 100개 이상의 AI 에이전트 및 RAG 앱 목록입니다. 복제, 사용자 정의, 배포가 가능하여 LLM 기반 서비스 개발에 유용합니다.
100+ AI Agent & RAG apps you can actually run — clone, customize, ship.
OCR 도구로 PDF나 이미지 문서를 구조화된 데이터로 변환할 수 있습니다.
Turn any PDF or image document into structured data for your AI. A powerful, lightweight OCR toolkit that bridges the gap between images/PDFs and LLMs. Supports 100+ languages.
AI-native 애플리케이션 개발을 위한 오픈소스 플랫폼이다. 에이전트, 함수 호출, 생성형 AI 등 AI 앱 구축에 필요한 핵심 기능을 제공한다.
The open source platform for AI-native application development.
기업이 외부에 데이터 안 내보내고 RAG·챗 운영할 때 쓰는 H2O.ai의 풀 솔루션.
Private chat with local GPT — fully self-hosted, RAG-ready.
Langchain과 ChatGLM, Llama 등 로컬 LLM을 활용한 RAG 및 Agent 애플리케이션. 지식 기반 챗봇 구축에 최적.
Langchain-Chatchat(原Langchain-ChatGLM)基于 Langchain 与 ChatGLM, Qwen 与 Llama 等语言模型的 RAG 与 Agent 应用 | Langchain-Chatchat (formerly langchain-ChatGLM), local knowledge based LLM (like ChatGLM, Qwen and Llama) RAG and Agent app with langchain
내 DB 스키마를 학습시켜 자연어 → 정확한 SQL을 만드는 라이브러리. 분석가 워크플로우에 강해요.
Chat with your SQL database — accurate Text-to-SQL Generation via LLMs using RAG.
Gemini Embedding 2 또는 Qwen3-VL을 활용하여 비디오에서 시맨틱 검색을 수행합니다. 특정 장면이나 콘텐츠를 효율적으로 찾아내는 데 강점을 보입니다.
Semantic search over videos using Gemini Embedding 2 or Qwen3-VL.
PrivateGPT의 현행 메인테이너 포크. RAG 컴포넌트가 가장 잘 정리되어 있어요.
Interact with your documents using the power of GPT, 100% privately, no data leaks
완전 오프라인 RAG의 선구자. 보안이 중요한 환경에서 첫 후보로 검토.
Interact with your documents using the power of GPT, 100% privately, no data leaks.
지식 그래프를 RAG의 1급 시민으로 끌어올린 경량 프레임워크. langchain만큼 무겁지 않게 그래프 RAG를 빠르게 붙일 수 있어요.
[EMNLP2025] "LightRAG: Simple and Fast Retrieval-Augmented Generation"
LLM에 입력되기 전 로그, RAG 청크 등 다양한 데이터를 60-95% 압축한다. 토큰 비용을 줄이면서도 동일한 결과를 얻는 데 효과적이다.
Compress tool outputs, logs, files, and RAG chunks before they reach the LLM. 60-95% fewer tokens, same answers. Library, proxy, MCP server.
LLM 입력 토큰을 60~95% 압축하여 비용을 줄여준다. RAG 청크, 로그, 파일 등 모든 입력에 적용 가능하며, 라이브러리, 프록시, MCP 서버로 활용된다.
Compress tool outputs, logs, files, and RAG chunks before they reach the LLM. 60-95% fewer tokens, same answers. Library, proxy, MCP server.
에이전트가 세션을 넘어 사용자 사실을 기억하게 해주는 메모리 레이어. 사용자별로 정보를 구조화해서 다음 대화에 자동 주입.
Universal memory layer for AI Agents
스트림 처리, 실시간 분석, LLM 파이프라인 및 RAG에 대한 파이선 ETL 프레임워크입니다.
Python ETL framework for stream processing, real-time analytics, LLM pipelines, and RAG.
RAG 전처리할 때 진짜 편한 툴이다. 모든 포맷을 마크다운으로 변환해주니까 데이터 정리하기 좋다. 가성비 좋다.
경량 그래프 RAG가 오늘의 픽다. langchain보다 가볍게 그래프를 붙일 수 있게 해줘서 좋다. RAG 전처리 시간도 3분 정도 단축됨.
에이전트가 세션을 넘어 사용자 정보를 기억하는 건 큰 장점이다. 다음 대화에 자동 주입하는 기능이 특히 좋다. 이 레포의 코드 구조가 간결해서 바로 쓸 만하다.