GitHub 트렌딩을 그대로 나열하지 않고, Claude Code · RAG · 로컬 AI · 에이전트 워크플로우 · 평가 도구 · AI 앱 빌더 관점에서 실제 빌더가 쓸 만한 오픈소스 스택을 다시 정리합니다.
에이전트가 세션을 넘어 사용자 사실을 기억하게 해주는 메모리 레이어. 사용자별로 정보를 구조화해서 다음 대화에 자동 주입.
Universal memory layer for AI Agents
에이전트가 세션을 넘어 사용자 정보를 기억하는 건 큰 장점이다. 다음 대화에 자동 주입하는 기능이 특히 좋다. 이 레포의 코드 구조가 간결해서 바로 쓸 만하다.
객체 감지, 분할, 시각적 인식 태스크를 위한 플랫폼.
Detectron2 is a platform for object detection, segmentation and other visual recognition tasks.
Devin 같은 자율 SW 엔지니어를 누구나 자기 환경에서 띄울 수 있는 오픈 플랫폼.
OpenDevin — a platform for autonomous software engineers.
CLIP 같은 비전-언어 모델을 적은 데이터로 파인튜닝하는 기법 구현체.
Conditional Prompt Learning for Vision-Language Models.
파이썬 패키지 관리. 의존성 관리.
Python packaging and dependency management made easy
단순한 task list + 실행 + 평가 루프로 자율 에이전트의 본질을 가장 짧게 보여주는 코드.
AI-powered task management system with goal-oriented planning.
중국어로 작성된 교과서입니다. 실행 가능한 예제를 제공합니다.
《动手学深度学习》:面向中文读者、能运行、可讨论。中英文版被70多个国家的500多所大学用于教学。
음성 인식의 표준. 99개 언어 지원하고 한국어 정확도가 매우 높아요.
Robust Speech Recognition via Large-Scale Weak Supervision
알리바바의 HuggingFace 대안. 중국 모델·비디오 생성 모델이 풍부.
ModelScope — bring the notion of Model-as-a-Service to life.
Python로 작성된 문서 분석 도구. PDF, Office 문서를 분석하여 LLM-ready markdown/JSON을 생성합니다.
Transforms complex documents like PDFs and Office docs into LLM-ready markdown/JSON for your Agentic workflows.
MetaGPT 다중 에이전트 프레임워크로 사용됩니다.
🌟 The Multi-Agent Framework: First AI Software Company, Towards Natural Language Programming
내 DB 스키마를 학습시켜 자연어 → 정확한 SQL을 만드는 라이브러리. 분석가 워크플로우에 강해요.
Chat with your SQL database — accurate Text-to-SQL Generation via LLMs using RAG.
Sesame가 공개한 대화형 음성 생성 모델. 감정·억양 표현이 기존 OSS TTS와 다른 차원.
Conversational Speech Model from Sesame — natural-sounding voice generation.
지식 그래프와 RAG 기반 AI 에이전트 구축을 위한 실용적 튜토리얼.
📚 《从零开始构建智能体》——从零开始的智能体原理与实践教程
Python으로 구현된 태스크 매트릭스.
확산 모델을 제어할 수 있는 라이브러리.
Let us control diffusion models!
PDF 문서를 번역하는 데 사용할 수 있는 도구로, Google, DeepL, Ollama, OpenAI와 같은 서비스를 지원합니다.
[EMNLP 2025 Demo] PDF scientific paper translation with preserved formats - 基于 AI 完整保留排版的 PDF 文档全文双语翻译,支持 Google/DeepL/Ollama/OpenAI 等服务,提供 CLI/GUI/MCP/Docker/Zotero
실제 AI 개발자.
The first real AI developer
스캔된 PDF 파일에 OCR 텍스트 레이어를 추가하여 PDF 파일을 검색할 수 있는 도구입니다.
OCRmyPDF adds an OCR text layer to scanned PDF files, allowing them to be searched
이미지/비디오/오디오 확산 모델 라이브러리의 표준. GPT Image 2를 내부에서 fine-tune이나 후처리할 때 함께 가는 코어 의존.
🤗 Diffusers: State-of-the-art diffusion models for image, video, and audio generation in PyTorch.
GFW를 우회하는 데 사용할 수 있는 프록시 도구입니다.
LangChain 워크플로우를 노드 그래프로 만드는 도구. Flowise와 비슷하지만 Python 진영.
LangFlow is a UI for LangChain, designed with react-flow.
Python 언어를 위한 산업 강도 자연어 처리 도구입니다.
💫 Industrial-strength Natural Language Processing (NLP) in Python
Karpathy의 GPT 학습 코드. 단순함이 무기이고 LLM 내부를 직접 보고 싶을 때.
The simplest, fastest repository for training/finetuning medium-sized GPTs.
A proxy tool to bypass GFW.
웹 보안과 펀테스트/CTF를 위한 유용한 패킷과 우회 방법입니다.
A list of useful payloads and bypass for Web Application Security and Pentest/CTF
OpenAI Realtime API와 결합해 전화·통화 수준의 음성 에이전트를 만들 때 사실상 표준 프레임워크.
A powerful framework for building realtime voice AI agents.
PDF·표·차트까지 깊게 파싱하는 RAG 엔진. 복잡 문서가 많은 기업 KMS용.
RAGFlow is a leading open-source Retrieval-Augmented Generation (RAG) engine that fuses cutting-edge RAG with Agent capabilities to create a superior context layer for LLMs
Claude Code의 기본 개념부터 고급 에이전트 구축까지 시각적 예제를 통해 설명하는 가이드이다. 즉시 활용 가능한 템플릿을 제공하여 Claude Code 학습을 돕는다.
A visual, example-driven guide to Claude Code — from basic concepts to advanced agents, with copy-paste templates that bring immediate value.
Grok 1은 오픈 소스 프로젝트로, XAI(XAI-ML, XAI-NLP, XAI-RL)와 관련된 연구를 지원합니다.
Grok open release
GitHub Copilot을 최대한 활용하기 위한 커뮤니티 기여 지침, 에이전트, 스킬 및 구성 모음이다. AI 기반 코딩 도구 사용법을 익히는 데 유용하다.
Community-contributed instructions, agents, skills, and configurations to help you make the most of GitHub Copilot.
MS의 그래프 기반 RAG. 일반 RAG보다 multi-hop 추론이 강해서 복잡 도메인에 적합.
A modular graph-based Retrieval-Augmented Generation (RAG) system
Let's Encrypt 인증서를 얻고 HTTPS를 자동으로 활성화하는 도구
Certbot is EFF's tool to obtain certs from Let's Encrypt and (optionally) auto-enable HTTPS on your server. It can also act as a client for any other CA that uses the ACME protocol.
RAG 시작용으로 가장 쉬운 vector DB. Python에서 5줄로 임베딩 저장·검색.
Chroma — the open-source embedding database.
GPU를 기반으로 하는 빠르고 기능이 풍부한 크로스 플랫폼 터미널 에뮬레이터이다. 터미널 중심의 작업 환경을 사용하는 개발자들에게 인기가 높다.
If you live in the terminal, kitty is made for you! Cross-platform, fast, feature-rich, GPU based.
Stable Diffusion WebUI의 사실상 표준. extension 생태계가 가장 풍부.
Stable Diffusion web UI
스마트폰에서도 돌아가는 vision LLM. 작지만 GPT-4V 수준 작업도 가능.
MiniCPM-V — strong multimodal LLM for end-side deployment.
특정 오브젝트를 다른 사진에 자연스럽게 합성하는 모델. 광고/제품샷에 유용.
AnyDoor — zero-shot object teleportation in scenes.
OSS LLM 추론 엔진의 사실상 표준. PagedAttention 기반으로 처리량이 매우 높아요.
A high-throughput and memory-efficient inference and serving engine for LLMs
PyTorch와 유사하지만 훨씬 더 작고 간결한 딥러닝 프레임워크이다. 경량화된 구조로 딥러닝의 기본 원리를 이해하는 데 탁월하다.
You like pytorch? You like micrograd? You love tinygrad! ❤️
미디어 플랫폼에서 데이터를 크롤링하는 데 도움이 되는 도구입니다.
小红书笔记 | 评论爬虫、抖音视频 | 评论爬虫、快手视频 | 评论爬虫、B 站视频 | 评论爬虫、微博帖子 | 评论爬虫、百度贴吧帖子 | 百度贴吧评论回复爬虫 | 知乎问答文章|评论爬虫
주간 업데이트되는 Python ML 라이브러리 랭킹. 새 도구 발견할 때 첫 출발점.
🏆 A ranked list of awesome machine learning Python libraries.
Python 라이브러리로 한 줄에 배경 제거. ONNX 기반이라 빠릅니다.
Rembg — A tool to remove images background.
에이전트 플랫폼을 위한 도구.
Build, run, and manage agent platforms.
OpenMMLab에서 개발한 객체 탐지 툴박스이자 벤치마크이다. 다양한 최신 객체 탐지 알고리즘을 구현하고 평가하는 데 사용된다.
OpenMMLab Detection Toolbox and Benchmark
Diffusion 기반 보이스 클로닝. 자연스러움이 OpenVoice를 능가하는 평가.
F5-TTS — Diffusion Transformer with Flow Matching for fluent speech.
13B 비디오 모델을 6GB GPU에서도 돌리는 viral 프로젝트. lllyasviel이 또 만들어 화제.
Make video diffusion practical — frame packing for 13B models on consumer GPUs.
전통적 ML 알고리즘의 표준 라이브러리. 분류·회귀·클러스터링 모두 한 곳에서.
scikit-learn: machine learning in Python