GitHub 트렌딩을 그대로 나열하지 않고, Claude Code · RAG · 로컬 AI · 에이전트 워크플로우 · 평가 도구 · AI 앱 빌더 관점에서 실제 빌더가 쓸 만한 오픈소스 스택을 다시 정리합니다.
YOLO를 제공하는 Ultralytics입니다.
Ultralytics YOLO 🚀
CLIP 같은 비전-언어 모델을 적은 데이터로 파인튜닝하는 기법 구현체.
Conditional Prompt Learning for Vision-Language Models.
금융 도메인에 특화된 오픈소스 LLM 프로젝트. 뉴스 감성·시계열·로보어드바이저까지 노트북으로 다루고 있어요.
Open-Source Financial Large Language Models — democratizing internet-scale data for AI in finance.
데이터 과학에 대한 10주간의 교과서입니다.
10 Weeks, 20 Lessons, Data Science for All!
세계 최대 및 최고의 기술 번역 플랫폼입니다.
🥇掘金翻译计划,可能是世界最大最好的英译中技术社区,最懂读者和译者的翻译平台:
분석가가 SQL로 데이터 변환을 작성하는 표준. modern data stack의 핵심.
dbt — Data Build Tool for analytics engineers.
MS의 통합 음성-텍스트 모델. ASR·TTS·음성 변환 한 모델로.
Unified-Modal Speech-Text Pre-Training for Spoken Language Processing.
기계 학습 엔지니어링 작업을 자동화하는 Agentic AI 프로젝트입니다. Python 기반으로 AutoML 및 ML 엔지니어링 워크플로우를 지원합니다.
An agentic Machine Learning Engineer
기본 머신 러닝은 머신 러닝을 위한 12주, 26강, 52개 퀴즈로 구성된 교육 자료입니다. 머신 러닝을 처음 배우는 사람들에게 적합합니다.
12 weeks, 26 lessons, 52 quizzes, classic Machine Learning for all
AI 에이전트를 마이크로서비스로 변환하는 도구. interoperable, observable, composable 기능을 제공합니다.
Bindu: Turn any AI agent into a living microservice - interoperable, observable, composable.
OpenCV는 컴퓨터 비전과 이미지 처리를 위한 오픈 소스 라이브러리입니다. 다양한 알고리즘과 기능을 제공하여 컴퓨터 비전과 인공지능 개발에 유용합니다.
Open Source Computer Vision Library
Stable Diffusion LoRA 학습의 사실상 표준 도구. 캐릭터·스타일 학습이 직관적.
Training, generation and utility scripts for Stable Diffusion.
대규모 시스템 확장성에 대한 패턴입니다.
The Patterns of Scalable, Reliable, and Performant Large-Scale Systems
내 DB 스키마를 학습시켜 자연어 → 정확한 SQL을 만드는 라이브러리. 분석가 워크플로우에 강해요.
Chat with your SQL database — accurate Text-to-SQL Generation via LLMs using RAG.
Postgres에 벡터 검색 추가하는 extension. 별도 vector DB 없이 RAG 쉽게 시작.
Open-source vector similarity search for Postgres.
기계 학습, 연구와 관련된 오픈 소스 프로젝트.
Google Research
OSS LLM 추론 엔진의 사실상 표준. PagedAttention 기반으로 처리량이 매우 높아요.
A high-throughput and memory-efficient inference and serving engine for LLMs
데이터를 분석하고 다루는 데 도움이 되는 파이썬 라이브러리입니다.
Flexible and powerful data analysis / manipulation library for Python, providing labeled data structures similar to R data.frame objects, statistical functions, and much more
OCR 엔진으로 텍스트를 인식할 수 있습니다.
Tesseract Open Source OCR Engine (main repository)
마이크로소프트가 제공하는 초급부터 전문가 수준까지의 Rust 트레이닝 자료 모음입니다.
Beginner, advanced, expert level Rust training material
챗GPT, 클라우드, 지니미 등에서 추출한 시스템 프롬프트.
Extracted system prompts from Anthropic - Claude Fable 5, Opus 4.8, Claude Code, Claude Design. OpenAI - ChatGPT 5.5 Thinking, GPT 5.5 Instant, Codex. Google - Gemini 3.5 Flash, 3.1 Pro, Antigravity. xAI - Grok, Cursor, Copilot, VS Code, Perplexity, and more. Updated regularly.
프로덕션급 ML 애플리케이션을 개발, 배포 및 반복하는 방법을 배운다
Learn how to develop, deploy and iterate on production-grade ML applications.
Speculative Decoding 알고리즘 훈련과 평가를 위한 풀스택 코드베이스를 제공한다. LLM 추론 속도 개선 연구에 필수적인 도구로 활용된다.
DeepSpec: a full-stack codebase for training and evaluating speculative decoding algorithms
Python으로 작성된 파이썬 30일 챌린지. 파이썬 언어의 기본 개념을 학습할 수 있습니다.
The 30 Days of Python programming challenge is a step-by-step guide to learn the Python programming language in 30 days. This challenge may take more than 100 days. Follow your own pace. These videos may help too: https://www.youtube.com/channel/UC7PNRuno1rzYPb1xLa4yktw
이미지/비디오/오디오 확산 모델 라이브러리의 표준. GPT Image 2를 내부에서 fine-tune이나 후처리할 때 함께 가는 코어 의존.
🤗 Diffusers: State-of-the-art diffusion models for image, video, and audio generation in PyTorch.
ML 모델에 빠르게 UI 붙이는 표준. HuggingFace Spaces 데모의 70% 이상이 이 프레임워크.
Build and share delightful machine learning apps, all in Python. 🌟 Star to support our work!