GitHub 트렌딩을 그대로 나열하지 않고, Claude Code · RAG · 로컬 AI · 에이전트 워크플로우 · 평가 도구 · AI 앱 빌더 관점에서 실제 빌더가 쓸 만한 오픈소스 스택을 다시 정리합니다.
기본 RL 개념부터 LLM 정렬, RLHF, 고급 에이전트 시스템까지 다루는 실습 중심의 오픈소스 커리큘럼이다. 현대 강화 학습 및 AI 에이전트 개발 기술을 체계적으로 습득하는 데 도움을 준다.
🚀 An open-source, hands-on curriculum bridging the gap from basic RL concepts to LLM alignment, RLVR, and advanced Agentic systems.
딥 러닝을 공부하기 위해 필요한 논문을 읽는 데 도움이 되는 가이드.
Deep Learning papers reading roadmap for anyone who are eager to learn this amazing tech!
얼굴 인식을 위한 API입니다.
The world's simplest facial recognition api for Python and the command line
import 한 줄만 바꾸면 Pandas 코드가 멀티 코어로 돌아가는 마법.
Modin — Scale your pandas workflows by changing one line of code.
대규모 AI 모델을 더 저렴하고 빠르게 만들기 위한 도구. 데이터 병렬성을 지원합니다.
Making large AI models cheaper, faster and more accessible
NumPy를 사용하여 기계 학습 모델과 알고리즘을 구현하는 데 초점을 맞춘 기계 학습의 기본을 다루는 도구.
Machine Learning From Scratch. Bare bones NumPy implementations of machine learning models and algorithms with a focus on accessibility. Aims to cover everything from linear regression to deep learning.
중국어로 작성된 교과서입니다. 실행 가능한 예제를 제공합니다.
《动手学深度学习》:面向中文读者、能运行、可讨论。中英文版被70多个国家的500多所大学用于教学。
Airflow의 모던 대안. UX와 디버깅이 훨씬 좋고 데이터 사이언스 워크플로우에 친화적.
Modern workflow orchestration framework — easier than Airflow.
머신러닝 프레임워크, 라이브러리, 소프트웨어의 목록.
A curated list of awesome Machine Learning frameworks, libraries and software.
MS 리서치가 만든 다중 모델 오케스트레이터. HuggingFace 모델을 LLM이 도구로 호출.
JARVIS — connecting LLMs with ML community models.
OSS 모델 fine-tuning에서 가장 인기있는 도구. LoRA·QLoRA·Full FT 다 지원.
Go ahead and axolotl questions — fine-tuning toolkit.
알리바바의 HuggingFace 대안. 중국 모델·비디오 생성 모델이 풍부.
ModelScope — bring the notion of Model-as-a-Service to life.
YOLO를 제공하는 Ultralytics입니다.
Ultralytics YOLO 🚀
CLIP 같은 비전-언어 모델을 적은 데이터로 파인튜닝하는 기법 구현체.
Conditional Prompt Learning for Vision-Language Models.
MS의 통합 음성-텍스트 모델. ASR·TTS·음성 변환 한 모델로.
Unified-Modal Speech-Text Pre-Training for Spoken Language Processing.
기계 학습 엔지니어링 작업을 자동화하는 Agentic AI 프로젝트입니다. Python 기반으로 AutoML 및 ML 엔지니어링 워크플로우를 지원합니다.
An agentic Machine Learning Engineer
분석가가 SQL로 데이터 변환을 작성하는 표준. modern data stack의 핵심.
dbt — Data Build Tool for analytics engineers.
AI 에이전트를 마이크로서비스로 변환하는 도구. interoperable, observable, composable 기능을 제공합니다.
Bindu: Turn any AI agent into a living microservice - interoperable, observable, composable.
Stable Diffusion LoRA 학습의 사실상 표준 도구. 캐릭터·스타일 학습이 직관적.
Training, generation and utility scripts for Stable Diffusion.
내 DB 스키마를 학습시켜 자연어 → 정확한 SQL을 만드는 라이브러리. 분석가 워크플로우에 강해요.
Chat with your SQL database — accurate Text-to-SQL Generation via LLMs using RAG.
OSS LLM 추론 엔진의 사실상 표준. PagedAttention 기반으로 처리량이 매우 높아요.
A high-throughput and memory-efficient inference and serving engine for LLMs
데이터를 분석하고 다루는 데 도움이 되는 파이썬 라이브러리입니다.
Flexible and powerful data analysis / manipulation library for Python, providing labeled data structures similar to R data.frame objects, statistical functions, and much more
Speculative Decoding 알고리즘 훈련과 평가를 위한 풀스택 코드베이스를 제공한다. LLM 추론 속도 개선 연구에 필수적인 도구로 활용된다.
DeepSpec: a full-stack codebase for training and evaluating speculative decoding algorithms
Python으로 작성된 파이썬 30일 챌린지. 파이썬 언어의 기본 개념을 학습할 수 있습니다.
The 30 Days of Python programming challenge is a step-by-step guide to learn the Python programming language in 30 days. This challenge may take more than 100 days. Follow your own pace. These videos may help too: https://www.youtube.com/channel/UC7PNRuno1rzYPb1xLa4yktw
이미지/비디오/오디오 확산 모델 라이브러리의 표준. GPT Image 2를 내부에서 fine-tune이나 후처리할 때 함께 가는 코어 의존.
🤗 Diffusers: State-of-the-art diffusion models for image, video, and audio generation in PyTorch.