GitHub 트렌딩을 그대로 나열하지 않고, Claude Code · RAG · 로컬 AI · 에이전트 워크플로우 · 평가 도구 · AI 앱 빌더 관점에서 실제 빌더가 쓸 만한 오픈소스 스택을 다시 정리합니다.
Lightricks의 실시간 비디오 생성 모델. 추론 속도가 빨라 인터랙티브 데모에 강함.
Official repo for LTX-Video — real-time video generation.
PyTorch 기반의 이미지-이미지 변환 모델인 CycleGAN과 pix2pix 구현체. 컴퓨터 비전 분야에서 이미지 스타일 변환 및 생성에 널리 사용된다.
Image-to-Image Translation in PyTorch
Python 코드 포맷터. 코드를 자동으로 포맷하는 도구.
The uncompromising Python code formatter
다이어그램을 코드로 작성하는 다이어그램을 위한 프레임워크. 클라우드 시스템 아키텍처를 위한 프로토타입을 위한 도구.
:art: Diagram as Code for prototyping cloud system architectures
OCR 소프트웨어로 PDF, 이미지, 화면 캡처를 지원합니다.
OCR software, free and offline. 开源、免费的离线OCR软件。支持截屏/批量导入图片,PDF文档识别,排除水印/页眉页脚,扫描/生成二维码。内置多国语言库。
Claude가 어떤 영상이든 시청하고 분석하게 한다. 영상을 다운로드하고 프레임을 추출하며, 이를 텍스트로 전환하여 Claude에 전달한다. Claude의 영상 이해 능력을 확장할 때 유용하다.
Give Claude the ability to watch any video. /watch downloads, extracts frames, transcribes, hands it all to Claude.
인도 NSE 시장에서 잠재적 돌파 가능성이 있는 주식을 파이썬으로 선별한다. 기술적 분석을 기반으로 효과적인 투자 결정을 돕는 도구로 활용된다.
A Python-based stock screener to find stocks with potential breakout probability from NSE India.
PDF·DOCX·PPTX·이미지·오디오 등 모든 걸 LLM에 먹이기 좋은 깨끗한 마크다운으로 변환. RAG 전처리에서 압도적으로 편함.
Python tool for converting files and office documents to Markdown.
장기 목표를 달성하기 위한 오픈 소스 슈퍼 에이전트 플랫폼입니다.
An open-source long-horizon SuperAgent harness that researches, codes, and creates. With the help of sandboxes, memories, tools, skill, subagents and message gateway, it handles different levels of tasks that could take minutes to hours.
터미널용 프레임워크입니다.
The lean application framework for Python. Build sophisticated user interfaces with a simple Python API. Run your apps in the terminal and a web browser.
Twitter, Reddit, YouTube, GitHub, Bilibili, XiaoHongShu 등 인터넷의 정보를 읽고 검색할 수 있는 오픈 소스 CLI.
Give your AI agent eyes to see the entire internet. Read & search Twitter, Reddit, YouTube, GitHub, Bilibili, XiaoHongShu — one CLI, zero API fees.
ChatGPT Plus/Team/Pro 구독 프로토콜의 엔드투엔드 리플레이 툴킷이다. hCaptcha 시각 솔버와 안티-프라우드 메커니즘에 대한 실증 연구를 포함한다. ChatGPT 결제 관련 연구나 보안 취약점 분석에 활용할 수 있다.
ChatGPT Plus/Team/Pro 订阅协议端到端重放工具集 · hCaptcha 视觉求解器 · 反欺诈机制实证研究 / End-to-end protocol replay toolkit for ChatGPT Plus/Team/Pro subscription with from-scratch hCaptcha solver and empirical anti-fraud research
1비트 LLM에 대한 인퍼런스 프레임워크.
Official inference framework for 1-bit LLMs
미디어 플랫폼에서 데이터를 크롤링하는 데 도움이 되는 도구입니다.
小红书笔记 | 评论爬虫、抖音视频 | 评论爬虫、快手视频 | 评论爬虫、B 站视频 | 评论爬虫、微博帖子 | 评论爬虫、百度贴吧帖子 | 百度贴吧评论回复爬虫 | 知乎问答文章|评论爬虫
분석을 위한 다기능 도구. 정보의 분리와의 원본을 복원하는 것을 목표로 함.
微舆:人人可用的多Agent舆情分析助手,打破信息茧房,还原舆情原貌,预测未来走向,辅助决策!从0实现,不依赖任何框架。
문장, 단락, 이미지 등의 임베딩을 위한 최첨단 프레임워크. 의미 검색, 클러스터링, 중복 제거 등 다양한 NLP 작업을 효율적으로 수행하게 돕는다.
State-of-the-Art Embeddings, Retrieval, and Reranking
DeepSeek V4 모델의 역할극(Role-Play)을 위한 특별 제어 명령어에 대한 설명이다. 모델이 특정 역할을 효과적으로 수행하도록 지시할 때 참조한다.
对于DeepSeek-V4角色扮演的特殊控制指令的说明
단일 이미지로 실시간 얼굴 바꾸기 및 딥페이크 영상 생성이 가능한 도구. 웹캠 영상을 이용한 AI 기반 영상 편집에 활용됩니다.
real time face swap and one-click video deepfake with only a single image
LLM 벤치마크 표준. HellaSwag·MMLU 같은 평가를 한 번에 돌리는 프레임워크.
A framework for few-shot evaluation of language models.
Codex 등 AI 에이전트용 GPT-Image-2 기반 PPT 생성 스킬이다. 이미지 중심의 파워포인트 프레젠테이션을 자동으로 만들어준다. AI 에이전트로 시각적 자료 제작을 자동화하려 할 때 유용하다.
GPT-Image-2 PPT Generator Skill for Creating Image-Based PowerPoint Presentations in Codex and Other Skill-Compatible Agents
컴퓨터에 대한 자연어 인터페이스입니다.
A natural language interface for computers
실세계 도구를 탑재한 오픈소스 보안 샌드박스. 기업용 AI 에이전트 개발에 적합합니다.
Open-source, secure environment with real-world tools for enterprise-grade agents.
텍스트를 음성으로 변환하는 도구입니다.
🚀Clone a voice in 5 seconds to generate arbitrary speech in real-time
브라우저 내에서 직접 AI 에이전트를 실행하는 웹 UI이다. 브라우저 자동화와 클라우드 브라우저 기능을 활용해 에이전트 작업을 수행한다.
🖥️ Run AI Agent in your browser.
Let's Encrypt 인증서를 얻고 HTTPS를 자동으로 활성화하는 도구
Certbot is EFF's tool to obtain certs from Let's Encrypt and (optionally) auto-enable HTTPS on your server. It can also act as a client for any other CA that uses the ACME protocol.
확산 모델을 제어할 수 있는 라이브러리.
Let us control diffusion models!
Python으로 API 개발을 위한 고성능 프레임워크. 쉬운 사용법과 빠른 개발 속도로 프로덕션 환경에 적합합니다.
FastAPI framework, high performance, easy to learn, fast to code, ready for production
MS의 그래프 기반 RAG. 일반 RAG보다 multi-hop 추론이 강해서 복잡 도메인에 적합.
A modular graph-based Retrieval-Augmented Generation (RAG) system
세계 최초의 오픈소스 에이전트 기반 영상 제작 시스템이다. 12개 파이프라인, 52개 도구, 500개 이상의 에이전트 스킬로 AI 코딩 어시스턴트를 영상 제작 스튜디오로 전환한다.
World's first open-source, agentic video production system. 12 pipelines, 52 tools, 500+ agent skills. Turn your AI coding assistant into a full video production studio.
실제 AI 개발자.
The first real AI developer
AI 에이전트가 데이터를 안전하게 조회할 수 있는 데이터 보관소.
AI Data Vault - A query engine for AI Agents to securely query data from any datasource
다른 모델을 증류하기보다 사용자 자신을 증류하는 것에 초점을 맞춘 개인화 LLM 스킬 시스템이다. 동료 스킬에서 영감을 받아 개개인에게 최적화된 AI 에이전트 스킬을 구축한다.
与其蒸馏别人,不如蒸馏自己。欢迎加入数字永生!Inspired by colleague-skill(同事skill)。
홈 자동화를 위한 오픈 소스 프로젝트. 사용자의 프라이버시를 우선시한다.
:house_with_garden: Open source home automation that puts local control and privacy first.
프로젝트 스펙을 던지면 AI가 폴더 구조부터 코드까지 만들어주는 에이전트. 초기 코드베이스 빠르게 부트스트랩할 때.
Specify what you want it to build, the AI asks for clarification, and then builds it.
코딩이 아닌 다른 모든 작업을 위한 Claude 코드 템플릿과 예시를 제공한다. Claude를 활용한 비코딩 자동화 및 창의적 탐색에 활용할 수 있다.
Claude code for everything except coding
PDF를 마크다운과 JSON으로 빠르게 변환. 높은 정확도.
Convert PDF to markdown + JSON quickly with high accuracy
LLM으로 제어되는 확산 모델(Self-correcting LLM-controlled Diffusion Models, SLD)의 CVPR 2024 공식 구현이다. 텍스트-이미지 생성 및 이미지 편집에서 LLM의 자기 교정 능력을 활용한다.
🔥 [CVPR2024] Official implementation of "Self-correcting LLM-controlled Diffusion Models (SLD)
OpenAI에서 개발한 개인정보 필터 도구이다. 민감한 정보가 포함된 데이터를 처리할 때 개인정보 보호를 강화하고 규정 준수를 지원한다.
OpenAI Privacy Filter
Nature 논문 작성에 필요한 학술적 표현과 논문용 그래프 스킬을 Python으로 제공합니다. 과학적 글쓰기 역량을 향상시킵니다.
符合nature论文学术表达和科研绘图的Skill
Python 진영 모던 API 표준. async + Pydantic 검증 + 자동 OpenAPI 문서.
FastAPI — high performance web framework for building APIs.
스마트폰에서도 돌아가는 vision LLM. 작지만 GPT-4V 수준 작업도 가능.
MiniCPM-V — strong multimodal LLM for end-side deployment.
TensorFlow로 작성된 다양한 모델과 예제입니다.
Models and examples built with TensorFlow
Salesforce가 만든 비전-언어 모델 모음. BLIP·CLIP 등이 통합 인터페이스로 묶여있어요.
LAVIS — a Library for Language-Vision Intelligence.
Python으로 작성된 파이썬 웹 크롤링 프레임워크. 빠른 웹 크롤링 및 스크래핑을 지원합니다.
Scrapy, a fast high-level web crawling & scraping framework for Python.
Claude Code, Claude Desktop, Agent SDK 등을 확장하기 위한 모든 기능을 모아놓은 허브이다. Claude 스킬, 에이전트, 명령어, 플러그인 등을 쉽게 찾아 활용하게 돕는다.
A single hub to find Claude Skills, Agents, Commands, Hooks, Plugins, and Marketplace collections to extend Claude Code, Claude Desktop, Agent SDK and OpenClaw
자연 언어에서 기술 다이어그램을 생성하는 도구. 다양한 스타일과 UML 지원을 제공합니다.
Generate production-quality SVG+PNG technical diagrams from natural language. 7 styles, UML support, and AI/Agent workflow patterns.
자율적인 하네스 엔지니어링을 위한 솔루션을 제공합니다. 복잡한 시스템의 통합 및 테스트를 자동화하여 개발 프로세스의 효율성을 높이는 데 기여합니다.
autonomous harness engineering
파이썬 예시를 제공합니다.
My Python Examples
RAG 전처리할 때 진짜 편한 툴이다. 모든 포맷을 마크다운으로 변환해주니까 데이터 정리하기 좋다. 가성비 좋다.
Nature 논문 스타일 글쓰기를 도와주는 깔끔한 파이썬 코드다. 과학적 글쓰기 역량 향상을 목표로 하는 사람들에게 도움될듯하다. 다른 도구보다 설정이 간단하다.