GitHub 트렌딩을 그대로 나열하지 않고, Claude Code · RAG · 로컬 AI · 에이전트 워크플로우 · 평가 도구 · AI 앱 빌더 관점에서 실제 빌더가 쓸 만한 오픈소스 스택을 다시 정리합니다.
이미지와 텍스트를 같은 임베딩 공간에 두는 모델. 거의 모든 멀티모달 작업의 베이스.
CLIP (Contrastive Language-Image Pretraining), Predict the most relevant text snippet given an image
GPT Image 2 프롬프팅 가이드의 정석. 텍스트 렌더링·EXACT TEXT 패턴은 여기서 출발하면 헛돌지 않아요. 노트북으로 바로 실험 가능.
Examples and guides for using the OpenAI API
안정적 확산은 이미지 생성을 위한 알고리즘입니다. 다양한 기능과 알고리즘을 제공하여 이미지 생성을 쉽게 합니다.
A latent text-to-image diffusion model