오늘의 뉴스매일 4슬롯 종합 큐레이션 전체 슬롯원문 슬롯 · 10 / 14 / 18 / 22 KST Blog Repos오늘의 픽 · 지식 기반 인터랙티브 그래프1650+

Build Stack

Prompts오늘의 픽 · 코드베이스 분석350+Skills오늘의 픽 · 코드 간결화 도구150+MCP오늘의 픽 · mcp-for-beginners300+Workflows오늘의 픽 · Claude Code 환경 처음 세팅100+

Community PlaygroundNEW SubscribeNEW

Privacy Policy Terms & Conditions

LatticeAI Intelligence PlatformAI 인텔리전스 플랫폼

Blog블로그 Atlas아틀라스

Community커뮤니티BETA Playground플레이그라운드NEW

Today's News오늘의 뉴스 Current News Slot전체 슬롯 Blog블로그 Atlas아틀라스 Community커뮤니티BETA Playground플레이그라운드NEW

AI-NativeAI 네이티브

Repos레포 Prompts프롬프트 Skills스킬 MCPMCP Workflows워크플로우

© 2026 Lattice

Subscribe AI Atlas 프롬프트 Telegram News Contact GitHub

마지막 업데이트: 54분 전

토큰화 · Tokenization · Lattice Atlas · Lattice

오늘의 뉴스매일 4슬롯 종합 큐레이션 전체 슬롯원문 슬롯 · 10 / 14 / 18 / 22 KST Blog Repos오늘의 픽 · 지식 기반 인터랙티브 그래프1650+

Build Stack

Prompts오늘의 픽 · 코드베이스 분석350+Skills오늘의 픽 · 코드 간결화 도구150+MCP오늘의 픽 · mcp-for-beginners300+

LatticeAI Intelligence PlatformAI 인텔리전스 플랫폼

Blog블로그 Atlas아틀라스

Community커뮤니티BETA Playground플레이그라운드NEW

Today's News오늘의 뉴스 Current News Slot전체 슬롯 Blog블로그 Atlas아틀라스 Community커뮤니티BETA Playground플레이그라운드NEW

AI-NativeAI 네이티브

Repos레포 Prompts프롬프트 Skills스킬 MCPMCP Workflows워크플로우

Atlas/Models

토큰화

Tokenization

ModelsCorewith Lattice Take#45

입력 텍스트를 모델이 연산 가능한 형태인 토큰 단위 문자열 조각으로 변환하고 쪼개는 전처리 과정입니다.

왜 지금 중요한가

Korean·CJK·코드 토큰 효율이 모델마다 달라 비용·context length가 직접 영향을 받기 때문이다.

Builder Takeaway

한국어 1자 = 2~4 token인 모델이 흔하다 — 비용 추정은 항상 실제 tokenizer로 측정해야 한다.

흔한 함정

영어 단어 1.3 token 기준으로 한국어 비용을 추정하는 것.

Lattice Take

© 2026 Lattice

Subscribe AI Atlas 프롬프트 Telegram News Contact GitHub

Tokenization은 model spec 한 줄이 아니라 한국어 builder에게는 비용·context 의사결정의 출발점이다.

관련 개념

BPE
토큰Token
컨텍스트 윈도우Context Window

Open in Atlas Universe

Workflows오늘의 픽 · Claude Code 환경 처음 세팅100+

Terms & Conditions

마지막 업데이트: 54분 전