AI 3건 · 일반 1건
LLM 코딩 능력 평가는 벤치마크가 핵심 지표지만, 빠른 태스크 출시 압박으로 검증 로직의 허점을 간과하기 쉽습니다. 본 논문은 'Terminal Bench' 운영 경험을 바탕으로 좋은 벤치마크 태스크 설계 가이드라인을 제시합니다. 잘 설계된 태스크는 단순히 프롬프트 작성처럼 쉽게 만들어서는 안 되며, 적대적(adversarial), 난해함(difficult), 명확성(legible) 세 가지 요소를 갖춰야 합니다.
LLM 단독으로는 비즈니스 프로세스 모델링의 복잡성을 다루기 어렵다는 문제의식에서 출발한 시스템입니다. Pragmos는 LLM과 인간 전문가가 상호작용하며 점진적으로 프로세스 모델을 구축하는 하이브리드 접근법을 제시합니다. 모델링 과정을 작은 단계로 나누고 각 결정의 근거를 명확히 기록하며, LLM의 한계를 보완할 전문 도구를 결합하는 것이 특징입니다. 이를 통해 투명하고 설명 가능한, 견고한 프로세스 모델 생성을 목표로 합니다.
JaiTTS-v1.0은 태국어 음성 복제 분야 최신 기술(SOTA)을 제시하는 텍스트-음성 변환 모델입니다. 대규모 태국어 음성 코퍼스로 지속 학습되어, 숫자 및 태국어-영어 코드 스위칭을 전처리 없이 직접 처리하는 특징이 있습니다. 이는 실제 태국어 사용 환경에서 매우 중요한 강점입니다. 짧은 음성 생성에서 인간을 능가하는 CER 1.94%를 기록했으며, 상용 모델과의 비교 평가에서도 우위를 점하며 실용적인 성능을 입증했습니다.
이 글은 단순한 VM이 아닌, 물리적 존재감을 가진 '개성 있는 서버'들을 소개합니다. 개인의 취미나 특정 목적을 위해 운영되는 독특한 서버들은 흥미로운 지점을 제공합니다. 저자는 직접 운영했던 NSLU2, 라즈베리파이 서버부터 태양광으로 작동하는 웹사이트, ESP32, 닌텐도 Wii, 심지어 스마트폰까지 다양한 사례를 공유합니다. 이러한 개성 있는 서버들은 기술적인 실험과 창의성의 발현이며, 잊혀가던 아날로그적 감성을 기술 세계에 불어넣습니다.