AI 4건 · 일반 2건
Simon Willison은 CSP(Content Security Policy) 에러를 활용하는 실험적인 도구를 공개한다. 이 도구는 CSP 에러 발생 시 사용자에게 해당 도메인을 허용 목록에 추가할지 묻고, 허용 시 페이지를 새로고침하여 정상 작동하게 한다. 이는 보안과 사용자 편의성을 동시에 잡는 새로운 접근법을 제시한다. 개발자는 이를 통해 의도치 않은 CSP 차단으로 인한 사용자 이탈을 막을 수 있다.
My Office AI Town은 LLM 기술을 이용해 자율적으로 행동하는 에이전트를 구현한다. 기존 시뮬레이션 게임과 달리, 이 에이전트들은 실시간으로 변화하는 맥락 속에서 스스로 판단하고 대화를 나눕니다. 이 프로젝트는 Vibe Coding을 통해 만들어졌습니다. AI 친구들과 함께 작업한 결과, 더 흥미로운 결과물이 나왔습니다. 이 기술은 미래의 kancelária 환경을 변화시키는 데 기여할 수 있다.
LLM 운영 환경에서 수집되는 사용자 피드백은 만족도 양극단에 치우쳐 선택 편향이 심하다. 이를 주제별 군집과 계층적 베이지안 모델로 추정해, 실제 품질에 가까운 평가치를 도출한다. 기존 평균 방식보다 최대 40%p 이상 정확도를 개선하며, 온라인 재보정 신호까지 제공한다.
ASD-Bench는 AI 기반 자폐 스펙트럼 장애(ASD) 스크리닝 도구의 한계를 극복하는 종합 벤치마크이다. 이 벤치마크는 머신러닝, 딥러닝, 파운데이션 모델을 아동, 청소년, 성인 세 연령대와 예측 성능, 보정, 해석 가능성, 적대적 견고성 네 가지 축으로 평가한다. 특히 위양성 패널티를 강화한 HAP(Heuristic Aggregate Penalty) 지표를 도입하여 임상 환경에 적합한 안정성을 추구한다. 연령대별 진단 패턴과 핵심 특성 중요도가 다름을 확인했으며, 단일 지표 평가의 한계를 명확히 보여준다.
35개의 ChatGPT 프롬프트를 통해 내부 감사 업무의 문서화 과정을 효율화한다. 감사 발견 사항, 리스크 매트릭스, 조치 계획 등 일곱 가지 워크플로를 지원하며, Claude, ChatGPT, DeepSeek에서 모두 활용 가능하다. IIA와 Protiviti 조사에 따르면 내부 감사원은 문서 작성에 35%의 시간을 소요하는데, 이 프롬프트 모음은 이러한 구조적 과제를 해결한다. 감사 업무의 전환점이 되는 실용적 리소스다.
개발자가 직접 'Claude Design'을 사용해 웹·앱 화면 디자인을 시도했다. 디자인 감각 없이도 템플릿 수준 이상의 결과물을 빠르게 낼 수 있었으나, 세부 제어와 커스터마이징에 한계가 있었다. 비디자이너 입장에선 초기 프로토타이핑 속도 향상에 유의미한 도구지만, 전문 디자이너의 감각을 대체하긴 어렵다. 향후 디자이너의 역할은 방향성 제시와 결과 검증 중심으로 변화할 수 있다.