AI 2건 · 일반 2건
최신 벤치마크 평가에서 대규모 사전학습 모델보다 RF(ECFP4)와 ExtraTrees(RDKit) 같은 전통적 머신러닝이 156개 비교 중 다수에서 우세했다. 분자 속성, 독성, 생물활성 예측 과제에서 클래식 cheminformatics 방법이 GNN 및 LLM 기반 접근보다 일관된 성능을 보였다. 이는 약물 발견 분야에서 모델 확장이 항상 성능 향상으로 이어지지 않는다는 근본적 질문을 제기한다.
PBT-Bench는 40개 실제 Python 라이브러리에서 수집한 100개의 property-based testing 문제로 구성된 벤치마크다. 기존 평가 방식이 단순 버그 재현이나 패치 생성에 머물렀다면, 이 벤치마크는 문서 기반 의미적 불변 조건을 파악하고 Hypothesis 전략으로 입력을 설계하는 고차원 능력을 측정한다. 365개의 인위적 버그는 기본 랜덤 전략으로는 거의 유발되지 않도록 설계되어, AI의 추론 깊이를 정밀하게 검증한다. LLM별 버그 탐지율은 31.4%~83.4%로, 구조화된 프롬프트가 중간 성능 모델에 특히 효과적이다.
지역 사회의 데이터센터 건설 반대는 에너지 소비와 인프라 부담이 주요 원인이다. 해결책으로는 직접적인 금전적 보상이 가장 현실적인 대안으로 제시된다. 단순한 설득보다는 이익 공유 구조가 갈등 완화에 효과적이다. 이는 AI 인프라 확장과 함께 점점 더 중요해지는 정책 과제다.
macOS용 오픈소스 도구 auto-identity-remove가 500여 개 데이터 브로커 사이트에서 개인 정보를 자동으로 삭제한다. 매월 정기 실행, CAPTCHA 해결, 상태 추적, iMessage 결과 알림 기능을 제공하며, 개인 정보는 로컬에만 저장된다. 헤드리스 브라우저와 Playwright 기반으로 자동화 정확도를 높였다. 사이트별 계정 생성 및 로그인도 자동 처리해 유지보수 수고를 줄였다.