AI 3건 · 일반 2건
최근 멀티모달 기초 모델인 GPT-4o가 시각 이해력에 대한 평가를 받았다. 이 연구에서는 GPT-4o를 포함한 여러 모델을 표준 컴퓨터 비전 작업에 적용하여 그 성능을 평가했다. 결과에 따르면, GPT-4o는 비전 작업에서 전문가 모델에 비해 떨어지는 성능을 보였지만, 일반적인 작업에서는 괜찮은 성능을 보였다. 또한, GPT-4o는 비전 작업에서 텍스트 생성 작업에 비해 더 어려움을 겪었다. 이 연구는 멀티모달 기초 모델의 시각 이해력에 대한 새로운 통찰력을 제공한다.
전 세계 규제와 문화적 뉘앙스를 고려한 다국어 LLM 안전성 벤치마크 'ML-Bench'가 공개되었습니다. 기존 벤치마크는 번역에 의존했지만, ML-Bench는 지역별 법률 텍스트에서 직접 위험 범주와 규칙을 도출했습니다. 이를 기반으로 개발된 'ML-Guard'는 특정 정책에 맞춰 LLM의 안전성을 평가하고 규정 준수를 보장합니다.
에이전트 시스템은 많은 모델 호출을 처리해야 하며, 대부분의 호출은 짧고 구조화되어 있다. AgentFloor 벤치마크는 30개의 작업을 6단계의 능력 계층으로 조직하여, 에이전트 워크플로우에서 큰 모델이 반드시 필요한 부분과 작은 모델로 처리할 수 있는 부분을 구분했다. 결과는 작은 모델이 많은 워크플로우를 처리할 수 있으며, 큰 모델은 장기 계획과 제약 조건을 처리하는 데 더 적합하다는 것을 보여준다.
마이크로커널은 운영 체제의 핵심 구성요소 중 하나로, IPC(Inter-Process Communication)는 프로세스 간 통신을 위한 메커니즘을 제공한다. 마이크로커널에서 IPC는 메시지 패싱 방식으로 구현되며, 각 메시지에는 메시지 유형, 유형별 데이터, 핸들 등이 포함된다. 이 설계는 마이크로커널에서 프로세스 간 통신을 효율적으로 관리하는 데 중요한 역할을 한다.
마이크로소프트가 86-DOS 1.00의 소스 코드와 개발 자료를 공개했다. 팀 패터슨의 원본 어셈블리 리스트를 포함하며, 초기 DOS 개발 방식을 생생하게 보여준다. IBM PC-DOS 1.00 개발 과정의 스냅샷도 함께 제공되어, 운영체제의 기원을 연구하는 데 귀중한 자료가 된다. 이는 단순 코드 이상으로, 1980년대 초 소프트웨어 개발 현장을 기록한 아날로그 유산이기도 하다.