[분석] Microsoft Research – SocialReasoning-Bench: Measuring whether AI agents act in us
💻 테크 | Microsoft Research 💡 핵심 요약 Microsoft Research에서 발표한 ‘SocialReasoning-Bench’는 AI 에이전트가 사용자를 대신하여 사회적 맥락에서 협상하고 의사결정할 때, 단순히 태스크를 완료하는 것을 넘어 사용자의 최적 이익을 얼마나 잘 대변하는지 측정하는 벤치마크입니다. 현재의 최신 모델들은 대부분의 태스크를 수행하지만,…