[기술 동향] OpenAI – Improving instruction hierarchy in frontier LLMs
🌍 OpenAI 기술 동향 분석 💡 핵심 요약 OpenAI의 ‘Instruction Hierarchy Challenge (IH-Challenge)’는 최신 LLM이 신뢰할 수 있는 지시(trusted instructions)를 우선시하도록 훈련하여, 모델의 지시 계층(Instruction Hierarchy)을 효과적으로 개선하는 기술입니다. 이는 모델의 안전 조종 가능성(safety steerability)을 높이고, LLM의 가장 큰 보안…