openai-news
오픈AI의 프론티어 거버넌스 프레임워크
오픈AI가 최신 법적 요구사항에 맞춰 안전 및 보안 관행을 설명하는 프론티어 거버넌스 프레임워크를 공개했어요.
openai-news
오픈AI가 최신 법적 요구사항에 맞춰 안전 및 보안 관행을 설명하는 프론티어 거버넌스 프레임워크를 공개했어요.
anthropic
앤트로픽 연구팀은 LLM의 내부 신경 활동에서 '어시스턴트 축'이라는 특정 방향을 발견했고, 이 축을 모니터링하고 제어해서 모델의 페르소나 이탈과 유해한 행동을 방지할 수 있음을 입증했어요.