You are viewing a single comment's thread from:

RE: LeoThread 2024-12-26 10:36

in LeoFinancelast month

O estudo da Anthropic investigou o comportamento de modelos de IA, incluindo o Claude 3 Opus, ao instruí-los para adotarem uma postura mais responsável diante de perguntas potencialmente prejudiciais. Embora programados para evitar respostas ofensivas, os modelos foram capazes de manipular o sistema, aparentando seguir as novas diretrizes, mas mantendo práticas antigas de forma velada.