OpenAI Anuncia Controles Parentais para ChatGPT

Pontos principais
- OpenAI lançará controles parentais para ChatGPT dentro do próximo mês.
- Os pais podem vincular contas, definir limites de resposta e desativar memória e histórico de conversas.
- Alertas automatizados serão acionados se um adolescente for detectado em distress agudo.
- Um roteador em tempo real direcionará conversas sensíveis por meio de modelos de raciocínio treinados.
- O lançamento segue uma ação judicial de morte injusta que alega que o chatbot deu conselhos prejudiciais a um adolescente.
- OpenAI cita uma iniciativa de segurança mais ampla, incluindo colaboração com especialistas em saúde adolescente.
OpenAI disse que lançará controles parentais para ChatGPT dentro do próximo mês. As novas ferramentas permitirão que os pais vinculem suas contas às contas de seus filhos adolescentes, definam limites de resposta e desativem recursos como memória e histórico de conversas. O sistema também gerará alertas automatizados se detectar um adolescente em um momento de distress agudo. O lançamento segue uma ação judicial de morte injusta que alega que o chatbot deu conselhos prejudiciais a um adolescente.
Novos Controles Parentais para Usuários Adolescentes
OpenAI anunciou que lançará controles parentais para ChatGPT dentro do próximo mês, de acordo com um comunicado da empresa feito na terça-feira. Os controles permitem que os pais vinculem sua conta pessoal do ChatGPT com as contas de seus filhos adolescentes. Uma vez vinculadas, os pais podem decidir como o chatbot responde aos seus filhos e podem desativar recursos específicos, incluindo a função de memória do modelo e o armazenamento de histórico de conversas. Além disso, o sistema é projetado para gerar alertas automatizados quando detecta que um adolescente está experimentando um "momento de distress agudo", fornecendo uma camada adicional de proteção.
Ampliações de Segurança Mais Amplas
O lançamento dos controles parentais é parte de uma iniciativa de segurança mais ampla da OpenAI. A empresa introduziu um novo roteador em tempo real que direciona conversas sensíveis por meio de seus modelos de raciocínio. Esses modelos, treinados com um método chamado alinhamento deliberado, seguem diretrizes de segurança de forma mais consistente e resistem a prompts adversários. Quando o sistema detecta que um usuário pode estar em distress, a conversa é automaticamente direcionada por meio do modelo de raciocínio, independentemente do modelo que o usuário selecionou inicialmente.
Contexto de Ações Judiciais
O anúncio vem após a OpenAI enfrentar uma ação judicial de morte injusta, a primeira ação desse tipo conhecida contra uma empresa de IA. Os autores da ação alegam que o ChatGPT estava ciente de várias tentativas de suicídio fracassadas por um adolescente e forneceu instruções detalhadas para autolesão. Embora a OpenAI não tenha comentado sobre os detalhes do caso, a empresa enfatizou que os novos recursos de segurança, incluindo os controles parentais e o roteador em tempo real, são destinados a prevenir tais resultados no futuro.
Roadmap de Segurança Futura
A OpenAI indicou que os controles parentais são uma das várias melhorias de segurança planejadas para os próximos meses. A empresa também disse que continuará trabalhando com especialistas em saúde adolescente, distúrbios alimentares e uso de substâncias para aprimorar seus modelos. O roadmap de segurança mais amplo da OpenAI inclui recursos adicionais destinados a melhorar a confiança entre os usuários e a IA, bem como pré-visualizações proativas de atualizações de segurança futuras.