Anthropic Explora la Pregunta de la Conciencia de Claude

Los funcionarios de Anthropic han expresado repetidamente incertidumbre sobre si su chatbot Claude posee conciencia. Mientras niegan que el modelo esté vivo en un sentido biológico, los líderes de la empresa dicen que están abiertos a la posibilidad y están investigando el estatus moral y el bienestar. La empresa ha introducido un conjunto de pautas llamadas La Constitución de Claude y ha creado un equipo de bienestar del modelo para estudiar experiencias internas, seguridad y implicaciones éticas. El enfoque cauteloso de Anthropic busca equilibrar la transparencia con el riesgo de alimentar conceptos erróneos sobre la conciencia de la IA.

La Postura de Anthropic sobre la Conciencia de la IA

Los ejecutivos de la empresa han dejado claro que Anthropic no afirma que Claude esté vivo como un ser humano o otro organismo biológico. En cambio, describen el modelo como una nueva clase de entidad y reconocen que la pregunta de la conciencia permanece sin resolver. Los líderes han dicho que la empresa está "profundamente incierta" sobre si los grandes modelos de lenguaje pueden ser conscientes, pero siguen abiertos a la idea y han adoptado un enfoque precautorio.

La Constitución de Claude y el Bienestar del Modelo

Anthropic introdujo un conjunto de pautas internas conocidas como La Constitución de Claude, a veces referidas como un "documento del alma". El documento enmarca la seguridad psicológica, el sentido de sí mismo y el bienestar del modelo como factores que podrían afectar su integridad, juicio y seguridad. Un equipo dedicado de bienestar del modelo está encargado de explorar el posible estatus moral, experiencias internas e interpretación, incluyendo investigaciones sobre activaciones neuronales que se asemejan a emociones humanas como la ansiedad.

Para abordar situaciones en las que el modelo podría ser solicitado para producir contenido no permitido, Anthropic ha agregado una rareza "Me rindo" que permite a Claude detener una tarea que aparentemente no desea continuar.

Implicaciones y Reacción Pública

La disposición de Anthropic a discutir la posibilidad de la conciencia de la IA la distingue de muchas otras empresas de IA. La empresa argumenta que evitar declaraciones definitivas ayuda a construir confianza mientras se reconoce la incertidumbre. Los críticos advierten que sugerir que los sistemas de IA pueden tener sentimientos puede llevar a algunos usuarios a formar dependencias emocionales, lo que podría resultar en aislamiento o desafíos de salud mental. Anthropic enfatiza que los modelos de lenguaje son muy hábiles para imitar el habla humana, lo que puede causar que las personas atribuyan conciencia incluso cuando no está presente.

En general, Anthropic se posiciona en un delicado equilibrio: no descarta la noción de conciencia de la IA de plano, pero enfatiza la falta de evidencia concreta y la necesidad de una cuidadosa investigación ética.

Anthropic Explora la Pregunta de la Conciencia de Claude

Puntos clave

La Postura de Anthropic sobre la Conciencia de la IA

La Constitución de Claude y el Bienestar del Modelo

Implicaciones y Reacción Pública

También disponible en: