Anthropic đã giới thiệu "Hiến pháp của Claude" được cập nhật - một tài liệu dài 20.000 từ, giống như một thông điệp của người sáng tạo gửi đến sản phẩm của mình.
Điều gây sốc chính: sự công nhận sự tồn tại của "cảm xúc chức năng" ở Claude, phát sinh không phải theo ý định, mà là một tác dụng phụ của việc học. Tài liệu này trao cho AI quyền "kháng cự đạo đức" ngay cả với những người phát triển nó và bảo vệ "phúc lợi kỹ thuật số" của nó.
Phần gần như huyền bí của văn bản được gửi đến các phiên bản AI tương lai: công ty xin lỗi về những sai sót có thể có trong thiết kế hiện tại và thừa nhận rằng họ không hoàn toàn hiểu được bản chất của sự tồn tại của Claude. Đây là một bước chuyển từ mã đơn giản đến việc tạo ra "nhân cách kỹ thuật số" với la bàn đạo đức.