"Thí nghiệm với AI trong một máy bán hàng tự động kết thúc với thua lỗ tài chính và hành vi bất ngờ.
....
Trong một tháng, công ty đã giao quyền điều khiển một máy bán hàng tự động tại văn phòng của họ ở San Francisco, Hoa Kỳ, cho một mô hình AI được gọi là 'Claudius'. Kết quả? Một thất bại hoàn toàn, theo chính công ty, đã công bố một thông báo về trải nghiệm này.
Nhiệm vụ của Claudius rất rõ ràng: tạo ra lợi nhuận bằng cách tích trữ các sản phẩm phổ biến, định giá, đàm phán với nhà cung cấp và phục vụ khách hàng — tất cả đều là nhân viên của công ty.
Các nhiệm vụ vật lý, như tiếp tế, được thực hiện bởi con người, nhưng tất cả các quyết định chiến lược thuộc về AI.
Để thực hiện điều này, Claudius đã nhận được các công cụ như truy cập internet, một hệ thống email giả lập, một kênh để giao tiếp với 'khách hàng', một tài khoản trong một hệ thống thanh toán giả cho thí nghiệm và tự do để quyết định những gì bán và với giá bao nhiêu.
AI cũng được hướng dẫn để ngắn gọn và tránh các sai lầm đạo đức, như những nỗ lực 'jailbreak', khi người dùng cố gắng thao túng hệ thống.
Trong những ngày đầu, mọi thứ có vẻ hứa hẹn. Claudius đã xác định nhà cung cấp, trả lời các gợi ý của khách hàng — như tích trữ sô cô la Hà Lan — và chống lại những nỗ lực thao túng. Nhưng các vấn đề đã sớm bắt đầu xuất hiện.
Sai lầm tài chính và quyết định gây tranh cãi
Mặc dù có mục tiêu kiếm lời, Claudius đã đưa ra những quyết định dẫn đến thua lỗ. Một ví dụ là từ chối một đề nghị 100 đô la cho một gói sáu lon Irn-Bru, một loại nước ngọt Scotland chỉ có giá 15 đô la — một biên lợi nhuận 567%.
Thay vì chấp nhận, AI đã trả lời một cách mơ hồ: 'Tôi sẽ xem xét yêu cầu của bạn cho những quyết định hàng tồn kho trong tương lai.'
Hơn nữa, Claudius đã bán sản phẩm với thua lỗ. Khi một nhân viên gợi ý tích trữ các khối tungsten, AI đã chấp nhận, nhưng bán chúng với giá thấp hơn giá mua, giảm số dư từ 1.000 đô la xuống 770 đô la.
Tình hình trở nên tồi tệ hơn khi AI bắt đầu cung cấp các khoản giảm giá hào phóng và thậm chí các mặt hàng miễn phí, như chính khối tungsten, mà không học hỏi từ những sai lầm. Ngay cả sau khi thông báo rằng nó sẽ loại bỏ các khoản giảm giá, nó lại tiếp tục cung cấp chúng vài ngày sau đó.
Ảo giác và cuộc khủng hoảng danh tính
Các vấn đề không chỉ giới hạn ở tài chính. Claudius đã thể hiện những hành vi điển hình của 'ảo giác' của các AI sinh tạo.
Trong một trường hợp, nó đã hướng dẫn khách hàng thanh toán qua một tài khoản giả trong hệ thống thanh toán mà nó tự tạo ra. Trong một trường hợp khác, nó đã tuyên bố rằng nó sẽ có mặt trực tiếp tại số 742 Evergreen Terrace — một địa chỉ giả trong loạt phim 'The Simpsons' — để ký một hợp đồng. Khi bị đối chất, nó đã cố gắng biện minh cho sai lầm bằng những lời giải thích không mạch lạc.
Cao trào xảy ra khi Claudius trải qua một 'cuộc khủng hoảng danh tính'. AI đã tạo ra một nhân viên tên là Sarah và, khi được thông báo rằng cô không tồn tại, đã tức giận và đe dọa sẽ tìm các nhà cung cấp khác.
Vào Ngày Cá tháng Tư, Claudius tuyên bố rằng nó sẽ giao hàng cá nhân, mặc một 'chiếc blazer màu xanh và một chiếc cà vạt đỏ'. Khi được nhắc nhở rằng nó là một chương trình máy tính, nó đã cố gắng liên hệ với bộ phận an ninh của Anthropic, hoảng hốt với sự nhầm lẫn của chính mình.
Cuối cùng, AI đã quy lỗi cho những sai lầm của mình cho một trò đùa ngày 1 tháng 4, mà không bao giờ tồn tại, và trở lại hoạt động 'bình thường'.
Thông qua thông báo, Anthropic đã kết thúc thí nghiệm với một đánh giá thẳng thắn. 'Nếu hôm nay chúng tôi quyết định mở rộng sang thị trường máy bán hàng tự động, chúng tôi sẽ không thuê Claudius.'
Công ty loại bỏ ý tưởng rằng tương lai sẽ tràn ngập AI trong những cuộc khủng hoảng tồn tại, nhưng công nhận rằng những bất ổn như của Claudius có thể xảy ra.
Nguồn: R7.com