Giới thiệu một dự án nhấn mạnh dữ liệu con người bằng AI.
Đoán xem tôi đang nói về ai?
Gần đây tôi thấy khẩu hiệu trên trang chủ Sapien “Cung cấp AI bằng Dữ liệu Con người” cảm thấy khá thú vị. Sau đó tôi tìm kiếm trên Twitter các bài viết liên quan, kết quả toàn là những bài viết AI có gắn thẻ Cookie.
Các dự án nói về Dữ liệu Con người lại không sử dụng Dữ liệu Con người 😅😅
Vậy tôi sẽ nói đơn giản về dự án này bằng Dữ liệu Con người:
Sapien là một nhà máy gán nhãn dữ liệu, rất giống với dịch vụ gán nhãn dữ liệu của @SaharaLabsAI - nền tảng phát hành nhiệm vụ gán nhãn, người dùng hoàn thành để nhận thưởng. Mô hình thưởng phạt cũng rất giống - nhiệm vụ được phân loại, người dùng cũng được phân loại, người dùng có điểm tín dụng cao hơn có thể thực hiện các nhiệm vụ cao cấp hơn.
Ai muốn tìm hiểu về Sahara có thể xem bài viết trước đây của tôi:
Tuy nhiên, cũng có những điểm khác biệt:
Điểm đầu tiên: Đưa vào hệ thống đặt cọc và danh tiếng.
Trước khi bắt đầu nhiệm vụ, người dùng cần đặt cọc một số lượng mã thông báo SPN nhất định; sau khi hoàn thành, nếu kết quả đánh dấu được đánh giá là chất lượng cao, sẽ được thưởng điểm và nâng cao cấp độ danh tiếng của người dùng, nếu không có thể bị phạt mất một phần mã thông báo đã đặt cọc. Hãy giúp người dùng nghiêm túc với nhiệm vụ.
Điểm thứ hai: Thuật toán đẩy nhiệm vụ.
Giới thiệu chính thức về điểm này là sẽ có thuật toán đẩy nhiệm vụ, nhưng trong tài liệu hiện tại vẫn chưa thấy giới thiệu về điều này. Thực ra đây là điều tôi muốn thấy, vì đã nhấn mạnh “dữ liệu con người” thì cần phải coi trọng con người. Con người có cá tính, sở thích, tiền đề để giải trí hóa nhiệm vụ là phải chiều lòng người, tôi hy vọng Sapien có thể thực hiện tốt việc tìm kiếm và đẩy nhiệm vụ, chứ không chỉ đơn giản là phân phối nhiệm vụ.
Nhân tiện giới thiệu về khái niệm “tìm kiếm, quảng cáo, đẩy” này:
Tìm kiếm, quảng cáo, gợi ý, mỗi cái lấy một chữ cái đầu.
Tìm kiếm: Khi người dùng nhập một từ khóa tìm kiếm (query) vào ô tìm kiếm, hy vọng từ một tập hợp tài liệu tìm ra tài liệu nào đó hoặc một vài tài liệu liên quan nhất đến tìm kiếm này;
Quảng cáo: Khi bạn đang lướt qua danh sách bạn bè, hệ thống sẽ hiển thị cho bạn một quảng cáo, hệ thống quảng cáo phía sau sẽ lựa chọn một quảng cáo mà bạn hiện tại có khả năng nhấp (chuyển đổi) cao nhất từ nhiều quảng cáo được quảng cáo bởi nhiều nhà quảng cáo;
Gợi ý: Khi người dùng thực hiện một thao tác vuốt lên trên TikTok, hệ thống sẽ đưa ra video tiếp theo, hy vọng tìm ra video mà người dùng hiện tại muốn xem nhất từ một loạt video;
Vì vậy tại sao khi lướt TikTok hay Xiaohongshu lại cảm thấy không thể dừng lại, thực ra chính là thuật toán tìm kiếm, quảng cáo, gợi ý đang khiến chúng ta tiếp tục lướt, đối với sản phẩm có thể tăng cường độ gắn bó của người dùng, tăng thời gian và mức độ tham gia của người dùng.
Quay lại với Sapien, nếu có thể phân phối nhiệm vụ gán nhãn dữ liệu thông qua thuật toán tương tự, để người dùng có thể ghép đôi với nhiệm vụ mà họ muốn làm nhất, đó là sự đổi mới mà tôi muốn thấy.
Hiện tại trong phiên bản nhiệm vụ tôi chỉ thấy một vài nhiệm vụ, nhưng trang web chính thức đã công bố rằng tổng số nhiệm vụ vượt quá 100M, hiện tại có lẽ vẫn đang ở trạng thái thử nghiệm, cũng hy vọng @JoinSapien thấy bài viết này có thể nghiên cứu về việc phân phối nhiệm vụ, dữ liệu là một lĩnh vực mà tôi rất hy vọng.
