Используя AI, расскажите о проекте, акцентирующем внимание на человеческих данных
Угадай, о ком я говорю?
Недавно увидел на главной странице Sapien слоган «Питая ИИ человеческими данными», это кажется интересным. Затем я поискал статьи по этой теме в Твиттере и нашел много AI-текстов с тегом Cookie.
Проекты, говорящие о человеческих данных, не используют человеческие данные 😅😅
Так что я расскажу об этом проекте, используя Human Data:
Sapien — это фабрика маркировки данных, очень похожая на бизнес по маркировке данных @SaharaLabsAI — платформа публикует задачи для маркировки, пользователи выполняют любые задания и получают награды. Модель вознаграждения и наказания также очень похожа — задания делятся на уровни, пользователи также разделяются на уровни, пользователи с более высоким кредитным рейтингом могут выполнять более сложные задания.
Тем, кто хочет узнать о Sahara, можете посмотреть мои предыдущие твиты:
Но различия тоже есть:
Первый пункт: внедрение системы залога и репутации
Перед началом задания пользователю необходимо заложить определенное количество токенов SPN; по завершении, если результаты маркировки оценены как высококачественные, пользователю будут начислены баллы и повышен уровень репутации, в противном случае может быть конфискована часть заложенных токенов. Это поможет пользователям серьезно относиться к заданиям
Второй пункт: алгоритм распространения заданий
Официальное представление этой точки заключается в том, что будет алгоритм распространения заданий, но в документации пока не было информации об этом. На самом деле это то, что я хотел бы увидеть, поскольку подчеркивается «человеческие данные», следует уделять внимание человеку. У людей есть индивидуальность, интересы и увлечения, предпосылкой развлечения заданий является угождение, я надеюсь, что Sapien сможет хорошо реализовать алгоритм заданий, а не просто простую рассылку заданий.
Кстати, представлю концепцию «поиска, рекламы и рекомендаций»:
Поиск, реклама, рекомендации — первые буквы каждого слова
Поиск: когда пользователь вводит поисковый запрос в строку поиска, он надеется найти один или несколько документов, наиболее связанных с этим запросом из набора документов;
Реклама: когда вы прокручиваете свою ленту друзей, система показывает вам рекламу, а рекламная система выбирает из множества рекламодателей ту рекламу, которую вы, вероятно, кликнете (конвертируете);
Рекомендации: когда пользователь проводит операцию прокрутки в Douyin, система выводит следующее видео, надеясь найти то видео, которое пользователь хочет посмотреть в данный момент;
Поэтому, когда мы прокручиваем Douyin или Xiaohongshu и не можем остановиться, на самом деле это алгоритмы поиска, рекламы и рекомендаций заставляют нас продолжать прокрутку, что может значительно увеличить удержание пользователей, продолжительность и уровень вовлеченности.
Возвращаясь к Sapien, если можно будет распределять задачи по маркировке данных с помощью аналогичных алгоритмов, чтобы пользователи могли сопоставить свои самые желаемые задания, это будет то, что я хотел бы увидеть как инновацию.
В текущей версии заданий я вижу только несколько заданий, но на официальном сайте сказано, что общее количество заданий превышает 100M, в настоящее время, вероятно, все еще в экспериментальном состоянии, также надеюсь, что @JoinSapien увидит, что я написал и сможет поработать над распределением заданий, данные — это область, в которую я верю.
