Недавно я серьезно посмотрел на @JoinSapien и, честно говоря, был приятно удивлён. Не потому, что у них есть какие-то крутые модели, а потому что они действительно занимаются вопросом "качества данных". Сейчас повсюду появляются AI проекты, которые соревнуются в вычислительной мощности, скорости вывода и в том, чья демонстрация более эффектная, но на самом деле, в том, что действительно требует усилий, очень мало кто работает — 👉 Насколько чисты те данные, на которых вы обучаете свои AI? Насколько точно они размечены? Достаточно ли разнообразны их источники? 🔹 Многие проекты в начале думают: "Сначала сделаем, а потом разберемся", 🔹 а когда возникают проблемы, начинают возвращаться к исправлению данных, исправлению меток, повторному обучению моделей, тратят деньги на исправление... 🔹 Проще говоря: если данные не в порядке, то модель не имеет смысла. Приведу пример: 🔹 Какой бы умный вы ни были, если каждый день читать учебники с ошибками и беспорядком, что вы сможете понять? 🔹 AI работает так же: если данные беспорядочные, то сколько бы GPU у вас ни было, это бесполезно. 🔹 В таких областях, как финансы или медицина, ошибка модели может привести к катастрофическим последствиям. 🔹 Особенно в таких задачах, как распознавание мошенничества, использование неправильных данных = множество ложных срабатываний, в результате пользователи просто перестают доверять системе. Поэтому я считаю, что умная сторона Sapien заключается в следующем: 🔹 Подчёркивание разнообразия источников данных, а не сбор информации только от одной группы людей (это очень важно, чтобы избежать предвзятости модели) 🔹 Чёткие правила разметки (что такое "автомобиль"? Легковой? Спортивный? Автобус? Нужно объяснить, чтобы не было путаницы) 🔹 Наличие проверки! Не достаточно просто, чтобы машина сделала разметку, иначе уровень ошибок резко возрастёт. В двух словах: Они рассматривают вопрос "как передать человеческие знания AI" как серьёзную систему. Я посмотрел множество проектов, многие говорят о том, как быстро работают GPU, как эффектны модели, но тех, кто говорит о "как правильно и точно обрабатывать данные", действительно немного. Теперь, если команда хочет серьёзно заниматься AI, им действительно стоит сначала наладить "базу данных", иначе вы просто кормите AI фастфудом и надеетесь, что он станет учёным? Не смешите меня. Поэтому я теперь начинаю думать, что такие проекты, как Sapien, возможно, действительно являются тем, на что стоит обратить внимание в Web3 AI: Это не те, кто просто взрывает аирдропы на короткий срок, а те, кто шаг за шагом строит возможности AI на основе "реальных данных" и "человеческого опыта". Я лично поддерживаю такой подход, если AI хочет быть надёжным, сначала нужно контролировать данные. Не позволяйте моделям делать ошибки быстро и точно.😅 #Sapien #SNAPS #COOKIE #Sapien大使 #Web3AI #CookieDotFun #JoinSapien #Spark #CookieDAO #Spark
Показать оригинал
100
4,1 тыс.
Содержание этой страницы предоставляется третьими сторонами. OKX не является автором цитируемых статей и не имеет на них авторских прав, если не указано иное. Материалы предоставляются исключительно в информационных целях и не отражают мнения OKX. Материалы не являются инвестиционным советом и призывом к покупке или продаже цифровых активов. Раздел использует ИИ для создания обзоров и кратких содержаний предоставленных материалов. Обратите внимание, что информация, сгенерированная ИИ, может быть неточной и непоследовательной. Для получения полной информации изучите соответствующую оригинальную статью. OKX не несет ответственности за материалы, содержащиеся на сторонних сайтах. Цифровые активы, в том числе стейблкоины и NFT, подвержены высокому риску, а их стоимость может сильно колебаться. Перед торговлей и покупкой цифровых активов оцените ваше финансовое состояние и принимайте только взвешенные решения.