Ostatnio poważnie przyjrzałem się @JoinSapien i szczerze mówiąc, zrobiło to na mnie wrażenie. Nie dlatego, że mają jakieś fajne modele, ale dlatego, że poważnie podchodzą do kwestii „jakości danych”. Zobacz, teraz wszędzie są projekty AI, które rywalizują w mocy obliczeniowej, szybkości wnioskowania, kto ma bardziej efektowną prezentację, ale naprawdę tam, gdzie powinno się włożyć wysiłek, niewiele osób się tym zajmuje — 👉 Czy te AI, które trenujesz, mają czyste dane u podstaw? Czy są odpowiednio oznaczone? Czy źródła są wystarczająco różnorodne? 🔹Wiele projektów na początku myśli „najpierw zróbmy, a potem zobaczymy”, 🔹a potem, gdy coś pójdzie nie tak, wracają, aby uzupełnić dane, poprawić etykiety, ponownie trenować modele, wydawać pieniądze na naprawy… 🔹Mówiąc wprost: jeśli dane są złe, model jest bezwartościowy. Dla przykładu: 🔹Niezależnie od tego, jak mądra jesteś, jeśli codziennie oglądasz błędy ortograficzne i chaotyczne materiały, co możesz się nauczyć? 🔹AI działa na tej samej zasadzie, jeśli dane są chaotyczne, to nawet najwięcej GPU nie pomoże. 🔹W takich dziedzinach jak finanse czy medycyna, jeden błąd modelu może prowadzić do katastrofy. 🔹Szczególnie w przypadku wykrywania oszustw, użycie złych danych = mnóstwo fałszywych alarmów, w rezultacie użytkownicy przestają ufać systemowi. Dlatego uważam, że mądrością Sapien jest: 🔹Podkreślenie różnorodności źródeł danych, a nie zbieranie treści tylko od jednej grupy ludzi (to bardzo ważne, aby uniknąć stronniczości modelu) 🔹Jasne zasady oznaczania (co to znaczy „samochód”? Sedan? Sportowy? Autobus? Wyjaśnij to, aby uniknąć zamieszania) 🔹Ktoś to sprawdza! Nie wystarczy, że maszyny oznaczą dane, bo wtedy wskaźnik błędów wzrośnie. Podsumowując w jednym zdaniu: Traktują kwestię „jak przekazać ludzką wiedzę AI” jako poważny system. Przejrzałem wiele projektów, które mówią o tym, jak szybkie są GPU, jak efektowne są modele, ale niewiele mówi o „jak poprawnie i precyzyjnie przetwarzać dane”. Teraz zespoły, które chcą poważnie zająć się AI, naprawdę powinny najpierw zadbać o „fundament danych”, bo w przeciwnym razie tylko karmisz AI fast foodem i oczekujesz, że stanie się naukowcem? Nie żartuj. Dlatego teraz zaczynam myśleć, że projekty takie jak Sapien, mogą być tym, na co naprawdę warto zwrócić uwagę w Web3 AI: Nie chodzi o krótkoterminowe airdropy, ale o stopniowe budowanie zdolności AI na podstawie „prawdziwych danych” i „ludzkiego doświadczenia”. Osobiście popieram tę drogę, aby AI było wiarygodne, najpierw trzeba zadbać o dane. Nie pozwól, aby model szybko i dokładnie popełniał błędy.😅 #Sapien #SNAPS #COOKIE #SapienAmbasador #Web3AI #CookieDotFun #JoinSapien #Spark #CookieDAO #Spark
Pokaż oryginał
100
4,12 tys.
Treści na tej stronie są dostarczane przez strony trzecie. O ile nie zaznaczono inaczej, OKX nie jest autorem cytowanych artykułów i nie rości sobie żadnych praw autorskich do tych materiałów. Treść jest dostarczana wyłącznie w celach informacyjnych i nie reprezentuje poglądów OKX. Nie mają one na celu jakiejkolwiek rekomendacji i nie powinny być traktowane jako porada inwestycyjna lub zachęta do zakupu lub sprzedaży aktywów cyfrowych. Treści, w zakresie w jakim jest wykorzystywana generatywna sztuczna inteligencja do dostarczania podsumowań lub innych informacji, mogą być niedokładne lub niespójne. Przeczytaj podlinkowany artykuł, aby uzyskać więcej szczegółów i informacji. OKX nie ponosi odpowiedzialności za treści hostowane na stronach osób trzecich. Posiadanie aktywów cyfrowych, w tym stablecoinów i NFT, wiąże się z wysokim stopniem ryzyka i może podlegać znacznym wahaniom. Musisz dokładnie rozważyć, czy handel lub posiadanie aktywów cyfrowych jest dla Ciebie odpowiednie w świetle Twojej sytuacji finansowej.