Nyligen tog jag en allvarlig titt på @JoinSapien , och för att vara ärlig lyste mina ögon upp. Det är inte så att den har några coola modeller, det är att den menar allvar med "datakvalitet". Du ser att det finns AI-projekt överallt nu, och demonstrationerna av datorkraft, resonemangshastighet och vilka som slåss är mer bländande, men de platser där du verkligen borde spendera dina ansträngningar berörs sällan. 👉 Är underliggande data för den AI du tränat rena? Är märket korrekt? Är källorna tillräckligt breda? 🔹 Många projekt börjar med känslan av att "göra det först". 🔹 Som ett resultat, när något hände, gick jag tillbaka för att fylla på informationen, reparerade etiketten, skolade om modellen och brände pengar för att kompensera för potten...... 🔹 För att uttrycka det rakt på sak: uppgifterna är inte bra och modellen är helt förgäves. Låt oss ta en analogi: 🔹 Oavsett hur smart du är, vad kan du lära dig att förstå genom att läsa stavfel och röriga läroböcker varje dag? 🔹Det är samma sak med AI, ingen mängd GPU går till spillo om data är förstörd. 🔹 Inom ett område som finans eller hälso- och sjukvård kan ett enda fel i modellen vara katastrofalt. 🔹 Speciellt vid bedrägeriidentifiering är fel data = en massa falska larm, och som ett resultat litar användaren inte alls på systemet. Så jag tycker att Sapien är smart i det: 🔹 Datakällor betonar mångfald, inte bara en typ av innehåll (detta är mycket viktigt för att undvika modellbias) 🔹 Skriv tydligt märkningsreglerna (vad är en "bil"?) Sedan? Roadster? Buss? Gör det tydligt så att det inte blir kladdigt) 🔹 Någon har recenserat! Det är inte så att maskinen är klar med märket, så felfrekvensen kommer att skjuta i höjden direkt Med ett ord kan det sammanfattas som: De behandlar frågan om "hur mänsklig kunskap överförs till AI" som ett seriöst system. Jag tittade på en omgång projekt och pratade mycket om hur snabb GPU:n är och hur bländande modellen är. Men det pratas egentligen inte så mycket om "hur man gör informationen korrekt och fint". Om du nu vill göra AI på allvar måste du verkligen lägga en bra "datagrund" först. Eller så matar du bara AI:n med snabbmat och förväntar dig att den ska vara en forskare? Sluta. Så nu börjar jag tänka, med projekt som Sapien, Det kan vara den typ av Web3 AI som verkligen borde fokusera på: Det är inte den typ som kommer att klara sig bra med en kortvarig airdrop, utan den typ som bygger AI-funktioner på "verkliga data" och "mänsklig erfarenhet" steg för steg. Personligen stöder jag den här vägen, AI vill vara pålitlig och först kontrollera data. Låt inte modellen göra fel saker snabbt och exakt. 😅 #Sapien #SNAPS #COOKIE #Sapien大使 #Web3AI #CookieDotFun #JoinSapien #Spark #CookieDAO #Spark
Visa original
100
4,13 tn
Innehållet på den här sidan tillhandahålls av tredje part. Om inte annat anges är OKX inte författare till den eller de artiklar som citeras och hämtar inte någon upphovsrätt till materialet. Innehållet tillhandahålls endast i informationssyfte och representerar inte OKX:s åsikter. Det är inte avsett att vara ett godkännande av något slag och bör inte betraktas som investeringsrådgivning eller en uppmaning att köpa eller sälja digitala tillgångar. I den mån generativ AI används för att tillhandahålla sammanfattningar eller annan information kan sådant AI-genererat innehåll vara felaktigt eller inkonsekvent. Läs den länkade artikeln för mer detaljer och information. OKX ansvarar inte för innehåll som finns på tredje parts webbplatser. Innehav av digitala tillgångar, inklusive stabila kryptovalutor och NFT:er, innebär en hög grad av risk och kan fluktuera kraftigt. Du bör noga överväga om handel med eller innehav av digitala tillgångar är lämpligt för dig mot bakgrund av din ekonomiska situation.