Récemment, j'ai vraiment regardé @JoinSapien, et honnêtement, ça m'a frappé. Ce n'est pas à cause d'un modèle impressionnant, mais parce qu'ils prennent vraiment au sérieux la "qualité des données". Regardez, il y a des projets d'IA partout, qui se battent sur la puissance de calcul, la vitesse d'inférence, et qui ont le démo le plus flashy, mais l'endroit où il faudrait vraiment investir des efforts est rarement touché — 👉 Les données sous-jacentes de l'IA que vous entraînez, sont-elles vraiment propres ? Sont-elles bien étiquetées ? Les sources sont-elles suffisamment variées ? 🔹 Beaucoup de projets pensent au début "on verra bien en le faisant", 🔹 mais une fois que les problèmes surviennent, ils retournent en arrière pour compléter les données, corriger les étiquettes, réentraîner les modèles, dépenser de l'argent pour réparer... 🔹 En d'autres termes : si les données ne sont pas bien gérées, les modèles ne servent à rien. Prenons un exemple : 🔹 Peu importe à quel point vous êtes intelligent, si vous regardez des manuels pleins de fautes d'orthographe et de désordre, qu'est-ce que vous pouvez vraiment apprendre ? 🔹 L'IA est la même chose, si les données sont mal gérées, même avec beaucoup de GPU, c'est inutile. 🔹 Dans des domaines comme la finance ou la santé, une erreur de modèle peut être catastrophique. 🔹 Surtout pour des cas comme la détection de fraude, utiliser de mauvaises données = beaucoup de fausses alertes, et au final, les utilisateurs ne font plus confiance au système. Donc je pense que Sapien a eu l'intelligence de : 🔹 Mettre l'accent sur la diversité des sources de données, pas seulement recueillir le contenu d'un seul type de population (c'est super important, pour éviter les biais du modèle) 🔹 Écrire clairement les règles d'étiquetage (qu'est-ce qu'une "voiture" ? Une berline ? Une voiture de sport ? Un bus ? Il faut être clair pour éviter la confusion) 🔹 Avoir des vérifications ! Ce n'est pas suffisant de laisser une machine étiqueter, sinon le taux d'erreur va exploser. En résumé : Ils prennent la question de "comment transférer les connaissances humaines à l'IA" comme un système sérieux à gérer. J'ai regardé pas mal de projets, beaucoup parlent de la rapidité des GPU, de la flamboyance des modèles, mais peu parlent de "comment bien faire et affiner les données". Maintenant, les équipes qui veulent vraiment faire de l'IA devraient d'abord s'assurer que les "fondations des données" sont solides, sinon vous ne faites que nourrir l'IA avec de la malbouffe, et vous espérez qu'elle devienne un scientifique ? Ne rigolez pas. Donc je commence à penser que des projets comme Sapien, peut-être sont ceux qui devraient vraiment être au centre de l'attention dans le Web3 AI : Pas ceux qui explosent avec un airdrop à court terme, mais ceux qui construisent progressivement les capacités de l'IA sur la base de "données réelles" et "d'expérience humaine". Personnellement, je soutiens cette approche, si l'IA veut être fiable, il faut d'abord bien gérer les données. Ne laissez pas les modèles faire des erreurs rapidement et précisément. 😅 #Sapien #SNAPS #COOKIE #AmbassadeurSapien #Web3AI #CookieDotFun #JoinSapien #Spark #CookieDAO #Spark
Afficher l’original
100
4,13 k
Le contenu de cette page est fourni par des tiers. Sauf indication contraire, OKX n’est pas l’auteur du ou des articles cités et ne revendique aucun droit d’auteur sur le contenu. Le contenu est fourni à titre d’information uniquement et ne représente pas les opinions d’OKX. Il ne s’agit pas d’une approbation de quelque nature que ce soit et ne doit pas être considéré comme un conseil en investissement ou une sollicitation d’achat ou de vente d’actifs numériques. Dans la mesure où l’IA générative est utilisée pour fournir des résumés ou d’autres informations, ce contenu généré par IA peut être inexact ou incohérent. Veuillez lire l’article associé pour obtenir davantage de détails et d’informations. OKX n’est pas responsable du contenu hébergé sur des sites tiers. La détention d’actifs numériques, y compris les stablecoins et les NFT, implique un niveau de risque élevé et leur valeur peut considérablement fluctuer. Examinez soigneusement votre situation financière pour déterminer si le trading ou la détention d’actifs numériques vous convient.