Recientemente he estado mirando detenidamente @JoinSapien, y, para ser honesto, me sorprendió. No es porque tenga algún modelo impresionante, sino porque se toma en serio el tema de la "calidad de los datos". Mira, ahora hay proyectos de IA por todas partes, compitiendo en potencia de cálculo, velocidad de inferencia, y quién tiene la demo más llamativa, pero el verdadero esfuerzo debería estar en un lugar que muy pocos tocan—— 👉 ¿Los datos subyacentes que entrenas en esos AI, están realmente limpios? ¿Están bien etiquetados? ¿Son lo suficientemente diversos en su origen? 🔹 Muchos proyectos al principio piensan "primero lo hacemos y luego vemos", 🔹 y al final, cuando hay problemas, regresan para corregir datos, arreglar etiquetas, reentrenar modelos, gastar dinero para reparar... 🔹 En pocas palabras: si los datos no están bien, el modelo no sirve de nada. Para poner un ejemplo: 🔹 Por muy inteligente que seas, si todos los días ves errores tipográficos y materiales de estudio desordenados, ¿qué puedes aprender? 🔹 Lo mismo ocurre con la IA, si los datos son un desastre, por muchos GPU que tengas, no sirve de nada. 🔹 En campos como las finanzas o la salud, un error en el modelo puede ser catastrófico. 🔹 Especialmente en la detección de fraudes, usar datos incorrectos = un montón de falsas alarmas, y al final los usuarios no confían en el sistema. Así que creo que lo inteligente de Sapien es: 🔹 Enfatizar la diversidad en las fuentes de datos, no solo recopilar contenido de un solo tipo de grupo (esto es súper importante, evita sesgos en el modelo) 🔹 Tener reglas claras para la etiquetación (¿qué es un "coche"? ¿sedán? ¿deportivo? ¿autobús? Hay que aclararlo para que no haya confusiones) 🔹 ¡Tener revisiones! No es suficiente con que la máquina etiquete y ya, eso haría que la tasa de errores se disparara. En resumen: Ellos están tratando el tema de "cómo transferir el conocimiento humano a la IA" como un sistema serio. He revisado varios proyectos, muchos hablan de cuán rápido es el GPU, cuán impresionante es el modelo, pero pocos hablan de "cómo hacer que los datos sean correctos y precisos". Ahora, los equipos que realmente quieren hacer IA deberían primero establecer una buena "base de datos", porque de lo contrario solo estarás alimentando a la IA con comida rápida y esperando que se convierta en un científico. No te engañes. Así que ahora empiezo a pensar que proyectos como Sapien, pueden ser realmente el tipo de cosas a las que deberíamos prestar atención en Web3 AI: No son esos que solo buscan un airdrop a corto plazo, sino aquellos que construyen la capacidad de IA sobre la base de "datos reales" y "experiencia humana". Personalmente, apoyo esta ruta, si la IA quiere ser confiable, primero hay que controlar los datos. No dejes que el modelo haga cosas incorrectas de manera rápida y precisa.😅 #Sapien #SNAPS #COOKIE #EmbajadorSapien #Web3AI #CookieDotFun #JoinSapien #Spark #CookieDAO #Spark
Mostrar original
100
4,13 mil
El contenido de esta página lo proporcionan terceros. A menos que se indique lo contrario, OKX no es el autor de los artículos citados y no reclama ningún derecho de autor sobre los materiales. El contenido se proporciona únicamente con fines informativos y no representa las opiniones de OKX. No pretende ser un respaldo de ningún tipo y no debe ser considerado como un consejo de inversión o una solicitud para comprar o vender activos digitales. En la medida en que la IA generativa se utiliza para proporcionar resúmenes u otra información, dicho contenido generado por IA puede ser inexacto o incoherente. Lee el artículo vinculado para obtener más detalles e información. OKX no es responsable del contenido alojado en sitios de terceros. El holding de activos digitales, incluyendo stablecoins y NFT, implican un alto grado de riesgo y pueden fluctuar en gran medida. Debes considerar cuidadosamente si el trading o holding de activos digitales es adecuado para ti a la luz de tu situación financiera.