في الآونة الأخيرة ، ألقيت نظرة جادة على @JoinSapien ، ولكي أكون صادقا ، أضاءت عيني.
لا يعني ذلك أنه يحتوي على أي نماذج رائعة ، بل إنه جاد بشأن "جودة البيانات".
ترى أن هناك مشاريع الذكاء الاصطناعي في كل مكان الآن ، والعروض التوضيحية لقوة الحوسبة ، وسرعة التفكير ، ومن يقاتل أكثر إبهارا ، ولكن نادرا ما يتم لمس الأماكن التي يجب أن تقضي فيها جهودك حقا-
👉 هل البيانات الأساسية لجهاز الذكاء الاصطناعي الذي دربته نظيفة؟ هل العلامة دقيقة؟ هل المصادر واسعة بما فيه الكفاية؟
🔹 تبدأ العديد من المشاريع بشعور "افعلها أولا".
🔹 نتيجة لذلك ، عندما حدث شيء ما ، عدت لتكوين المعلومات ، وأصلحت الملصق ، وأعدت تدريب النموذج ، وحرقت المال لتعويض القدر......
🔹 بصراحة: البيانات ليست جيدة ، والنموذج كله عبثا.
لنأخذ تشبيها:
🔹 بغض النظر عن مدى ذكائك ، ما الذي يمكنك تعلمه لفهمه من خلال قراءة الأخطاء المطبعية والكتب المدرسية الفوضوية كل يوم؟
🔹إنه نفس الشيء مع الذكاء الاصطناعي ، لا يتم إهدار أي قدر من وحدة معالجة الرسومات إذا تم إفساد البيانات.
🔹 في مجال مثل التمويل أو الرعاية الصحية ، يمكن أن يكون خطأ واحد في النموذج كارثيا.
🔹 خاصة في حالة تحديد الاحتيال ، فإن البيانات الخاطئة = مجموعة من الإنذارات الكاذبة ، ونتيجة لذلك ، لا يثق المستخدم في النظام على الإطلاق.
لذلك أعتقد أن Sapien ذكي في ذلك:
🔹 تؤكد مصادر البيانات على التنوع ، وليس نوعا واحدا فقط من المحتوى (هذا مهم جدا لتجنب تحيز النموذج)
🔹 اكتب بوضوح قواعد الوسم (ما هي "السيارة"؟) سيدان؟ رودستر؟ باص؟ وضح حتى لا يكون الأمر فوضويا)
🔹 قام شخص ما بمراجعة! لا يعني ذلك أن الجهاز قد انتهى بالعلامة ، وبالتالي فإن معدل الخطأ سيرتفع مباشرة
باختصار ، يمكن تلخيصها على النحو التالي:
إنهم يتعاملون مع قضية "كيفية نقل المعرفة البشرية إلى الذكاء الاصطناعي" كنظام خطير.
لقد شاهدت جولة من المشاريع ، وتحدثت كثيرا عن مدى سرعة وحدة معالجة الرسومات ومدى إبهار النموذج.
ولكن لا يوجد الكثير من الحديث عن "كيفية القيام بالمعلومات بشكل صحيح ودقيق".
الآن إذا كنت تريد القيام ب الذكاء الاصطناعي بجدية ، فأنت بحاجة حقا إلى وضع "أساس بيانات" جيد أولا.
وإلا فأنت تطعم الوجبات السريعة الذكاء الاصطناعي وتتوقع أن يكون عالما؟ كف عن هذا.
حتى الآن بدأت أفكر ، مع مشاريع مثل Sapien ،
قد يكون هذا هو نوع الذكاء الاصطناعي Web3 الذي يجب التركيز عليه حقا:
إنه ليس من النوع الذي سيكون جيدا مع الإسقاط الجوي على المدى القصير ، ولكنه النوع الذي يبني قدرات الذكاء الاصطناعي على "البيانات الحقيقية" و "التجربة البشرية" خطوة بخطوة.
أنا شخصيا أؤيد هذا المسار ، يريد الذكاء الاصطناعي أن يكون موثوقا به ، ويتحكم أولا في البيانات.
لا تدع النموذج يفعل الشيء الخطأ بسرعة ودقة. 😅
#Sapien #SNAPS #COOKIE #Sapien大使 #Web3AI #CookieDotFun #JoinSapien #Spark #CookieDAO #Spark
عرض الأصل


100
4.12 ألف
المحتوى الوارد في هذه الصفحة مُقدَّم من أطراف ثالثة. وما لم يُذكَر خلاف ذلك، فإن OKX ليست مُؤلِّفة المقالة (المقالات) المذكورة ولا تُطالِب بأي حقوق نشر وتأليف للمواد. المحتوى مٌقدَّم لأغراض إعلامية ولا يُمثِّل آراء OKX، وليس الغرض منه أن يكون تأييدًا من أي نوع، ولا يجب اعتباره مشورة استثمارية أو التماسًا لشراء الأصول الرقمية أو بيعها. إلى الحد الذي يُستخدَم فيه الذكاء الاصطناعي التوليدي لتقديم مُلخصَّات أو معلومات أخرى، قد يكون هذا المحتوى الناتج عن الذكاء الاصطناعي غير دقيق أو غير مُتسِق. من فضلك اقرأ المقالة ذات الصِلة بهذا الشأن لمزيدٍ من التفاصيل والمعلومات. OKX ليست مسؤولة عن المحتوى الوارد في مواقع الأطراف الثالثة. والاحتفاظ بالأصول الرقمية، بما في ذلك العملات المستقرة ورموز NFT، فيه درجة عالية من المخاطر وهو عُرضة للتقلُّب الشديد. وعليك التفكير جيِّدًا فيما إذا كان تداوُل الأصول الرقمية أو الاحتفاظ بها مناسبًا لك في ظل ظروفك المالية.