Kommer du ihåg spelarna som hade hundratals tonåringar som spelade Axie Infinity för att de skulle tjäna Magic Love Potions?
Ja, det var 4 år sedan.
Nu kan du bara träna och snurra upp 100 autonoma codec-operatörer som spelar åt dig istället
... och tjäna pengar på det och sälja det till andra
✅ AI x Robotik
Berättelsen om AI x Robotics hettar till på riktigt med VLA-modeller
I detta skede i AI-ekosystemet använder majoriteten av protokollen och agenterna textbaserade LLM-motorer eller statiska skärmdumpar för att tolka data
Men kom bara ihåg att större delen av den verkliga världen inte har API-åtkomst, du behöver vision, beslut och åtgärder. Den verkliga världen måste ses i pixlar och det är här VLA-modeller kommer in
@Codecopenflow möjliggör automatisering av programvara och robotik genom vision med hjälp av en teknisk stack byggd från grunden
✅ Codec-operatorer
Operatörer är autonoma programvaruagenter som kan utföra uppgifter genom en uppfatta-anledning-handling-cykel. Möjligheten att se skärmen (eller kameraflöden eller sensordata) gör att de kan fatta beslut som LLM:er inte skulle kunna göra
• Perception: Tar skärmdumpar, kameraflöden eller sensordata
• Resonemang: Bearbetar observationer och instruktioner med hjälp av synspråksmodeller
• Åtgärd: Utför beslut genom UI-interaktioner eller hårdvarukontroll
I en kontinuerlig loop
Operatörerna kan köras på bare-metal-servrar, virtuella maskiner (på vilket operativsystem som helst) eller till och med på robotar.
Varje operatör får automatiskt en dedikerad beräkningsdator (isolerad virtuell dator eller containerinstans) och kan skyddas av TEE:er (isolering på maskinvarunivå) för känslig kod och data.
✅ Lager för AI-intelligens
Operatörerna kan konfigureras för att använda en eller flera modeller (LLM eller VLA) kombinerade som sin "hjärna"
Genom att till exempel para ihop den billiga språkmodellen Mixtral-8×7B med CogVLM-visionsmodellen med öppen källkod kan operatörerna läsa text på skärmen och tolka liveskärms- eller kameraflöden - allt till en bråkdel av GPT-4:s kostnad.
En VLA-modell (Vision-Language-Action) låter agenten tolka visuell input och sedan besluta om en åtgärd baserat på vad den ser
✅ Användningsfall
🔹 Automatisering av stationära datorer
Kan automatisera repetitiva kontorsuppgifter genom att styra GUI. Som att fylla i kalkylblad, uppdatera kalendrar eller andra uppgifter som kräver GUI-interaktion
Kan hantera UI-uppdateringar eftersom den faktiskt kan se vad den gör
🔹 Spelombud
Operatörer kan styra spelare eller testa videospel. Agenterna strömmar skärmen och kan utföra åtgärder baserat på vad de ser genom att skicka tangentbords- eller muskommandon till spelet.
Kan användas för QA-testning, eller till och med avancerade NPC-motståndare eller automatisering av web3-spel
🔹 Robotteknik
Operatörerna kan styra fysiska robotar. Maskinlagret kommer att ansluta till en robots hårdvara med sensorer och ställdon, och agenten kan skicka kommandon för att flytta en arm eller navigera.
T.ex. kan den fånga ett kameraflöde av föremål som rör sig på ett transportband och göra åtgärder baserat på rörelsen. Om det finns ett hinder i vägen kan operatören se det och styra roboten för att undvika det
✅ Datainsamling och Onchain säkerhetsskenor
Genom att ta med informationen från operatörerna i kedjan till Solana kan de erbjuda oföränderliga åtgärdsloggar från alla åtgärder som utförs
I framtiden kan vi se en punkt där robotföretag skulle behöva satsa en token för att garantera att deras operatörer inte skulle få en robot att göra fysisk kontakt med en människa över en viss kraft. Om de bryter mot det skulle de skäras ned för en del av den insatta token (som EigenLayer / Symbiotic restaking)
✅ Utbildningsmiljö för robotik
Med Codec kan otränade virtuella modeller distribueras till en dynamisk, högupplöst träningsplats, ingen fysisk robot krävs.
Simulera, träna och förfina komplexa beteenden i molnskala och överför sedan dessa principer till verklig maskinvara med tillförsikt.
Utbildningsmiljöer kan snabbt skapas för alla typer av operatörer (programvara, spel eller robotik)
✅ Codec SDK (på engelska)
En fullständig SDK och API har utvecklats så att utvecklare enkelt kan distribuera sina operatörer
✅ Marknadsplats för operatörer
Operatörer kan (i framtiden) säljas på en anpassad marknadsplats.
Det kommer att finnas en intäktsdelning så att du kan skicka och tjäna pengar på din VLA-operatör, vilket innebär att om du utbildar effektiva operatörer kan du få ytterligare intäktsströmmar
✅ Avslutande tankar
Jag tror att vi kommer att se en massiv utveckling inom VLA-området under nästa år. Vi har sett hur snabbt LLM:er utvecklas, det var bara några år sedan GPT-1 lanserades. Robotik och visionsmodeller kommer med stor sannolikhet att bli en het berättelse vid en tidpunkt i denna cykel, och jag gillar att vara positionerad tidigt
Åh och nämnde jag att grundarna är från Hugging Face och Elixir games 👀
Obs: Slappjakke har stora $CODEC påsar, och det här är en av de gånger jag blev ännu mer hausse när jag skrev den här tråden och lade till ännu mer
Detta är som alltid inte finansiell rådgivning och en högriskinvestering, så gör din egen research.
Visa original



8,23 tn
100
Innehållet på den här sidan tillhandahålls av tredje part. Om inte annat anges är OKX inte författare till den eller de artiklar som citeras och hämtar inte någon upphovsrätt till materialet. Innehållet tillhandahålls endast i informationssyfte och representerar inte OKX:s åsikter. Det är inte avsett att vara ett godkännande av något slag och bör inte betraktas som investeringsrådgivning eller en uppmaning att köpa eller sälja digitala tillgångar. I den mån generativ AI används för att tillhandahålla sammanfattningar eller annan information kan sådant AI-genererat innehåll vara felaktigt eller inkonsekvent. Läs den länkade artikeln för mer detaljer och information. OKX ansvarar inte för innehåll som finns på tredje parts webbplatser. Innehav av digitala tillgångar, inklusive stabila kryptovalutor och NFT:er, innebär en hög grad av risk och kan fluktuera kraftigt. Du bör noga överväga om handel med eller innehav av digitala tillgångar är lämpligt för dig mot bakgrund av din ekonomiska situation.