¿Recuerdas a los jugadores que tenían cientos de adolescentes jugando Axie Infinity para ganar Pociones de Amor Mágico?
Sí, eso fue hace 4 años.
Ahora podrías simplemente entrenar y activar 100 Operadores de Codec Autónomos para jugar por ti en su lugar
...y monetizarlo y venderlo a otros
✅ AI x Robótica
La narrativa de AI x Robótica se está calentando de verdad con los modelos VLA
En esta etapa del ecosistema de IA, la mayoría de los protocolos y agentes están utilizando motores LLM basados en texto o capturas de pantalla estáticas para interpretar datos
Pero recuerda que la mayoría del mundo real no tiene acceso a API, necesitas visión, decisiones y acciones. El mundo real debe ser visto en píxeles y aquí es donde entran los modelos VLA
@Codecopenflow permite la automatización de software y robótica a través de la visión utilizando una pila tecnológica construida desde cero
✅ Operadores CODEC
Los operadores son agentes de software autónomos que pueden realizar tareas a través de un ciclo de percibir-razonar-actuar. La capacidad de ver la pantalla (o las transmisiones de cámara o los datos de sensores) les permite tomar decisiones que los LLM no podrían hacer
• Percepción: Captura de capturas de pantalla, transmisiones de cámara o datos de sensores
• Razonamiento: Procesa observaciones e instrucciones utilizando modelos de lenguaje-visión
• Acción: Ejecuta decisiones a través de interacciones de UI o control de hardware
En un bucle continuo
Los operadores pueden ejecutarse en servidores bare-metal, Máquinas Virtuales (en cualquier sistema operativo), o incluso en robots.
Cada operador obtiene automáticamente una máquina de computación dedicada (VM aislada o instancia de contenedor), y puede ser asegurado por TEEs (aislamiento a nivel de hardware) para código y datos sensibles.
✅ Capa de Inteligencia AI
Los operadores pueden configurarse para usar uno o más modelos (LLM o VLA) combinados como su "cerebro"
Por ejemplo, emparejar el modelo de lenguaje de bajo costo Mixtral-8×7B con el modelo de visión de código abierto CogVLM permite a los operadores leer texto en pantalla e interpretar transmisiones de pantalla o cámara en vivo - todo a una fracción del costo de GPT-4.
Un modelo VLA (Visión-Lenguaje-Acción) permite al agente interpretar la entrada visual, y luego decidir sobre una acción basada en lo que ve
✅ Casos de Uso
🔹 Automatización de Escritorio
Puede automatizar tareas de oficina repetitivas controlando GUIs. Como llenar hojas de cálculo, actualizar calendarios u otras tareas que requieren interacción con la GUI
Puede manejar actualizaciones de UI ya que puede ver realmente lo que está haciendo
🔹 Agentes de Juegos
Los operadores pueden controlar jugadores o probar videojuegos. Los agentes están transmitiendo la pantalla y pueden realizar acciones basadas en lo que ven enviando comandos de teclado o ratón al juego.
Se puede usar para pruebas de QA, o incluso oponentes NPC avanzados o automatización de juegos web3
🔹 Robótica
Los operadores pueden controlar robots físicos. La capa de máquina se conectará al hardware de un robot con sensores y actuadores, y el agente puede enviar comandos para mover un brazo o navegar.
Por ejemplo, podría capturar una transmisión de cámara de objetos moviéndose en una cinta transportadora y realizar acciones basadas en el movimiento. Si hay un obstáculo en el camino, el operador puede verlo y controlar el robot para evitarlo
✅ Recolección de Datos y Barandillas de Seguridad Onchain
Al llevar la información de los operadores a la cadena en Solana, pueden ofrecer registros de acciones inmutables de todas las acciones realizadas
En el futuro, podemos ver un punto donde las empresas de robótica tendrían que apostar un token para garantizar que sus operadores no hagan que un robot haga contacto físico con un humano por encima de cierta fuerza. Si lo incumplen, se les podría penalizar con una parte del token apostado (como EigenLayer / Symbiotic restaking)
✅ Entorno de Entrenamiento para Robótica
Con Codec, se pueden desplegar modelos virtuales no entrenados en un campo de entrenamiento dinámico y de alta fidelidad, sin necesidad de un robot físico.
Simular, entrenar y refinar comportamientos complejos a escala en la nube, luego transferir esas políticas a hardware real con confianza.
Los entornos de entrenamiento se pueden activar rápidamente para todo tipo de operadores (Software, Juegos o Robótica)
✅ Codec SDK
Se ha desarrollado un SDK y API completos para que los desarrolladores puedan desplegar sus operadores fácilmente
✅ Mercado de Operadores
Los operadores pueden (en el futuro) ser vendidos en un mercado personalizado.
Habrá una división de ingresos para que puedas enviar y monetizar tu operador VLA, lo que significa que si entrenas operadores efectivos podrías tener flujos de ingresos adicionales
✅ Pensamientos Conclusivos
Creo que veremos desarrollos masivos en el campo VLA en el próximo año. Hemos visto lo rápido que se desarrollan los LLM, hace solo unos años se lanzó GPT-1. La robótica y los modelos de visión probablemente se convertirán en una narrativa candente en algún momento de este ciclo, y me gusta estar posicionado temprano
Oh, y mencioné que los cofundadores son de Hugging Face y Elixir games 👀
Nota: Slappjakke tiene grandes bolsas de $CODEC, y esta es una de esas veces en las que me volví aún más optimista mientras escribía este hilo y añadí aún más
Esto, como siempre, no es asesoramiento financiero y es una inversión de alto riesgo, así que haz tu propia investigación.
Mostrar original



8,77 mil
105
El contenido de esta página lo proporcionan terceros. A menos que se indique lo contrario, OKX no es el autor de los artículos citados y no reclama ningún derecho de autor sobre los materiales. El contenido se proporciona únicamente con fines informativos y no representa las opiniones de OKX. No pretende ser un respaldo de ningún tipo y no debe ser considerado como un consejo de inversión o una solicitud para comprar o vender activos digitales. En la medida en que la IA generativa se utiliza para proporcionar resúmenes u otra información, dicho contenido generado por IA puede ser inexacto o incoherente. Lee el artículo vinculado para obtener más detalles e información. OKX no es responsable del contenido alojado en sitios de terceros. El holding de activos digitales, incluyendo stablecoins y NFT, implican un alto grado de riesgo y pueden fluctuar en gran medida. Debes considerar cuidadosamente si el trading o holding de activos digitales es adecuado para ti a la luz de tu situación financiera.