Lembre-se dos jogadores que tinham centenas de adolescentes jogando Axie Infinity para eles ganharem Poções de Amor Mágico? Sim, isso foi há 4 anos. Agora você poderia apenas treinar e ativar 100 Operadores de Codec Autônomos para jogar por você em vez disso ...e monetizá-los e vendê-los a outros ✅ AI x Robótica A narrativa de AI x Robótica está realmente aquecendo com os modelos VLA ​ Neste estágio do ecossistema de IA, a maioria dos protocolos e agentes está usando motores LLM baseados em texto ou capturas de tela estáticas para interpretar dados ​ Mas lembre-se de que a maior parte do mundo real não tem acesso à API, você precisa de visão, decisões e ações. O mundo real deve ser visto em pixels e é aqui que os modelos VLA entram ​ @Codecopenflow permite a automação de software e robótica através da visão usando uma pilha tecnológica construída do zero ✅ Operadores CODEC ​ Os operadores são agentes de software autônomos que podem realizar tarefas através de um ciclo de perceber-raciocinar-agir. A capacidade de ver a tela (ou feeds de câmera ou dados de sensores) permite que eles tomem decisões que os LLMs não seriam capazes de fazer ​ • Percepção: Captura de capturas de tela, feeds de câmera ou dados de sensores • Raciocínio: Processa observações e instruções usando modelos de linguagem-visual • Ação: Executa decisões através de interações de UI ou controle de hardware ​ Em um loop contínuo Os Operadores podem rodar em servidores bare-metal, Máquinas Virtuais (em qualquer sistema operacional), ou até mesmo em robôs. ​ Cada operador automaticamente recebe uma máquina de computação dedicada (VM isolada ou instância de contêiner), e pode ser protegido por TEEs (isolamento a nível de hardware) para código e dados sensíveis. ​ ✅ Camada de Inteligência AI ​ Os Operadores podem ser configurados para usar um ou mais modelos (LLM ou VLA) combinados como seu "cérebro" ​ Por exemplo, emparelhar o modelo de linguagem de baixo custo Mixtral-8×7B com o modelo de visão de código aberto CogVLM permite que os Operadores leiam texto na tela e interpretem feeds de tela ou câmera ao vivo - tudo a uma fração do custo do GPT-4. ​ Um modelo VLA (Visão-Linguagem-Ação) permite que o agente interprete a entrada visual e, em seguida, decida uma ação com base no que vê ✅ Casos de Uso ​ 🔹 Automação de Desktop ​ Pode automatizar tarefas de escritório repetitivas controlando GUIs. Como preencher planilhas, atualizar calendários ou outras tarefas que requerem interação com a GUI ​ Pode lidar com atualizações de UI, pois pode realmente ver o que está fazendo ​ 🔹 Agentes de Jogos ​ Os Operadores podem controlar jogadores ou testar videogames. Os agentes estão transmitindo a tela e podem fazer ações com base no que veem, enviando comandos de teclado ou mouse para o jogo. ​ Podem ser usados para testes de QA, ou até mesmo oponentes NPC avançados ou automação de jogos web3 ​ 🔹 Robótica ​ Os Operadores podem controlar robôs físicos. A camada de máquina se conectará ao hardware do robô com sensores e atuadores, e o agente pode enviar comandos para mover um braço ou navegar. ​ Por exemplo, poderia capturar um feed de câmera de objetos se movendo em uma esteira e fazer ações com base no movimento. Se houver um obstáculo no caminho, o Operador pode vê-lo e controlar o robô para evitá-lo ​ ✅ Coleta de Dados e Trilhas de Segurança Onchain ​ Ao trazer as informações dos Operadores para a blockchain Solana, eles podem oferecer logs de ações imutáveis de todas as ações realizadas ​ No futuro, podemos ver um ponto em que as empresas de Robótica seriam obrigadas a apostar um token para garantir que seus Operadores não fizessem um robô entrar em contato físico com um humano acima de uma certa força. Se violarem isso, seriam penalizados por uma parte do token apostado (como EigenLayer / Symbiotic restaking) ​ ✅ Ambiente de Treinamento para Robótica ​ Com Codec, modelos virtuais não treinados podem ser implantados em um campo de treinamento dinâmico e de alta fidelidade, sem necessidade de robô físico. ​ Simule, treine e refine comportamentos complexos em escala de nuvem, depois transfira essas políticas para hardware real com confiança. Ambientes de treinamento podem ser rapidamente criados para todos os tipos de Operadores (Software, Jogos ou Robótica) ​ ✅ Codec SDK ​ Um SDK e API completos foram desenvolvidos para que os desenvolvedores possam implantar seus Operadores facilmente ​ ✅ Mercado de Operadores ​ Os Operadores podem (no futuro) ser vendidos em um mercado personalizado. ​ Haverá uma divisão de receita para que você possa enviar e monetizar seu operador VLA, significando que se você treinar Operadores eficazes, poderá ter fluxos de receita adicionais ​ ✅ Pensamentos Finais ​ Acho que veremos desenvolvimentos massivos no campo VLA no próximo ano. Vimos quão rápido os LLMs são desenvolvidos, foi apenas há alguns anos que o GPT-1 foi lançado. Robótica e Modelos de Visão provavelmente se tornarão uma narrativa quente em algum momento deste ciclo, e eu gosto de estar posicionado cedo ​ Ah, e mencionei que os co-fundadores são da Hugging Face e Elixir games 👀 ​ Nota: Slappjakke tem grandes quantidades de $CODEC, e esta é uma daquelas vezes em que fiquei ainda mais otimista enquanto escrevia este tópico e adicionei ainda mais ​ Isso, como sempre, não é aconselhamento financeiro e é um investimento de alto risco, então faça sua própria pesquisa.
Mostrar original
8,86 mil
105
O conteúdo apresentado nesta página é fornecido por terceiros. Salvo indicação em contrário, a OKX não é o autor dos artigos citados e não reivindica quaisquer direitos de autor nos materiais. O conteúdo é fornecido apenas para fins informativos e não representa a opinião da OKX. Não se destina a ser um endosso de qualquer tipo e não deve ser considerado conselho de investimento ou uma solicitação para comprar ou vender ativos digitais. Na medida em que a IA generativa é utilizada para fornecer resumos ou outras informações, esse mesmo conteúdo gerado por IA pode ser impreciso ou inconsistente. Leia o artigo associado para obter mais detalhes e informações. A OKX não é responsável pelo conteúdo apresentado nos sites de terceiros. As detenções de ativos digitais, incluindo criptomoedas estáveis e NFTs, envolvem um nível de risco elevado e podem sofrer grandes flutuações. Deve considerar cuidadosamente se o trading ou a detenção de ativos digitais é adequado para si à luz da sua condição financeira.