“Quero uma IA que lave minha roupa enquanto faço arte, não que faça arte enquanto lavo minha roupa”, diz um meme que vira e mexe ressurge nas redes sociais. Não sem razão, porque o advento das ferramentas generativas fez as máquinas ocuparem atividades criativas, deixando para nós tarefas domésticas que não são exatamente campeãs de popularidade.
A boa notícia é que, sim, existem pesquisas nesse sentido. E apareceram novidades relacionadas a uma delas nos últimos dias, caso do projeto V-JEPA 2, da Meta.
Esse nome estranho vem da sigla para Video Joint Embedding Predictive Architecture 2 — ou seja, mais fácil usar a forma abreviada mesmo — e se refere a uma tecnologia que usa vídeos para tentar reproduzir a forma como humanos lidam com tarefas complexas. Especialmente, a maneira como nosso cérebro processa os diferentes estímulos ao nosso redor por meio do olhar.
A Meta divulgou um vídeo de braços mecânicos que, graças ao V-JEPA 2, dá os primeiros passos para dominar a tarefa de dobrar uma camiseta. Eu sei, para gente como a gente é a tarefa mais prosaica do mundo, mas para os robôs é mais simples recriar um Da Vinci. O V-JEPA 2 ensina às máquinas um tipo de “bom senso” sobre o mundo físico, um ingrediente fundamental para que, no futuro, elas possam de fato assumir tarefas complexas. Ou seja, é uma tecnologia que abre caminho para uma nova geração de robôs e sistemas autônomos.
Como um robô vai saber dobrar roupas?
Desenvolvido sob a liderança de Yann LeCun, um dos pioneiros da área, o V-JEPA 2 não é um robô, mas sim o cérebro por trás dele. A tecnologia funciona como um “modelo do mundo”: ela constrói uma representação interna do ambiente, quase como um mapa mental.
Para isso, foi treinada com mais de 1 milhão de horas de vídeo, aprendendo as leis da física, as dinâmicas dos objetos e os padrões de interação sem que um humano precisasse rotular os dados.
No caso da atividade de dobrar roupas, por exemplo: o modelo assiste a milhares de horas de vídeo para criar uma compreensão intuitiva da física. Com isso, ele não decora a tarefa, mas antecipa como uma peça de roupa vai se mover, amassar ou se acomodar a cada dobra. Essa capacidade de prever as consequências de uma ação é o que permite ao robô manipular objetos flexíveis e imprevisíveis como tecidos. Essencialmente, ele ganha o “bom senso” necessário para a tarefa.

É essa habilidade de prever consequências que se torna essencial para robôs que precisam manipular objetos ou navegar em espaços desconhecidos. Em testes, robôs equipados com o V-JEPA 2 já conseguem pegar, mover e organizar itens em ambientes nunca vistos antes, atingindo taxas de sucesso de até 80%.
Onde na sua vida o V-JEPA 2 poderá aparecer?
As possibilidades vão além da robótica tradicional. O V-JEPA 2 pode ser empregado em veículos autônomos, assistentes domésticos, dispositivos de realidade aumentada e virtual, logística e até mesmo em sistemas de auxílio para pessoas com deficiência visual. Por ser open source, o modelo e seus benchmarks estão disponíveis para pesquisadores e startups, acelerando a inovação global e democratizando o acesso à IA de ponta.
A expectativa no segmento de IA é que os robôs que atualmente a gente vê mais nos vídeos de Instagram se proliferem por domicílios mundo afora por volta de 2027. Essa é a previsão, por exemplo, de Sam Altman, CEO da OpenAI.
“Em breve, tudo o que se move será robótico”
Em um texto recém-publicado em seu blog, Altman descreve um futuro onde robôs poderão operar toda a cadeia de suprimentos — da mineração à fabricação — para construir mais robôs, acelerando drasticamente o progresso em áreas críticas como a criação de novos data centers e fábricas de chips.

(E, sim, precisamos debater com mais afinco o que isso representará para o futuro dos empregos. O mais provável é que a humanidade precise redefinir sua relação com o trabalho, como falamos aqui na coluna no texto de estreia.)
Jensen Huang, CEO da NVIDIA, chama essa tendência de a “próxima onda da IA”: a “IA Física”. Em palestras como a que fez na Computex, ele falou da ideia de uma inteligência artificial que “compreende as leis da física e pode trabalhar entre nós” — que é exatamente o que tecnologias como o V-JEPA 2 vêm fazendo.
Huang acredita que essa mudança dará início a uma nova revolução industrial e declarou de forma contundente: “Em breve, tudo o que se move será robótico”. Essa perspectiva reforça que a IA está saindo das telas para se tornar uma força ativa em nosso ambiente.