‘Mecanismo de simulação multiverso’ prevê todos os futuros possíveis para treinar robôs humanóides e carros autônomos
Os pesquisadores construíram uma nova plataforma de “simulação multiverso” que pode gerar grandes quantidades de dados para treinar robôs avançados de autoaprendizagem alimentados por inteligência artificial (IA).
O conjunto de ferramentas, apelidado de “Cosmos”, permite aos pesquisadores criar “modelos de base mundial” – redes neurais que simulam ambientes do mundo real e as leis da física para prever resultados realistas, de acordo com a Nvidia, que projetou a plataforma. Esses modelos generativos de IA podem criar dados sintéticos para treinar sistemas de IA incorporados ou físicos como veículos autônomos (AVs) ou robôs humanóides.
Os sistemas de IA para treinamento exigem grandes quantidades de dados, mas os cientistas estimam que pode ficar sem dados publicamente disponíveis até 2026. Os sistemas de IA que fazem interface com o mundo real, como os robôs, geralmente precisam de imagens do mundo real que são incrivelmente difíceis de produzir e caras de adquirir.
Mas criar dados sintéticos genuinamente úteis também é um desafio, e um estudo alertou anteriormente que usando dados sintéticos mal interpretados poderia se transformar em um absurdo ininteligível. O Cosmos foi projetado para resolver esses problemas, permitindo que os cientistas gerem rapidamente uma quantidade monumental de imagens de vídeo artificiais baseadas na física do mundo real.
Relacionado: Avanços na robótica em 2024: teste seu conhecimento sobre os avanços mais interessantes na área
“Os desenvolvedores humanóides de hoje têm centenas de operadores humanos realizando milhares de demonstrações repetitivas apenas para ensinar algumas habilidades”, afirmou. Rev Lebaredianovice-presidente de Omniverse e tecnologia de simulação da Nvidia, em uma entrevista coletiva virtual na segunda-feira (6 de janeiro) na CES 2025 em Las Vegas. “Os desenvolvedores AV de hoje precisam dirigir milhões de quilômetros; processar, filtrar e rotular os milhares de petabytes de dados capturados consome ainda mais recursos, e os testes físicos são perigosos. Os desenvolvedores humanóides têm muito a perder quando um protótipo de robô pode custar centenas de milhares de dólares.”
Simulando o multiverso
Um componente chave desta nova plataforma é a simulação multiverso, na qual o Cosmos se combina com o sistema de software Omniverse da Nvidia para gerar todos os resultados futuros possíveis num cenário específico. Isso seria então utilizado no treinamento de um robô ou carro autônomo.
Ele usa modelos de difusão usados na geração de imagens – algoritmos de aprendizado de máquina que geram dados adicionando “ruído” (especificações granuladas) a um conjunto de dados e depois aprendendo a remover o ruído – bem como modelos autorregressivos, que são modelos estatísticos usados para prever o próximo etapa de um processo. Juntas, a plataforma pode receber texto, imagens ou vídeos e depois gerar imagens para prever o que vem a seguir num determinado cenário em tempo real.
“O momento ChatGPT para a robótica está chegando. Assim como os grandes modelos de linguagem, os modelos de base mundial são fundamentais para o avanço do desenvolvimento de robôs e AV, mas nem todos os desenvolvedores têm experiência e recursos para treinar os seus próprios.” Jensen Huangfundador e CEO da Nvidia, disse em um comunicado. “Criamos o Cosmos para democratizar a IA física e colocar a robótica geral ao alcance de todos os desenvolvedores.”
Os modelos de fundação mundial criados com o Cosmos também estão disponíveis sob termos de licenciamento de código aberto.