Como os agentes de IA de profundidade e próxima geração podem corroer o valor dos modelos de linguagem
Jaap Arriens | Nurphoto via Getty Images
Grandes modelos de idiomas como os desenvolvidos por Microsoft-A empresa aborada OpenAI deve se tornar comoditizada este ano, em meio a rápidos avanços em direção a agentes de inteligência artificial de última geração e mais rivais ágeis e de código aberto, de acordo com os principais executivos de tecnologia.
Na semana passada, a empresa de IA chinesa Deepseek lançou R1, um Modelo de raciocínio de código aberto que afirma rivalizar com o modelo O1 do OpenAI em custo e desempenho. A fonte aberta refere-se a software cujo código fonte é disponibilizado gratuitamente na Web Open para possível modificação e redistribuição.
Nesta semana, crescente consciência do novo modelo de Deepseek levou a uma queda severa em ações de Nvidia e outros gigantes da tecnologia, como os investidores temiam uma possível restrição de gastos nas poderosas unidades de processamento de gráficos necessários para treinar e executar cargas de trabalho avançadas de IA.
Nvidia perdido perto de US $ 600 bilhões em capitalização de mercado Na segunda-feira-a maior queda de um dia para qualquer empresa da história dos EUA.
Enquanto isso, executivos e cientistas do líder da IA Labs estão falando de uma mudança dos grandes modelos de idiomas para os chamados “agentes de IA” que podem realizar ações em seu nome.
Os LLMs são a tecnologia fundamental por trás dos aplicativos generativos de IA atuais. No entanto, os especialistas acreditam que um impulso em direção aos sistemas Agentic AI – que incorporam a tecnologia LLM – este ano corroerá o valor desses modelos.
Comoditização de LLMs
Espera -se que os LLMs se tornem mais uma mercadoria em um futuro próximo à medida que a tecnologia se torna cada vez mais avançada e os custos envolvidos no treinamento e na execução continuam a cair.
Thomas Wolf, co-fundador e diretor de ciências da Hugging Face, sugeriu que o LLMS se torne mais integrado a sistemas inteligentes vinculados aos próprios bancos de dados da empresa.
“Acho que as pessoas estão se mudando dessa loucura em torno do modelo, entendendo que, graças à fonte aberta … muitos desses modelos serão gratuitos e gratuitos”, disse Wolf à CNBC. Abraçar o rosto é um repositório de código popular para projetos de IA de código aberto.
“Na Revolução da Internet, estamos passando da construção de sites como o principal negócio para realmente construir empresas nativas da Internet-então, o Airbnb da IA, a faixa da IA”, acrescentou. “Eles não são sobre o modelo. Eles são sobre o sistema e como você torna o modelo útil para tarefas”.
A chegada do modelo R1 de Deepseek na semana passada é vista por alguns CEOs de tecnologia como um Outros indicadores LLMs estão se tornando cada vez mais comoditizados.
O R1 incorpora alguns aspectos -chave que o diferenciam de outros modelos no mercado. Por exemplo, o modelo incorpora uma estrutura de “precisão mista” que usa uma combinação de números de ponto flutuante de 32 bits (FP32) de precisão completa e números de ponto flutuante de 8 bits (FP8) de baixa precisão.
O último é mais rápido para processar, mas pode ser menos preciso. No entanto, em vez de confiar em um ou outro, o Deepseek usa o FP8 para a maioria dos cálculos e alterna para FP32 para determinadas tarefas em que é necessário um maior grau de precisão.
“À medida que a IA se torna mais eficiente e acessível, veremos seu uso do Skyrocket, transformando -o em uma mercadoria que simplesmente não conseguimos”, ” Microsoft CEO Satya Nadella escreveu na plataforma de mídia social X, em uma aparente referência a Deepseek.
Enquanto isso, Matt Calkins, CEO da empresa de software americano Appian, disse à CNBC que o sucesso da Deepseek simplesmente mostra que os modelos de IA se tornarão mais uma mercadoria no futuro.
“Na minha opinião, veremos uma comoditização da IA. Muitas empresas alcançarão a IA competitiva, e a falta de diferenciação será ruim para os primeiros passantes de alto gasto”, disse Calkins por e-mail.
O que são agentes de IA?
Nos últimos dois anos, grande parte do foco tem sido os produtos movidos a LLM, desde chatbots generativos de AI, como o Chatgpt do OpenAI, até ferramentas que podem produzir imagens e conteúdo de vídeo.
Aplicativos generativos baseados em LLM, como o ChatGPT, dependem de uma certa quantidade de manutenção de usuários para solicitá-los continuamente para obter saídas, enquanto que, por outro lado, os agentes de IA são projetados para serem mais orientados para a ação.
Se você quisesse marcar uma consulta médica, por exemplo, pode solicitar informações sobre o ChatGPT sobre as práticas de GP mais próximas – semelhante a como você consultaria a web usando o mecanismo de pesquisa do Google.
No futuro, os executivos de tecnologia prevêem que a IA da próxima geração envolverá agentes que podem descobrir onde está o seu médico mais próximo, fornecerá horários disponíveis para o seu médico e marcar uma consulta – tudo diretamente dentro de uma única plataforma. Espera -se que isso transforme a maneira como interagimos com a web.
“Ao longo das décadas desde que a web foi inventada, a interface padrão de páginas da web e menus não mudou muito”, disse Bobby Blumofe, diretor de tecnologia da Akamai, à CNBC anteriormente.
“Estamos vivendo a essa tirania de ser amarrada a uma tela e sendo amarrados às páginas da web e aos menus que você deve se lembrar de como navegar”.
A mudança de modelos para agentes
Na semana passada, Arthur Mensch, CEO da Mistral, disse que acha que o “foco deve mudar para os sistemas” que integram modelos de idiomas e dados de negócios contextuais.
“É aí que isso está mudando”, disse Mensch à Arjun Kharpal, da CNBC, na reunião anual do Fórum Econômico Mundial em Davos, na Suíça.
“Isso também significa que o setor que o está adotando destaca sua experiência nesses sistemas – e é aí que será necessário impulsionar o valor da IA nessas indústrias”.
Mistral, que é apoiado por Microsoftrapidamente se tornou uma das mais agitadas empresas de IA da Europa. Fundada apenas dois anos atrás, foi Última valor por investidores em cerca de US $ 6 bilhões Em junho de 2024.
A tendência dos agentes já ganhou uma tração considerável. Semana passada, O Openai lançou seu próprio agente, chamado operador. O OpenAI o descreve como “um agente que pode ir à web para executar tarefas para você”, acrescentando que é treinado para interagir com “os botões, menus e campos de texto que as pessoas usam diariamente” na web.
Microsoft, que investiu bilhões de dólares em Openai, Os próprios agentes da IA lançados em novembro.
Antrópico, An Amazon-Startup de IA apoiada por ex-executivos de pesquisa ex-abertura, no ano passado Introduzido “Uso do computador”. O que é uma capacidade que permite que seus agentes de IA usem computadores como os humanos para concluir tarefas complexas.
Dario Amodei, CEO da Anthrópica, disse a Andrew Ross Sorkin, da CNBC, em Davos, na semana passada, que o uso do computador deve ser considerado um precursor de uma “visão mais ampla” que integra esses agentes com aplicações comumente usadas.
“Estamos planejando este ano em 2025 para construir algo que chamamos de 'colaborador virtual'”, disse Amodei, descrevendo -o como “um agente que opera no seu computador”.
“Você pode fornecer tarefas. Você pode dizer, escreva esse recurso para este aplicativo e ele escreverá algum código, ele compilará o código, ele verificará o código, ele falará com seus colegas de trabalho no Slack, ou no Google Docs, ou em alguma outra plataforma “, explicou o chefe do Anthrópico.
Os planos antrópicos para construir gradualmente peças dessa visão no próximo ano – enquanto ainda garantem que seja “seguro e controlável”, acrescentou Amodei.
Paul O'Sullivan, diretor de tecnologia da Salesforce da Reino Unido e da Irlanda, prevê que a comunicação verbal se tornará mais importante no novo mundo dos agentes da IA. O Salesforce foi indiscutivelmente cedo para o jogo Agentic AI, tendo lançado seu próprio sistema de forforce em setembro antes da Microsoft, OpenAi ou Antrópica.
“Conversaremos mais”, disse ele à CNBC em uma entrevista recente. “As telas ficarão menores, nossos olhos piorarão. Mas provavelmente serão substituídos por dispositivos móveis mais poderosos que os laptops de qualquer maneira”.