News

A inovação de Deepseek encoraja modelos de IA de código aberto como a Llama de Meta's

Omer Taha Cetin | Anadolu | Getty Images

O poderoso novo modelo de inteligência artificial de Deepseek não é apenas uma vitória para a China-é uma vitória para versões de código aberto da tecnologia de artistas como MetaDatabricks, Mistral and Hugging Face, de acordo com especialistas do setor que conversaram com a CNBC.

No mês passado, Deepseek lançou R1, um Modelo de raciocínio de código aberto que afirma rivalizar com o desempenho do modelo O1 do OpenAI usando um processo mais barato e menos intensivo de energia.

O desenvolvimento fez com que os valores de mercado da NVIDIA e de outros fabricantes de chips caíssem por medo de que isso possa levar a gastos reduzidos em infraestrutura de computação de alto desempenho.

O Deepseek é um laboratório de IA chinês que se concentra no desenvolvimento de grandes modelos de idiomas com o objetivo final de alcançar a inteligência geral artificial, ou AGI. Foi fundada em 2023 por Liang Wenfeng, co-fundador do fundo de hedge quantitativo focado na IA.

AGI refere -se vagamente à idéia de uma IA que é igual ou supera o intelecto humano em uma ampla gama de tarefas.

O que é a IA de código aberto?

Desde que o chatgpt da OpenAI entrou em cena em novembro de 2022, os pesquisadores de IA têm trabalhado duro para entender e melhorar os avanços da tecnologia fundamental de modelos de idiomas fundamentais que a sustenta.

Uma área de foco para muitos laboratórios tem sido a IA de código aberto. Código aberto refere -se a software cujo código fonte é disponibilizado gratuitamente na Web Open para possível modificação e redistribuição.

Muitas empresas de gigantes da tecnologia, como a Meta a startups mais esbeltos, como Mistral e Hugging Face estão apostando em código aberto como uma maneira de melhorar a tecnologia, além de compartilhar desenvolvimentos importantes com a comunidade de pesquisa mais ampla.

Como o DeepSeek fortaleceu o código aberto

O avanço tecnológico de Deepseek apenas tornou o argumento para modelos de IA de código aberto mais fortes, de acordo com alguns executivos de tecnologia.

Seeda Rejal, diretor comercial da IA ​​Startup Netmind, disse à CNBC que o sucesso da empresa chinesa mostra que a IA de código aberto “não é mais apenas uma iniciativa de pesquisa não comercial, mas uma alternativa viável e escalável aos modelos fechados” como o OpenAi do GPT.

“O Deepseek R1 demonstrou que os modelos de código aberto podem alcançar um desempenho de ponta, rivalizando com modelos proprietários do OpenAI e outros”, disse Rejal ao CNBC. “Isso desafia a crença de que apenas modelos de fonte fechada podem dominar a inovação nesse espaço”.

Rejal não está sozinha. Yann Lecun, cientista-chefe da Meta, disse que o sucesso de Deepseek representa uma vitória para os modelos de IA de código aberto, não necessariamente uma vitória para a China nos Estados Unidos. A Meta está por trás de um popular modelo de IA de código aberto chamado Llama.

“Para as pessoas que veem o desempenho da Deepseek e pensam: 'A China está superando os EUA na IA'. Você está lendo este errado.

Leia mais cobertura Deepseek

“Deepseek lucrou com pesquisas abertas e código aberto (por exemplo, Pytorch e Llama da Meta). Eles tiveram novas idéias e as construíram além do trabalho de outras pessoas. Como seu trabalho é publicado e de código aberto, todos podem lucrar com isso. Esse é o poder da pesquisa aberta e de código aberto “.

Ai de código aberto Going Global

Cortado por Washington de acessar chips avançados necessários para treinar e executar modelos de IA, a China se voltou para a tecnologia de código aberto para aumentar o apelo de seus modelos de IA. Muitas empresas chinesas – inclusive a Deepseek – estão buscando modelos de código aberto como uma maneira de aumentar a inovação e espalhar seu uso.

Mas a tendência de empresas que se voltam para tecnologias de código aberto para o sucesso na IA não se limitam à China. Na Europa, uma aliança de acadêmicos, empresas e data centers fez parceria no desenvolvimento de uma família de modelos de grandes idiomas multilíngues e de alto desempenho, chamados OpenEurollm.

A aliança é liderada por Jan Hajič, um renomado linguista computacional da Charles University, Czechia, e Peter Sarlin, co-fundador da Silo AI, um laboratório de IA que foi comprado pelo fabricante de chips americanos AMD no ano passado.

A iniciativa faz parte de um impulso mais amplo para a “soberania da IA”, na qual os países estão incentivando o investimento em seus próprios laboratórios e data centers domésticos para reduzir a dependência do Vale do Silício.

Qual é o problema?

Existem desvantagens para a IA de código aberto, no entanto. Os especialistas alertam que, embora a tecnologia de código aberto seja uma coisa boa para a inovação, também é mais propensa à exploração cibernética. Isso porque pode ser reembalado e modificado por qualquer pessoa.

As empresas de segurança cibernética já descobriram vulnerabilidades nos modelos de IA da Deepseek. Pesquisas que a Cisco divulgou na semana passada revelou que R1 continham falhas de segurança críticas.

Usando “Técnicas algorítmicas para o jailbreak”, a equipe de pesquisa de segurança da AI da Cisco diz que recebeu R1 para fornecer respostas afirmativas a uma série de avisos prejudiciais do Harmbench popular “com uma taxa de sucesso de ataque de 100%”.

“O Deepseek R1 foi supostamente treinado com uma fração dos orçamentos que outros provedores de modelos de fronteira gastam no desenvolvimento de seus modelos. No entanto, tem um custo diferente: segurança e segurança”, escreveram os pesquisadores da Cisco, Paul Kassianik e Amin Karbasi.

O vazamento de dados também é uma preocupação. Os dados processados ​​pelo modelo R1 da Deepseek por meio de seu site ou aplicativo são enviados diretamente para a China. As empresas de tecnologia chinesas há muito são perseguidas por alegações de que Pequim usa seus sistemas para espionar entidades e indivíduos ocidentais.

“Deepseek, como outras plataformas generativas de IA, apresenta uma faca de dois gumes para empresas e indivíduos”, disse Matt Cooke, estrategista de segurança cibernética EMEA no ProofPoint. “Embora o potencial de inovação seja inegável, o risco de vazamento de dados é uma preocupação séria”.

“O Deepseek é relativamente novo e levará tempo para aprender sobre a tecnologia; no entanto, o que sabemos que está alimentando dados sensíveis da empresa ou informações pessoais nesses sistemas é como entregar os atacantes uma arma carregada”, acrescentou Cooke.

O Netmind's Rajal disse à CNBC que os modelos de IA de código aberto introduzem riscos de segurança cibernética que as empresas precisam considerar, incluindo ataques da cadeia de suprimentos de software, eventos prontos para a jailbreak e os chamados “envenenamento por dados” que tentam introduzir preconceitos ou saídas prejudiciais.

ASSISTIR: Por que o Deepseek da China está colocando a liderança da IA ​​da América em risco

Por que o Deepseek da China está colocando a liderança da IA ​​da América em risco

Source

Related Articles

Back to top button