Ao examinar o estado do panorama da inteligência artificial na América no início deste ano, Misha Laskin estava preocupado.

Laskin, um físico teórico e engenheiro de aprendizado de máquina que ajudou a construir alguns dos modelos de IA mais poderosos do Google, vê uma adoção crescente de modelos de IA “abertos” gratuitos, personalizáveis ​​e cada vez mais poderosos entre as empresas americanas de IA.

Mas a maioria destes modelos foi fabricada na China e estes sistemas foram rapidamente baseados nos seus concorrentes norte-americanos.

“Esses modelos não estavam muito atrás da fronteira. Na verdade, eles estavam surpreendentemente perto da fronteira. Os que estão chegando agora”, disse Laskin, fazendo uma pequena pausa, “bem, eles estão definitivamente perto da fronteira.”

Laskin fundou uma startup chamada Reflection AI, Recentemente avaliado em US$ 8 bilhõesPara fornecer uma alternativa americana de código aberto a esses Modelos chineses cada vez mais capazes que ganharam força no Vale do Silício.

“Estamos começando a ter vislumbres de empresas de modelo aberto que estão realmente conduzindo a fronteira da inteligência na China e, em geral, a fronteira da inteligência”, disse Laskin.

Ao longo do ano passado, um número crescente das startups de IA mais populares da América recorreram a modelos de IA chineses de código aberto que substituem cada vez mais sistemas concorrentes e por vezes caros dos EUA como base para produtos de IA americanos.

A NBC News conversou com mais de 15 fundadores de startups de IA, engenheiros de aprendizado de máquina, especialistas do setor e investidores, que disseram que os modelos das empresas americanas continuam a definir o ritmo para o progresso na fronteira das capacidades de IA, com muitos sistemas chineses se tornando mais baratos de acessar, mais personalizáveis ​​e capazes o suficiente para muitos usos durante o ano passado.

A crescente adoção pode representar um problema para a indústria de IA dos EUA. Os investidores investiram dez mil rúpias bilhão Na OpenAI e na Anthropic, as principais empresas americanas de inteligência artificial dominarão o mercado mundial de IA. Mas a utilização crescente de modelos chineses gratuitos pelas empresas americanas levanta questões sobre o quão excepcionais esses modelos são realmente – e se a procura de modelos fechados pela América pode ser totalmente equivocada.

Michael Fine, chefe de aprendizado de máquina da Exa, uma empresa de pesquisa focada em IA avaliada em US$ 700 milhões e apoiada por pilares do Vale do Silício, como Lightspeed Venture Partners e Nvidia, disse que executar modelos chineses no próprio hardware da Exa é significativamente mais rápido e mais barato do que modelos como o GPT-GPT-GPT da OpenAI usado em muitos casos.

“Muitas vezes o que acontece é que conseguimos que um recurso funcione com um modelo fechado e percebemos que é muito caro ou muito lento, e perguntamos: ‘Que alavancas precisamos ter para torná-lo mais rápido e mais barato?'”

“Isso geralmente significa substituir o modelo fechado por um modelo aberto equivalente e depois executá-lo em nossa própria infraestrutura”, disse Fine.

Modelos chineses, como o R1 da DeepSeek e o Qwen do Alibaba, são de uso gratuito e considerados de “código aberto” ou “peso aberto” porque qualquer pessoa pode baixá-los, copiá-los, modificá-los e operá-los. Eles diferem dos principais americanos Sistemas como o Claude da Anthropic ou os modelos GPT mais populares da OpenAI, que são “fechados” ou proprietários e acessados ​​por meio de data centers e pipelines controlados por grandes gigantes da tecnologia.

Ao longo dos anos, os modelos americanos de código fechado OpenAI e Anthropic superaram amplamente as alternativas abertas americanas e chinesas. Mesmo os esforços internos com bons recursos para usar modelos de código aberto têm enfrentado dificuldades: Bloomberg tentou criar uma ferramenta interna, BloombergGPTTreinado em extensas coleções de notícias e documentos financeiros usando modelos de código aberto, Modelos fechados da OpenAI apenas sobre conhecimento financeiro.

No entanto, no ano passado, empresas chinesas como a Dipsik e a Alibaba fizeram enormes avanços tecnológicos. Seus produtos de código aberto agora se aproximam ou igualam o desempenho dos principais modelos fechados americanos em muitos domínios, de acordo com métricas monitoradas pela Artificial Intelligence, uma empresa independente de benchmarking de IA.

“A lacuna está realmente diminuindo”, disse Lin Qiao, CEO da Fireworks AI e co-criador do PyTorch, uma estrutura influente para treinamento de modelos de IA, sobre a diferença de capacidades entre os modelos americanos de código fechado e os chineses de código aberto.

Source link

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui