Área de demonstração do AI Sandbox no Google I/O

Radhika Rajkumar/ZDNET

Siga ZDNET: Adicione-nos como fonte preferencial no Google.


Principais vantagens do ZDNET

  • Os muitos novos recursos de IA do Google abrangem várias interfaces.
  • Recursos discretos substituíram as atualizações genéricas do Gemini.
  • Vários pontos de contato para um único recurso podem ser confusos.

Neste ponto da corrida pela IA, a maioria dos laboratórios de IA percebeu que o verdadeiro dinheiro está no uso empresarial: grandes funções baseadas em agentes que afetam significativamente a forma como as maiores empresas se movem e trabalham. O Google é um desses laboratórios, o que poderia explicar por que muitos dos recursos de IA da empresa mais focados no consumidor, revelados no I/O na terça-feira, parecem um pouco… desanimadores.

Também: A nova ferramenta Omni AI do Google permitirá que você mesmo clone vídeos – estou intrigado (e preocupado)

Não apenas isso, mas eles são estranhamente diferentes na paisagem já multifacetada de Gêmeos. Essa I/O, em particular, foi uma oportunidade para o Google tornar a IA cotidiana atraente para os usuários, especialmente aqueles que são céticos em relação ao quanto a empresa está pressionando isso. Embora esses novos recursos ofereçam alguma conveniência, o Google os empacotou de uma forma que pode diminuir sua relevância e usabilidade.

Muitas vidas separadas

Radhika Rajkumar/ZDNET

O Google Workspace obteve alguns novos recursos de IA em E/S, sendo os dois principais o Docs Live e o Gmail Live. E sim, eles têm a mesma funcionalidade.

Assim como o Gemini Live, que permite usar sua voz para interagir com o Gemini, o Docs Live e o Gmail Live permitem consultar cada aplicativo usando sua voz.

Em uma demonstração, um Googler usou o primeiro para gerar um Documento Google em seu telefone, criado a partir de notas, apresentações e outras informações contextuais díspares que ela executou instantaneamente. Para demonstrar isso, ela fez perguntas ao Gmail como “O que está acontecendo na escola esta semana?” O Gmail Live examinou sua caixa de entrada e respondeu que precisava se preparar para um tour.

Também: Comparei como Gemini, ChatGPT e Claude podem analisar vídeos – esse modelo vence

Ambos os recursos trataram de questões de acompanhamento mais complexas sobre planejamento de conflitos e tópicos variados, aparentemente sem confundir termos relacionados como “viagem de campo” e “viagem a Detroit”. Mas na verdade essas são funcionalidades do Gemini Live aplicadas a novos aplicativos. Por que dar-lhes nomes diferentes e colocá-los em lugares específicos? Por que não apenas estender as integrações do Gemini Live?

Nenhum dos representantes do Google a quem perguntei no local conseguiu realmente responder a essa pergunta.

É uma abordagem estranha para tornar o Workspace mais acessível com IA quando o Google implementou o Gemini em quase tudo até agora. Goste ou não, é uma abordagem limpa e de construção de autoridade que oferece aos usuários um balcão único para esses benefícios sutis, mas convenientes, da IA ​​(isto é, quando funcionam). Além disso, o Gemini in Workspace já vem com Gmail, Documentos e Planilhas com uma variedade de opções – por que não mantê-los todos sob o mesmo teto?

Também: Transforme seu telefone Android em um agente com Gemini Intelligence – veja como e quando

Ao dividir funções quase idênticas em funções separadas, o Google corre o risco de confundir ou sobrecarregar a própria pessoa que precisa convencer: o cliente antigo do Google que é cético em relação à IA ou não tem certeza se ela é adequada para eles. É muito mais fácil fazer isso dizendo que o Gemini extrai informações de vários aplicativos por voz, em vez de citar uma lista de nomes de produtos independentes.

O Google não está sozinho nisso: a Microsoft adicionou o Copilot à maioria de seus produtos existentes, permitindo aos usuários navegar pelas diferenças entre o Copilot Chat, o Microsoft 365 Copilot e outros termos sobrepostos. A OpenAI arriscou confusão semelhante quando lançou o ChatGPT Apps, que é apenas uma integração do ChatGPT com outros aplicativos – não um novo produto ou plataforma de criação de aplicativos, como o nome pode sugerir.

Além disso, Docs Live e Gmail Live são oferecidos para assinantes AI Pro e Ultra que pagam US$ 20 e pelo menos US$ 100 por mês, respectivamente, e estarão disponíveis para usuários empresariais do Workspace neste verão. Não está claro se isso acabará sendo implementado para todos os usuários ou se eles se tornarão Gêmeos.

Esses são casos de uso de nicho para startups individuais, muito menos aqueles pelos quais os usuários terão que pagar. Ambos parecem ser apenas móveis, pelo menos por enquanto, e estão focados em tornar as tarefas em trânsito perfeitas.

Uma breve revisão diária

Demonstração do recurso Daily Brief no Google I/O, 19 de maio.

Radhika Rajkumar/ZDNET

O novo recurso Daily Brief é adaptado de um experimento chamado CC, anunciado no final do ano passado, e extrai informações de seu e-mail, calendário e outros aplicativos conectados para fornecer informações sobre como será seu dia. Para aqueles preocupados com reuniões alucinantes, também inclui links para onde em seu ecossistema foi retirado cada item da agenda.

Digo recurso, mas o Google chamou o Daily Brief de “novo agente”. Não quero nos enterrar na semântica, mas a menos que esteja faltando alguma coisa, esse recurso não me parece atender ao padrão de agente que o OpenClaw estabeleceu este ano.

Também: Testei ChatGPT Plus e Gemini Pro para ver qual é melhor e se vale a pena trocar

Para ser justo, o Daily Brief demonstra um raciocínio mais profundo: ainda não conseguimos testá-lo, mas em duas demos separadas ele foi além dos dias atuais para marcar as próximas cobranças para o final da semana. Também determinou que o usuário do teste iria reformar sua cozinha, forçando-o a criar uma estação de cozinha improvisada.

Mas aí o “agente” parou. Quando perguntei se o recurso poderia afetar algum desses itens, um Googler me disse que o usuário deveria simplesmente iniciar um bate-papo com o Gemini ou mudar para o Spark, o novo “agente pessoal” do Google que (novamente, de forma confusa) mora no Gemini.

Não quero parecer uma merda, mas… é isso?

Também: Como o Google redesenhou a Gemini Enterprise para a era dos agentes – aqui estão as novidades

O briefing diário é resultado do trabalho resumido do agente. Mas será o próprio texto um agente? Pela definição do Google, não tenho certeza (embora testes práticos possam revelar mais habilidades do agente). Embora os recursos do agente sejam necessários para revisar dados de aplicativos conectados, o Daily Brief tem um uso bastante restrito desses recursos.

No grande esquema das expectativas da IA, o Google também está um pouco atrasado.

“Uma das coisas pelas quais o OpenClaw é conhecido é sua capacidade de fornecer briefings diários. As pessoas também usam Claude Cowork para isso”, disse David Gewirtz, colaborador do ZDNET. “Certamente não é uma possibilidade nova no mundo da IA. As pessoas têm falado sobre briefings diários desde que os agentes começaram a se tornar utilizáveis.”

Dado esse contexto, tenho a mesma pergunta que tinha sobre Muitas Vidas: por que não colocar o Resumo Diário em Gêmeos como um recurso novo (talvez há muito esperado)?

As ferramentas de IA precisam de clareza

Os vários níveis de habilidade do Gemini já estão divididos entre interfaces, separados apenas por nomes ligeiramente diferentes. Gemini Intelligence, um conjunto de agentes para Android, lançado no início deste mês com recursos multitarefa para agentes. Aliás, isso é diferente do Gemini Personal Intelligence, que adapta as respostas às suas dúvidas com base nos dados aos quais você dá acesso.

Depois, há o Gemini in Search e o aplicativo Gemini independente.

Também: Esta poderosa configuração do Gemini tornou meus resultados de IA muito mais pessoais e precisos

Essa configuração pode tornar o que o Gemini pode fazer tão ilegível que os usuários simplesmente o ignoram. Tecnicamente falando, o Google pode separar cada uma dessas mãos de Gêmeos com base em seu desempenho em diferentes superfícies. Um desenvolvedor ou gerente de produto pode achar útil diferenciar a versão Android de um produto Gemini.

Mas do ponto de vista do marketing, talvez não precise ser tão visível para o consumidor.

Embora os laboratórios de IA estejam agora acompanhando o sucesso da Anthropic e se concentrando na empresa, o campo das ferramentas de IA para o consumidor continua aquecido e lotado. Provavelmente não ajudará se for mais difícil para os usuários manterem seus produtos em ordem.



Link da fonte