Ilo Romero, da WVU Medicine, detalha como o preço de sete dígitos supera a IA limite compatível com HIPAA e por que a estratégia agnóstica do modelo deixa suas possibilidades abertas. Assista abaixo ou no YouTube.


Ilo Romero, vice-presidente/diretor associado de tecnologia da informação, WVU Medicine

Os fornecedores de Frontier AI agora são considerados prontos para a HIPAA para cuidados de saúde. No entanto, a versão compatível deste acesso começa com um compromisso anual de sete dígitos que custa à maioria dos sistemas de saúde. Essa lacuna ocorreu com Ilo Romero, CHCIO, vice-presidente e CIO associado da Medicina WVU. Ele contratou vários grandes laboratórios de inteligência artificial e saiu convencido de que o mercado escolhe quem aceitará a tecnologia com responsabilidade. Ele compartilhou a história em um episódio recente do HealthsystemCIO Show.

No início de janeiro, os principais laboratórios fronteiriços emitiram anúncios sobre cuidados de saúde com poucos dias de diferença, cada um apresentando a mesma mensagem de preparação para a HIPAA. A equipe de Romero tinha um motivo real para se envolver porque a WVU Medicine já administra um programa maduro de IA, governança e um conjunto profundo de casos de uso. Então eles vieram como um parceiro disposto, na esperança de desbloquear o trabalho que as restrições da HIPAA haviam impedido.

O que preocupava Romero era a estrutura de acesso, e não o preço em si. Ele sabe que esses modelos custam muito para construir e operar. Com um compromisso, o acesso compatível exige um compromisso de um milhão de dólares ou mais, cobrado antecipadamente, independentemente do uso do token. Uma proposta de parceria de codesenvolvimento elevou ainda mais o padrão, enquadrada em um caso de uso estimado em US$ 100 milhões.

“A conformidade é o chão, não o teto”, disse Romero. “Na área da saúde, o BAA e um ambiente compatível com HIPAA são o preço da admissão.” Abaixo dessa linha de um milhão de dólares estava apenas o caminho de autoatendimento que a organização já tinha, que não podia afetar o PHI e impedia qualquer caso de uso clínico sério.

Um modelo de preços que ignora como a saúde adota a IA

A área de saúde raramente começa com um caso de uso massivo com ROI puro. Em vez disso, avança através de muitos projetos gerenciados, cada um com seu próprio fluxo de trabalho, proprietários, orçamento e perfil de risco. Romero vê o ponto de entrada de sete dígitos como uma estrutura que ignora esta realidade. A única chave da porta compatível custa sete dígitos e permanece trancada para todas as outras.

A economia o confunde ainda mais. Depois que um provedor estabelece um ambiente HIPAA, um processo BAA, uma infraestrutura de segurança e auditoria, o investimento principal já foi feito. Cada novo cliente acrescenta alguns custos adicionais e responsabilidades reais, reconheceu ele, mas nada perto do limite de sete dígitos. Nesse nível, disse ele, o mercado não consegue mais precificar. Ele decide quem usa a tecnologia de forma responsável. Os fornecedores de IA não demonstraram flexibilidade, citando recursos limitados. A WVU Medicine poderia ter liberado o número de qualquer maneira, mas Romero recusou por princípio.

Por que a base orientada a modelos compensa

A WVU Medicine está em uma posição confortável devido a uma decisão tomada há seis anos. Romero construiu o departamento de IA do zero e tratou a IA como a infraestrutura principal. A equipe hospeda seus próprios servidores, executa modelos de código aberto e armazena PHI em um ambiente independente onde nenhum dado sai do data center. Essa cautela inicial sobre a nuvem envelheceu bem.

Hoje, qualquer funcionário pode acessar uma interface segura no estilo ChatGPT e criar fluxos de trabalho com recuperação aprimorada em seus próprios documentos. O sistema também oferece ferramentas customizadas para revisão de contratos e atas de reuniões, tudo sem cobrança de licença por posto de trabalho. Uma equipe interna desenvolvida por Romero fabrica essas ferramentas juntamente com blocos reutilizáveis ​​que reduzem o custo marginal de cada novo fluxo de trabalho.

O retorno é mensurável. O modelo de previsão de não comparecimento funcionou continuamente em pacientes ambulatoriais e reduziu as taxas de não comparecimento em 23%, capturando aproximadamente US$ 3,5 milhões em receitas que de outra forma seriam perdidas. Um bot de detecção de cobertura funciona com cerca de 10 portais de pagadores e economiza milhões a mais a cada ano. A execução desses modelos em GPUs nativas custa cerca de um quarto do custo da nuvem.

Romero está aberto sobre as limitações. Os modelos de código aberto estão cerca de uma geração atrás do ponto de corte, o que é bom para resumo, classificação e bate-papo interno. No entanto, os fluxos de trabalho dos agentes alteram a matemática, porque o raciocínio em vários estágios é onde a lacuna separa um fluxo de trabalho que é concluído de outro que é interrompido. Enquanto isso, os preços das GPUs dispararam no ano passado, portanto, adicionar capacidade interna tornou-se um custo proibitivo.

Essa pressão está empurrando algumas cargas de trabalho para endpoints em nuvem, e Romero diz que a capacidade de lidar com a mudança mostra que sua estratégia está funcionando conforme planejado. Desde o primeiro dia, a plataforma padroniza cada chamada de modelo, para que o aplicativo nunca precise saber se o endpoint reside no data center, em um laboratório de borda ou na nuvem. A equipe segmenta cada carga de trabalho por custo, latência, sensibilidade e recursos. A verdadeira vantagem, disse ele, é ter a camada de integração acima do modelo. Como a WVU Medicine já opera como uma loja da Microsoft com um importante parceiro de nuvem, o fracasso do acordo direto com os players fronteiriços mal é registrado.

Crie, compre e permaneça fiel ao fluxo de trabalho

Romero aplica a mesma lente primeiro para construir ou comprar opções de compra. As ferramentas nativas épicas vencem quando estão profundamente integradas e maduras o suficiente para o trabalho. O melhor da categoria vence quando suas capacidades são significativamente avançadas, como acontecia com a documentação ambiental antes do amadurecimento da opção nativa da Epic. Como resultado, a equipe arquiteta as possibilidades, sabendo que o que há de melhor na raça hoje pode se tornar natural amanhã.

A construção também se tornou muito mais acessível, já que a prototipagem agora leva horas em vez de semanas. A equipe de Romero construiu 68 soluções em uma dúzia de domínios onde a economia justifica a propriedade. Um gerente que antes passava horas enviando por fax recomendações de 30 a 40 páginas criou um protótipo de fluxo de trabalho que ingere cada documento e extrai os campos EHR obrigatórios, que a equipe posteriormente automatiza de ponta a ponta.

Leve embora

  • Aceite a conformidade com a HIPAA como o preço de admissão para qualquer fornecedor de IA que afirme servir serviços de saúde e veja até que ponto eles realmente superaram essa barreira.
  • Observe a diferença entre o autoatendimento inadequado e um compromisso empresarial de sete dígitos que pode bloquear organizações que não têm escala.
  • Crie uma plataforma agnóstica que padronize cada chamada de endpoint para que carregue a rota por custo, latência, sensibilidade e recursos.
  • Domine a camada de integração acima do modelo, porque o modelo que você escolher hoje pode não ser o que você escolher daqui a 18 meses.
  • Mantenha a inteligência de ponta para raciocínio de agente de alto risco e conte com modelos hospedados e de código aberto para tarefas rotineiras.
  • Invista em uma força de trabalho com conhecimento de IA e em dados e governança padronizados para que uma boa ideia possa se espalhar por toda a empresa.

Para Romero, a frustração dos seus encontros fronteiriços é compensada pela sua crença de que o acesso ao modelo não será a principal característica de quem ganha e quem perde com a IA. “As organizações que vencerem com a IA nos próximos cinco anos não serão aquelas com os melhores modelos”, disse ele. “Eles serão a força de trabalho mais alfabetizada em IA.”


Artigos relacionados

Link da fonte