Os dados de saúde estão simplesmente confusos. Essa é a maneira mais simples de colocar isso. Ele não reside em um só lugar, não segue um formato e a maioria dos sistemas de onde vem não foram desenvolvidos para funcionarem juntos.
Muitas equipes ainda abordam isso como qualquer outro problema de dados. Eles criam pipelines, conectam fontes como EHRs ou sistemas de sinistros e fazem as coisas andarem. E para ser justo, essa parte geralmente funciona. Os dados estão se movendo, os painéis estão sendo construídos, as coisas parecem estar a caminho.
Os problemas aparecem mais tarde. Geralmente, quando alguém começa a fazer perguntas básicas, como por que dois relatórios não correspondem ou como o número foi calculado. Então você percebe que ninguém tem uma resposta clara. Não é porque as pessoas não são capazes. Isso ocorre porque, uma vez que os dados começam a se mover entre vários sistemas, fica difícil rastreá-los, a menos que você tenha sido muito intencional desde o início. A maioria das equipes não está, pelo menos não no começo.
Obtenha visibilidade sobre como os dados de saúde se movem
A saúde torna isso mais difícil porque os dados estão sempre em movimento. Existem muitos pontos de contato entre fornecedores, laboratórios, seguradoras e sistemas internos. Adicione pipelines distribuídos e você perderá visibilidade muito rapidamente.
As pessoas falam sobre proveniência, trilhas de auditoria, tudo isso. É importante, mas na realidade é muitas vezes adiado para fases posteriores. A essa altura, tudo fica complicado e mais difícil de desvendar.
O controle de acesso é outro que parece fácil, mas raramente é. Nem todo mundo precisa ver tudo, mas entender quem precisa ver o que exige esforço. Quando isso não está claro, as pessoas ficam bloqueadas ou contornam o sistema. Ambos acontecem mais do que você esperaria.
As definições são onde as coisas silenciosamente dão errado. O mesmo campo pode significar coisas ligeiramente diferentes dependendo do sistema de origem. Se isso não estiver claramente documentado, você acabará comparando coisas que parecem iguais, mas não são.
Já vi isso em um projeto em que vários pipelines alimentam os relatórios. Do lado de fora, tudo parecia bem. Os dados fluíam, os painéis estavam ativos, sem erros óbvios.
Mas assim que começamos a investigar, ficou claro que ninguém entendia totalmente como os dados eram estruturados. Tivemos que desenhá-lo nós mesmos para lidar com isso. E quando o fizemos, encontramos inconsistências em todos os lugares. Os mesmos campos, significados diferentes, resultando na exibição de métricas incorretas nos painéis que as pessoas realmente usam.
Nada quebrou. Isso tornou tudo difícil. Estava simplesmente errado de maneiras que não eram óbvias.
Corrigimos isso alinhando as definições e adicionando verificações de validação antes que os dados chegassem ao relatório. Não foi uma solução complicada, mas deveria ter sido feita muito antes.
Trabalhando dentro dos regulamentos de saúde
Muitas pessoas pensam que as regulamentações são a parte mais difícil dos sistemas de dados de saúde. Eles não são. A parte mais difícil eu acho que é a disciplina. Você pode ter todas as regras de conformidade em vigor, mas se seus pipelines não estiverem bem estruturados, essas regras não ajudarão muito.
Agora também há mais IA sendo incorporada a esses sistemas. Isso adiciona outra camada de risco. Se os dados subjacentes não forem sólidos, os modelos simplesmente levam estes problemas adiante. Às vezes, eles os tornam mais difíceis de detectar.
Já vi problemas semelhantes em outros setores. Nos sistemas financeiros, construímos monitoramento que pode detectar problemas em tempo real em diferentes partes do pipeline. Isso ajudou muito, principalmente porque finalmente tivemos visibilidade do que realmente estava acontecendo. Este é realmente o principal problema na maioria dessas configurações. Falta de visibilidade. Pequenos problemas passam despercebidos até começarem a afetar os resultados.
Onde os sistemas de dados de saúde tendem a ter dificuldades
Os sistemas de saúde enfrentam maiores dificuldades quando a gestão é tratada como algo a tratar mais tarde. As equipes se concentram na execução de pipelines e a estrutura se torna uma reflexão tardia. Quando eles voltam para ele, as coisas estão complicadas.
Os dados de diferentes sistemas são mesclados sem corresponder totalmente à forma como foram definidos. Com o tempo, essas pequenas inconsistências se transformam em problemas maiores.
As equipes que fazem isso bem não usam necessariamente ferramentas diferentes. Eles apenas gastam mais tempo antecipadamente para garantir que as coisas estejam claras. Eles documentam, padronizam e monitoram antecipadamente, em vez de reagir mais tarde.
Mantenha a análise sem perder o controle
Há muita pressão neste momento para que as equipes de saúde façam mais com seus dados. Melhorar os resultados, reduzir custos e apoiar um trabalho mais amplo de saúde pública, tudo depende da capacidade de realmente utilizar os dados de uma forma significativa. Os sistemas distribuídos tornam isso possível. Você pode conectar conjuntos de dados diferentes, realizar análises em larga escala e começar a obter insights que não estavam disponíveis antes. Esta parte é emocionante e a maioria das equipes se concentra nela.
A parte mais difícil é garantir que o sistema por trás de tudo isso seja confiável. Se os dados não forem consistentes ou as pessoas não acreditarem de onde eles vêm, a análise não se sustenta. Pode parecer certo, mas isso não significa que seja. O que tenho visto funcionar é quando as equipes param de tratar o gerenciamento e a análise como duas coisas distintas. Em vez de construir primeiro pipelines e depois se preocupar com o controle, eles projetam os dois juntos. Não precisa ser muito complicado, apenas claro o suficiente para que as pessoas entendam os dados e como eles estão sendo usados.
Isso requer mais esforço inicial. Não há como contornar isso. Mas com o tempo, estes sistemas tornam-se mais robustos e fáceis de operar. Você gasta menos tempo solucionando problemas e mais tempo usando os dados.
Isto não é exclusivo dos cuidados de saúde, mas é mais pronunciado aqui porque os riscos são maiores. Quando os dados estão vinculados a decisões reais, você percebe rapidamente se algo está errado. Não é um trabalho emocionante, mas torna todo o resto mais fácil. E na área da saúde, onde os dados são realmente importantes, essa compensação vale a pena.
Foto: Liana Nagieva, Getty Images
AvaneerAniket Abhishek Soni é engenheiro de dados sênior e pesquisador com mais de seis anos de experiência projetando e liderando pipelines de dados em grande escala, plataformas de nuvem e soluções de IA em setores altamente regulamentados, incluindo saúde, serviços financeiros e pesquisa climática. Seu trabalho se concentra em tornar os sistemas de dados corporativos mais confiáveis, gerenciáveis e de alto desempenho para suportar análises avançadas e inteligência artificial aplicada em ambientes do mundo real.
Esta postagem aparece em Influenciadores da MedCity programa. Qualquer pessoa pode publicar sua perspectiva sobre inovação em negócios e saúde no MedCity News por meio de Influenciadores do MedCity. Clique aqui para saber como.










