Desde 2020, a inteligência artificial (IA) é um dos temas mais comentados no mundo. Em saúde, aplicar tecnologias a base de IA abriu um mundo de possibilidades, principalmente no que se refere a formas de reduzir custos operacionais e obter maior assertividade em tratamentos.
No entanto, o entusiasmo nem sempre gera resultados positivos na prática. Nomear casos específicos de fracasso da IA na saúde pode ser difícil, já que diversos fatores influenciam o desfecho. Mesmo assim, um exemplo clássico é o Watson Health da IBM. Colocado à venda em 2021, pode-se dizer que a tecnologia falhou principalmente devido à tentativa de aplicá-lo em contextos amplos demais – ou seja, em diversas instituições, cada qual com formas diferentes de operar e perfis de público variados.
Apesar disso, o futuro da IA na Saúde continua demonstrando ser promissor. Para entender o momento atual dessa tecnologia, vale considerar alguns dados recentes:
- Em 2023, o Future Health Index, relatório que levanta perspectivas sobre o futuro da saúde ao redor do mundo, indicou que 83% dos líderes entrevistados planejam investir em IA nos próximos três anos;
- Já uma pesquisa da ANAHP (Associação Nacional de Hospitais Privados), realizada no mesmo ano em parceria com a ABSS (Associação Brasileira de Startups de Saúde), mostra que 62,5% dos hospitais privados já utilizam alguma tecnologia de inteligência artificial. Além disso, a pesquisa também indicou que os investimentos nesse tipo de recurso devem aumentar em até 12% neste ano;
- Estima-se que o mercado de IA em saúde apresente uma taxa de crescimento anual de 36,4% de 2024 até 2030, segundo relatório da Grand View Research.
Mas afinal, o quão maduras e seguras são essas tecnologias hoje em dia? Quais os caminhos mais claros para o fracasso ou sucesso de uma tecnologia?
A IA na saúde em 2024
Definir o quão madura um tipo de tecnologia está pode ser um desafio. No entanto, para estipular a resposta dessa questão é possível recorrer às segmentações de aplicação da IA.
“De modo geral, não estamos em uma fase inicial. A inteligência artificial existe há mais de 50 anos, mas o nível de maturidade dessas tecnologias depende muito do problema que você está lidando. Não existe uma inteligência artificial que vá resolver todos os problemas”, explica Daniella Castro, pesquisadora, co-fundadora e CTO da Huna, startup que desenvolve soluções para otimizar o diagnóstico de câncer e doenças crônicas.
Considerando um cenário mais amplo, as aplicações de IA no mercado de marketing e redes sociais, por exemplo, “já apresentam muita maturidade”, afirma a especialista. No entanto, “na Saúde ainda há um bom caminho a ser percorrido”, diz Daniella.
Em saúde, a especialista indica que as principais aplicações das tecnologias de inteligência artificial têm sido em soluções para gestão hospitalar e assistência clínica. Nesse sentido, o médico e diretor de Inovação Aplicada e Inteligência Artificial da Dasa, Felipe Kitamura, diz que, em saúde, a IA ainda está na ‘infância”.
Isso porque “o que é tecnologicamente possível já é muito discrepante do que o que a gente encontra na realidade. Temos visto várias implementações práticas de Inteligência Artificial ao longo desses últimos anos, mas mesmo a gente tendo esse avanço e vários usos práticos, ainda está muito longe do que é possível ser feito”, explica Kitamura.
Mesmo assim, já é possível pensar em elementos que podem influenciar o sucesso ou fracasso de uma tecnologia. Para isso, devemos considerar a forma na qual a tecnologia foi construída, seu propósito e seu contexto. “Devido à característica de cada negócio, pode ser mais ou menos difícil você conseguir provar o valor de uma determinada solução”, afirma Felipe.
Fracassos e Gargalos da IA em Saúde
Em 2021, o Watson Health da IBM foi colocado à venda e foi uma das primeiras tecnologias a ser vista como um fracasso pelo mercado. Os motivos que levaram a isso foram vários, mas o principal deles foi a ambição precoce de querer realizar diversas tarefas diferentes, atendendo muitos públicos diferentes.
Outros elementos que também contribuem para que uma tecnologia de IA falhe são:
- Coleta de dados de má qualidade;
- Dados gerados com vieses;
- Tratamento de dados inadequado;
- Tecnologia de alto custo;
- Estabilidade do contexto em que será aplicada;
- Se a tecnologia foi criada para solucionar um problema, ou se ela é uma solução em busca de um;
- Falta de capacitação dos profissionais para utilizar a tecnologia.
Porém, há ainda outras quatro questões técnicas que influenciam diretamente o percurso de uma tecnologia de IA. Segundo Kitamura, são elas:
1. Capacidade de generalização
Para desenvolver um algoritmo, é necessário utilizar como base um banco de dados. E é provável que os resultados sejam positivos, mas por quanto tempo? Em quais contextos o desempenho ideal vai persistir?
“Se ele usar dados de outras instituições não existe garantia nenhuma de que ele vai funcionar. Quando o modelo funciona em dados de outra instituição, o algoritmo generalizou. Quando ele não funciona, dizemos que ele não generalizou. E nem sempre isso é binário. A generalização pode ser parcial. Por exemplo, treinando os dados da minha instituição, eu consegui um algoritmo com 90% de acurácia, mas quando levamos para outra instituição, ele pode manter os 90%, pode cair para 88% ou ainda menos”, exemplifica Felipe.
2. Data drift e a questão da acurácia
Acurácia é a palavra utilizada para descrever o encontro da “exatidão” com a “precisão”. Enquanto exatidão refere-se ao quão próximo um conjunto de medições está de um valor real, a precisão trata da proximidade das medições entre si.
Nesse sentido, a acurácia de uma tecnologia de IA em saúde pode ser influenciada por diferentes fatores. Entre eles: mudanças no perfil do público atendido, troca de equipamentos nos exames – por exemplo, trocar a marca de um tomógrafo e as imagens saírem com qualidade diferente da máquina anterior – entre outros.
Portanto, mesmo que a acurácia seja boa inicialmente, ao colocar para funcionar todo dia ele pode perder acurácia ao longo do tempo e “não porque o algoritmo mudou, mas porque os dados mudam com o tempo em todas as instituições, é natural”. Em inglês, essa situação é chamada de “data drift”, representando as mudanças na base de dados de um algoritmo.
3. Fairness
“Fairness” é a palavra em inglês que significa Justiça. Dentro do mercado de tecnologias de saúde, esse conceito refere-se ao respeito e transparência com os pacientes.
Isso significa que, se uma tecnologia não foi treinada de forma adequada para ser utilizada com um público específico, ela não deve ser usada com eles. Por exemplo, às vezes um algoritmo é estruturado com dados de adultos, mas não de crianças. Portanto, a ferramenta não pode ser aplicada em crianças, porque possui viés e pode induzir ao erro. Ou seja, o mesmo vale para algumas doenças, etnias e perfis demográficos.
“Eu preciso ser justo com os pacientes. No mundo ideal, os modelos de algoritmo não teriam vieses e funcionaria perfeitamente para todo mundo, mas a gente sabe que no mundo real isso nem sempre acontece. E quando isso não acontecer, é necessário ser transparente: eu sabia que o meu modelo não funciona para criança, então não posso usar ele para criança. Só usarei em adulto, porque eu sei que se eu for usar em criança vou estar prejudicando-as, porque ele vai errar muito mais com esse público”, exemplifica Kitamura.
4. A relação entre confiança e desfecho clínico
Por fim, o quanto um profissional confia na inteligência artificial é essencial para que tudo ocorra corretamente. No entanto, não se trata de confiar cegamente, é necessário ter equilíbrio.
Conforme explica Kitamura, “o fato de um algoritmo funcionar super bem e acertar muito não significa que, quando eu colocar ele para funcionar no hospital ou na clínica, o médico vai passar a acertar mais só pelo fato dele ter o algoritmo disponível”. Isso porque, dois cenários perigosos podem acontecer.
O primeiro é o caso de excesso de confiança. “Se o médico passar a confiar cegamente no algoritmo e não na opinião dele próprio, em última análise a acurácia final que o paciente vai ter vai ser a do algoritmo, porque ele está simplesmente copiando e colando a resposta do algoritmo”, exemplifica o médico.
Por outro lado, a desconfiança em excesso também pode gerar danos. Por exemplo, em casos no qual o médico sente receio em relação à tecnologia e não quer usá-la, o desfecho será baseado apenas na acurácia do médico. Nesse caso, não há como saber se o algoritmo poderia ter acertado a mais ou não.
“A melhor forma de usar o algoritmo é o médico ter um julgamento próprio baseado no estudo que ele teve. E aí o médico precisa ser um bom médico, tem que conhecer bem para saber os casos em que o algoritmo nitidamente está errado. Se ele não confia e despreza o resultado do algoritmo, confia na opinião própria. Eventualmente vai acontecer do médico ter feito um julgamento errado, por cansaço, fadiga ou qualquer outro motivo. E aí, quando o algoritmo apresenta um resultado discrepante do que ele pensou, é uma oportunidade para ele repensar e rever o caso, assim ele consegue melhorar a acurácia dele. Então esse é outro grande desafio da interação humano-e-máquina. Como garantir que o médico sabe fazer isso? Que ele irá de fato saber usar a plataforma?” completou Felipe Kitamura.
Cases de sucesso
Por outro lado, as inovações mais nichadas passam por um bom momento. No Brasil, a Sociedade Brasileira de Informática em Saúde (SBIS) é uma das organizações que ajudam a pensar no que funciona ou não. Segundo Grace Sasso, vice-presidente da SBIS, “o que está dando certo nesse momento é principalmente a medicina de precisão e preditiva”, conta a especialista. “Outro ponto é a otimização da eficiência e governança dos recursos. Quanto mais você utilizar, melhor serão as operações, seja nas áreas institucionais, nas áreas hospitalares, na área da atenção básica em saúde ou nas clínicas”, completa Grace.
Nesse sentido, é possível basear-se em dois cases de sucesso que ocorreram na Dasa.
1. Algoritmo para acelerar ressonância magnética
Em um de seus projetos de inteligência artificial, a Dasa aplicou em 80 máquinas um algoritmo que acelerou o tempo que se leva para gerar as imagens do exame de ressonância magnética. A imagem acaba saindo com um pouco de ruído, mas o algoritmo reconstitui até recuperar a qualidade.
Os resultados finais dessa aplicação foram: os pacientes agora passam menos tempo no desconforto da máquina e foi ampliada a quantidade de exames feitos por dia, o que é benéfico para os pacientes e para as empresas envolvidas. “Isso é ótimo para o setor de saúde como um todo porque o prestador consegue reduzir o custo e consegue fazer mais exames sem aumentar os gastos”, afirma Felipe.
Outro ponto positivo é que, ao otimizar os equipamentos já existentes, a ausência de aumento de gastos diminui a necessidade de repassar custos para os pacientes.
2. Tecnologia para ampliar diagnósticos
Outro projeto que vai bem na Dasa é uma tecnologia desenvolvida para ajudar na detecção de doenças de forma mais precoce possível.
“Às vezes o paciente vai fazer um exame e não faz o retorno da consulta. Pode ser porque a dor que ele sentia melhorou, mas existe um percentual relevante de casos em que encontramos no mesmo exame algo que não estava sendo suspeitado. Por exemplo, a pessoa teve uma dor de barriga e foi fazer uma tomografia de abdômen. Em relação à dor de barriga mesmo, ela não tinha nada. Só que por acaso descobrimos um tumor no fígado. Isso acontece com uma certa frequência e imagina se essa pessoa não vai buscar o exame? Às vezes ela tinha um tumor que era curável e seis meses depois não é curável mais”, conta Felipe Kitamura.
Assim nasceu o modelo de processamento de linguagem natural da Dasa, que hoje lê mais de 8 mil laudos diários e sem tirar o radiologista da função dele.
“O radiologista continua lá, organizando da mesma forma. Ele olha a imagem, escreve o laudo e libera o resultado. Quando o laudo fica pronto esses algoritmos leem todos esses laudos e quando eles identificam alguma doença que precisa de um próximo passo, seja uma biópsia ou algum outro exame, o algoritmo detecta esses casos e então o médico do exame liga para os médicos dos pacientes comunicando esses achados”, explica Kitamura.
A decisão de dar um próximo passo na investigação acaba sendo do médico e seu paciente. Mesmo assim, a Dasa já conseguiu demonstrar que essa tecnologia reduz de 17 para 7 dias o tempo do paciente iniciar a etapa seguinte. Além disso, essa medida gera um bom retorno financeiro, já que o tratamento tardio costuma ser mais caro para o sistema de saúde.
O futuro
Para terminar, a especialista em IA e vice-presidente da SBIS (Sociedade Brasileira de Informática em Saúde), Grace Sasso, diz que vê como tendência para 2024 a ampliação de: tecnologias persuasivas, modelos que ajudam a otimizar a precisão médica e ferramentas de predição.
Para o mercado, ela reforça que um dos desafios a encarar daqui em diante é em relação à acessibilidade e equidade em saúde.
“Precisamos formar as pessoas para melhorar o desenvolvimento das tecnologias e ao mesmo tempo olhar mais para a opinião daqueles que fazem uso das informações. Vemos muitos aplicativos onde se registra informações, mas você não sabe para onde vão aqueles dados, não tem uma devolutiva deles, não há segurança de armazenamento. Por exemplo, onde ficam guardados esses dados? Quem está utilizando? Por que estão utilizando? Precisamos ter cada vez mais cuidado com esses aspectos. Nós estamos estamos indo numa linha da ‘super inteligência’, mas a sociedade não está preparada para isso. O humano precisa ser preservado, as pessoas precisam ser ouvidas e então nós temos uma dicotomia e penso que não podemos voltar atrás”, conclui Grace Sasso.