Tekoäly tarkoittaa parempaa terveydenhuoltoa
Jo antiikin Kreikassa sanonta kuului “Errare humanum est”, eli virheettömyyteen ei kukaan ihminen pysty, sillä “erehtyminen on inhimillistä”. Lääketieteelliset virheet ovat merkittävä haaste sairaaloissa (De Leval, 2013), ja tiedämme, että ne aiheuttavat vuosittain suuren määrän estettävissä olevia kuolemia (James, 2013). Haluankin nyt “ajatella ääneen”, miksi tekoälyltä usein odotetaan juuri sitä virheettömyyttä, johon ihmisetkään eivät pysty? Toisin sanoen, millaista hintaa maksamme siitä, että vaadimme asioita joissa tekoälyllä saatavat hyödyt voisivat peitota kirkkaasti mahdolliset haitat ja mitkä ovatkaan ne todelliset syyt, miksi tekoälyä ei hyödynnetä vielä nykyistä laajemmin (Ahmed, 2023, s. 1)?
“Unfortunately, new technologies take time to be embedded in healthcare and despite all the theoretical potential of AI, the uptake in healthcare has been uneven and slower than anticipated and there remain a number of barriers, both overt and covert, which have limited its incorporation.”
Inhimilliset virheet ja niiden mittakaava
Terveyskeskuksissa ja sairaaloissa inhimillisillä virheillä voi olla kohtalokkaita seurauksia. Lääkeannosvirheet, väärät diagnoosit ja viestintäkatkokset johtavat usein vakaviin seurauksiin. Esimerkiksi vuonna 2013 julkaistun tutkimuksen mukaan sairaaloiden estettävissä oleviin haittoihin liittyy yli 400 000 enneaikaista kuolemaa vuosittain Yhdysvalloissa. (James, 2013)
Inhimilliset tekijät, kuten mm, stressi ja väsymys, selittävät virheiden määrää, jos toki myös kommunikaatiolla on osansa (Sexton et al., 2000). Lääkärit ja hoitohenkilökunta joutuvat tekemään jatkuvasti kriittisiä päätöksiä suuressa paineessa ja nopeassa tahdissa. Tässä kontekstissa tiedetään jo, että tekoäly voisi toimia tehokkaana ratkaisuna vähentämään inhimillisiä virheitä (Alowais et al., 2023).
Tekoälyn mahdollisuudet ja haasteet
Tekoälyn käyttö terveydenhuollossa on jo mahdollista monilla alueilla, kuten diagnostiikassa, hoitopäätöksissä ja laboratoriotesteissä. Alowais et al. (2023) toteavat, että tekoäly voi parantaa tarkkuutta, vähentää kustannuksia ja säästää aikaa, samalla kun se minimoi inhimillisiä virheitä.
Esimerkiksi Ruotsissa tehdyssä tutkimuksessa (Dembrower et al., 2023) tekoälyn käyttäminen rintasyövän seulonnassa yhden radiologin rinnalla lisäsi syöpien tunnistamista 4 % verrattuna kahden radiologin arviointiin. Tutkimuksessa todettiin, että tekoälyn itsenäisesti tekemä arviointi oli parempi kuin kahden radiologin suorittama arviointi. Tämä tutkimus tehtiin Capio Sankt Göran -sairaalassa, jossa käytettiin yhdistelmästrategiaa tekoälyn ja radiologien välillä oikeassa seulontaprosessissa.
Toinen, The New York Timesin raportoima, tuore tutkimus (n=50) osoitti, että GPT-4 algoritmi oli lääkäreitä parempi diagnosoimaan sairauksia. Oireiston perusteella sen osumatarkkuus oli huimat 90 %, kun lääkärit ilman tekoälyä pääsivät vain 74 % osumatarkkuuteen diagnooseissa, ja tekoälyn avulla pari prosenttia korkeammalle (76 %). Tätä tilastollisesti varsin pientä parannusta selittää ilmeisesti se, että tekoälyä käyttäneet lääkärit eivät keskimäärin uskoneet sen vastauksia, vaan pitivät kiinni omista ajatuksistaan tai osanneet käyttää tekoälyä kunnolla.
“They didn’t listen to A.I. when A.I. told them things they didn’t agree with,” Dr. Rodman said.
That makes sense, said Laura Zwaan, who studies clinical reasoning and diagnostic error at Erasmus Medical Center in Rotterdam and was not involved in the study.
“People generally are overconfident when they think they are right,” she said.
But there was another issue: Many of the doctors did not know how to use a chatbot to its fullest extent.
Tekoälyä kohtaan kohdistuu kuitenkin usein vaatimuksia virheettömyydestä. Toisin kuin ihminen, tekoälylle ei sallita virheitä, koska se toimii “kylmänä” ja loogisena teknologiana, johon ei liity inhimillistä epävarmuutta. Tekoälyn tekemä virhe voidaan luokitella järjestelmävirheeksi, ei yksittäiseksi inhimilliseksi arviointivirheeksi, mikä luo painetta sen virheettömyyteen. Toki AI-järjestelmien osalta testaus onkin tehtävä huolellisesti, sillä ns. systeeminen virhe voi aiheuttaa laaja-alaista vahinkoa ilman ihmisen valvontaa ja vastuuta.
On hyvä muistaa, että nykyisten ns. kapeiden tekoälyjen (Narrow AI) tarkoituksena on toimia ihmisen työkaluna, joka auttaa vähentämään virheitä ja parantaa potilasturvallisuutta. Ihmiset ja tekoäly voivat toimia synergisesti: ihmiset tarjoavat asiayhteyden ymmärrystä ja harkintaa, kun taas tekoäly pystyy analysoimaan suuria tietomääriä nopeasti ja tarkasti.
AI-avusteisen lääketieteen tulevaisuus
Tekoälyn käyttöön terveydenhuollossa liittyy korkeat odotukset ja vaatimukset virheettömyydestä, osittain siksi, että teknologian ei haluta tekevän inhimillisiä virheitä. Kuitenkin varsinkin generatiiviset mallit ovat likimääräisyysominaisuuksiensa takia enemmän inhimillisiä kuin ehkä haluamme myöntää. Samalla on kuitenkin tärkeää muistaa, että tekoälyn tehokkain mahdollinen käyttö perustuu sen yhteistyöhön ihmisen kanssa, mutta ilman motivoitunutta ihmistä hyödyt jäävät saamatta (Ahmed, 2023, s. 9).
“Willingness/engagement: Physician ‘buy-in’ and engagement remains a necessary and uniquely challenging barrier for AI and was discussed in 13 papers. Some physicians do not engage fully with a new AI process and this lack of engagement may produce clinical problems and ignorance of or reluctance to understand AI could lead to poor patient outcomes.”
Tekoäly monissa eri muodoissaan ei ole vielä työkalu, joka voisi vielä korvata ihmisen harkinnan. Sen sijaan se toimii tehostajana, resurssien vapauttajana oleelliseen ja perusterveydenhuollon lähteenä myös niille, joilla ei ole pääsyä tai varaa kalliisiin hoitopolkuihin. Tällainen lähestymistapa voi parantaa ihmisten elämän ja hoidon laatua nopeasti, jopa globaalisti, vähentäen virheitä ja tukien terveydenhuollon asiantuntijoiden työtä – jo tutkitusti (Alowais et al., 2023) – entistä parempien hoitotulosten saavuttamiseksi.
Oma kiinnostava lukunsa ovat uusimmat erikoistekoälyt, kuten Googlen avoimen lähdekoodin AlphaFold 3, jonka kehittänyt tiimi voitti aiheesta juuri kemian Nobel-palkinnon. Se kykenee selvittämään proteiinirakenteita ennennäkemättömällä tehokkuudella, ovat jo aloittaneet uuden luvun lääketieteen historiassa. Yhdessä inhimillinen ja koneellinen päätöksenteko voivat kohdata ne terveydenhuollon haasteet, joita yksinään kumpikaan ei pystyisi voittamaan. * Myös tekoäly yhdistettynä robotiikkaan tulee olemaan ihan valtava mullistus elämänlaadun ja -mitan saralla globaalistikin.
Yhteenvetona kannustan lukijoita pohtimaan, että missä tilanteissa ja millainen virhemarginaali kannattaa hyväksyä saavutettavien hyötyjen takia.
HUOM! Tämän tekstin muotoilussa ja lähteiden läpikäynnissä on käytetty tekoälyjä. Lisäksi blogin otsakekuva on tehty tekoälyllä.
Lähteet
- Ahmed, M. I., Spooner, B., Isherwood, J., Lane, M., Orrock, E., & Dennison, A. (2023). A Systematic Review of the Barriers to the Implementation of Artificial Intelligence in Healthcare. Cureus. https://doi.org/10.7759/cureus.46454
- Alowais, S. A., Alghamdi, S. S., Alsuhebany, N., Alqahtani, T., Alshaya, A. I., Almohareb, S. N., Aldairem, A., Alrashed, M., Bin Saleh, K., Badreldin, H. A., Al Yami, M. S., Al Harbi, S., & Albekairy, A. M. (2023). Revolutionizing healthcare: The role of artificial intelligence in clinical practice. Journal of Healthcare, 10(3), 1-20. https://doi.org/10.1186/s12967-020-02658-5
- De Leval, M. R. (2013). “Errare humanum est, perseverare autem diabolicum” – Lucius Annaeus Seneca, 4 bc to 45 ad. In Journal of Thoracic and Cardiovascular Surgery (Vol. 145, Issue 6, pp. 1475–1476). Mosby Inc. https://doi.org/10.1016/j.jtcvs.2013.03.010
- Dembrower, K., Crippa, A., Colón, E., Eklund, M., Strand, F., & the ScreenTrustCAD Trial Consortium. (2023). Artificial intelligence for breast cancer detection in screening mammography in Sweden: A prospective, population-based, paired-reader, non-inferiority study. Lancet Digital Health, 5(9), e703–e711. https://doi.org/10.1016/S2589-7500(23)00153-X
- Google AlphaFold 3. https://github.com/google-deepmind/alphafold3
- James, J. T. (2013). A New, Evidence-based Estimate of Patient Harms Associated with Hospital Care. https://pubmed.ncbi.nlm.nih.gov/23860193/
- John Hopkins yliopiston tutkijat kehittivät tekoälyrobotin, joka oppii lääkäreiltä kuinka suorittaa leikkaus: https://hub.jhu.edu/2024/11/11/surgery-robots-trained-with-videos/
- The New York Times, “A.I. Chatbots Defeated Doctors at Diagnosing Illness”, https://www.nytimes.com/2024/11/17/health/chatgpt-ai-doctors-diagnosis.html
Blogi julkaistu 14.11.2024 ja päivitetty: 19.11.2024