Od doby, kdy byl v roce 2007 založen systém IBM Watson, se lidé neustále snaží vyvíjet lékařskou umělou inteligenci (AI). Použitelný a výkonný systém lékařské umělé inteligence má obrovský potenciál změnit všechny aspekty moderní medicíny a umožnit chytřejší, přesnější, efektivnější a inkluzivnější péči, přinést blaho zdravotníkům i pacientům a tím výrazně zlepšit lidské zdraví. Ačkoli se v uplynulých 16 letech nashromáždili výzkumníci v oblasti lékařské umělé inteligence v různých malých oborech, v této fázi se jim dosud nepodařilo proměnit sci-fi v realitu.
Letos, s revolučním rozvojem technologií umělé inteligence, jako je ChatGPT, dosáhla lékařská umělá inteligence velkého pokroku v mnoha aspektech. Bezprecedentní průlom ve schopnostech lékařské umělé inteligence: Časopis Nature neustále zahajuje výzkum modelu velkých lékařských jazyků a základního modelu lékařského obrazu; Google vydává Med-PaLM a jeho nástupce, čímž dosahuje expertní úrovně v otázkách z amerických lékařských zkoušek. Hlavní akademické časopisy se zaměří na lékařskou umělou inteligenci: Nature zveřejňuje výhled na základní model obecné lékařské umělé inteligence; Po sérii přehledů umělé inteligence v medicíně z počátku tohoto roku publikoval New England Journal of Medicine (NEJM) 30. listopadu svůj první přehled digitálního zdraví a 12. prosince vydal první číslo subčasopisu NEJM NEJM AI. Půda pro lékařskou umělou inteligenci dále dozrává: Subčasopis JAMA publikoval globální iniciativu pro sdílení dat lékařských obrazových dat; Americký Úřad pro kontrolu potravin a léčiv (FDA) vyvíjí návrh pokynů pro regulaci lékařské umělé inteligence.
Níže uvádíme přehled významného pokroku, kterého vědci z celého světa dosáhli v roce 2023 ve vývoji použitelné lékařské umělé inteligence.
Základní model lékařské umělé inteligence
Konstrukce základního modelu lékařské umělé inteligence je nepochybně nejžhavějším výzkumným zaměřením tohoto roku. Časopisy Nature v průběhu roku publikovaly přehledové články o univerzálním základním modelu zdravotní péče a modelu zdravotní péče ve velkých jazykech. Medical Image Analysis, přední časopis v oboru, zhodnotil a vyhlédl výzvy a příležitosti výzkumu základních modelů v analýze lékařských obrazů a navrhl koncept „rodokmenu základního modelu“, který shrnuje a usměrňuje rozvoj výzkumu základních modelů lékařské umělé inteligence. Budoucnost základních modelů umělé inteligence pro zdravotní péči se stává jasnější. Výzkumníci v oblasti lékařské umělé inteligence se snaží vybudovat 1) základní modely specifické pro dané onemocnění, 2) obecné základní modely a 3) multimodální velké modely, které integrují širokou škálu režimů s masivními parametry a vynikajícími schopnostmi.
Model umělé inteligence pro sběr lékařských dat
Kromě rozsáhlých modelů umělé inteligence, které hrají velkou roli v následných úlohách analýzy klinických dat, se v předcházejícím sběru klinických dat objevila také technologie reprezentovaná generativními modely umělé inteligence. Proces, rychlost a kvalita sběru dat mohou být výrazně zlepšeny algoritmy umělé inteligence.
Začátkem tohoto roku publikoval časopis Nature Biomedical Engineering studii turecké Straits University, která se zaměřila na využití generativní umělé inteligence k řešení problému patologické zobrazovací diagnostiky v klinických aplikacích. Artefakty v zmrazených řezech tkáně během operace jsou překážkou pro rychlé diagnostické vyhodnocení. Ačkoli tkáň zalitá ve formalínu a parafínu (FFPE) poskytuje vzorek vyšší kvality, její výrobní proces je časově náročný a často trvá 12–48 hodin, což ji činí nevhodnou pro použití v chirurgii. Výzkumný tým proto navrhl algoritmus s názvem AI-FFPE, který dokáže vzhled tkáně v zmrazeném řezu přiblížit FFPE. Algoritmus úspěšně opravil artefakty zmrazených řezů, zlepšil kvalitu obrazu a zároveň zachoval klinicky relevantní vlastnosti. V klinické validaci algoritmus AI-FFPE významně zlepšuje diagnostickou přesnost patologů u podtypů nádorů a zároveň výrazně zkracuje dobu klinické diagnózy.
Časopis Cell Reports Medicine informuje o výzkumné práci týmu z Třetí klinické fakulty Univerzity v Jilinu, katedry radiologie, nemocnice Zhongshan přidružené k Fudanské univerzitě a Šanghajské univerzity vědy a technologie [25]. Tato studie navrhuje univerzální rámec pro fúzi hlubokého učení a iterativní rekonstrukce (Hybrid DL-IR) s vysokou všestranností a flexibilitou, který vykazuje vynikající výkon rekonstrukce obrazu v rychlé MRI, nízkodávkové CT a rychlé PET. Algoritmus dokáže dosáhnout MR skenování jednoho orgánu s více sekvencemi za 100 sekund, snížit dávku záření na pouhých 10 % CT obrazu, eliminovat šum a rekonstruovat malé léze z PET snímků s 2 až 4násobným zrychlením a zároveň snížit vliv artefaktů pohybu.
Lékařská umělá inteligence ve spolupráci se zdravotnickými pracovníky
Rychlý rozvoj lékařské umělé inteligence vedl také zdravotnické profesionály k vážnému zvážení a prozkoumání možností spolupráce s umělou inteligencí za účelem zlepšení klinických procesů. V červenci letošního roku společnost DeepMind a multiinstitucionální výzkumný tým společně navrhli systém umělé inteligence s názvem Complementary Driven Clinical Workflow Delay (CoDoC). Diagnostický proces je nejprve diagnostikován prediktivním systémem umělé inteligence, poté je posouzen jiným systémem umělé inteligence na základě předchozího výsledku a v případě pochybností je diagnóza nakonec stanovena klinickým lékařem, aby se zlepšila diagnostická přesnost a vyvážila efektivita. Pokud jde o screening rakoviny prsu, CoDoC snížil míru falešně pozitivních výsledků o 25 % při stejné míře falešně negativních výsledků a zároveň snížil pracovní zátěž klinických pracovníků o 66 % ve srovnání se současným procesem „dvojitého čtení“ ve Spojeném království. Pokud jde o klasifikaci tuberkulózy, míra falešně pozitivních výsledků byla ve srovnání s nezávislou umělou inteligencí a klinickými pracovními postupy snížena o 5 až 15 procent při stejné míře falešně negativních výsledků.
Podobně Annie Y. Ng a kol. ze společnosti Kheiron Company v Londýně ve Velké Británii zavedli další čtečky s umělou inteligencí (ve spolupráci s lidskými examinátory) pro opětovné prozkoumání výsledků, když v procesu arbitráže dvojitého čtení nebyly nalezeny žádné opakované výsledky, což zlepšilo problém s chybějící detekcí v časném screeningu rakoviny prsu a proces neměl téměř žádné falešně pozitivní výsledky. Jiná studie, vedená týmem z Lékařské fakulty McGovern University of Texas a provedená ve čtyřech centrech pro cévní mozkové příhody, použila technologii umělé inteligence založenou na počítačové tomografii (CTA) k automatizaci detekce rozsáhlé vaskulární okluzivní ischemické cévní mozkové příhody (LVO). Lékaři a radiologové dostávají upozornění v reálném čase na své mobilní telefony během několika minut po dokončení CT snímkování, která je informují o možné přítomnosti LVO. Tento proces umělé inteligence zlepšuje pracovní postupy v nemocnici pro akutní ischemickou cévní mozkovou příhodu, zkracuje dobu od přijetí do léčby a poskytuje příležitosti k úspěšné záchraně. Zjištění jsou publikována v časopise JAMA Neurology.
Model zdravotní péče s umělou inteligencí pro všeobecný prospěch
V roce 2023 se také uskuteční mnoho dobré práce, která využívá lékařskou umělou inteligenci k nalezení prvků, které jsou pro lidské oko neviditelné, z snadno dostupných dat, což umožní univerzální diagnostiku a včasný screening ve velkém měřítku. Na začátku roku publikovala organizace Nature Medicine studie provedené Očním centrem Zhongshan Univerzity Sun Yat-sena a Druhou přidruženou nemocnicí Lékařské univerzity Fujian. Pomocí chytrých telefonů jako aplikačních terminálů použili kreslené videozáznamy k vyvolání dětského pohledu a zaznamenání chování dětského pohledu a rysů obličeje a dále analyzovali abnormální modely pomocí modelů hlubokého učení, aby úspěšně identifikovali 16 očních onemocnění, včetně vrozeného šedého zákalu, vrozené ptózy a vrozeného glaukomu, s průměrnou přesností screeningu více než 85 %. To poskytuje efektivní a snadno popularizovatelné technické prostředky pro rozsáhlý včasný screening poruch zrakových funkcí u kojenců a souvisejících očních onemocnění.
Na konci roku časopis Nature Medicine zveřejnil výsledky práce více než 10 lékařských a výzkumných institucí po celém světě, včetně Šanghajského institutu pro onemocnění slinivky břišní a První přidružené nemocnice Univerzity Zhejiang. Autor aplikoval umělou inteligenci na screening rakoviny slinivky břišní u asymptomatických osob v centrech fyzikálního vyšetření, nemocnicích atd., aby detekoval léze na snímcích CT, které je obtížné detekovat pouhým okem, a dosáhl tak efektivní a neinvazivní včasné detekce rakoviny slinivky břišní. Při analýze dat od více než 20 000 pacientů model také identifikoval 31 případů klinicky přehlédnutých lézí, což významně zlepšilo klinické výsledky.
Sdílení lékařských údajů
V roce 2023 se po celém světě objevilo mnoho dalších dokonalejší mechanismů sdílení dat a úspěšných případů, které zajišťují spolupráci mezi více centry a otevřenost dat za předpokladu ochrany soukromí a bezpečnosti dat.
Zaprvé, s pomocí samotné technologie umělé inteligence přispěli výzkumníci v oblasti umělé inteligence ke sdílení lékařských dat. Qi Chang a další z Rutgers University ve Spojených státech publikovali článek v Nature Communications, v němž navrhli federální rámec pro učení DSL založený na distribuovaných syntetických adverzárních sítích, který využívá generativní umělou inteligenci k trénování specificky generovaných dat z multicenter a poté nahrazuje skutečná data z multicenter vygenerovanými daty. Zajistit trénování umělé inteligence založené na velkých datech z multicenter a zároveň chránit soukromí dat. Stejný tým také zveřejnil datovou sadu generovaných patologických obrazů a jejich odpovídajících anotací jako open source. Model segmentace trénovaný na vygenerované datové sadě může dosáhnout podobných výsledků jako skutečná data.
Tým Dai Qionghai z Univerzity Tsinghua publikoval článek o npj Digital Health, v němž navrhuje metodu Relay Learning, která využívá big data z více lokalit k trénování modelů umělé inteligence za předpokladu lokální datové suverenity a absence síťového propojení mezi lokalitami. Vyvažuje obavy o bezpečnost dat a soukromí se snahou o výkon umělé inteligence. Stejný tým následně společně vyvinul a validoval CAIMEN, systém pro diagnostiku pan-mediastinálních nádorů hrudníku pomocí CT založený na federálním učení, ve spolupráci s První přidruženou nemocnicí Lékařské univerzity v Guangzhou a 24 nemocnicemi po celé zemi. Systém, který lze aplikovat na 12 běžných mediastinálních nádorů, dosáhl o 44,9 procenta lepší přesnosti při samostatném použití než při použití pouze lidskými experty a o 19 procent lepší přesnosti diagnózy, když mu asistovali lidští experti.
Na druhou stranu probíhá několik iniciativ zaměřených na budování bezpečných, globálních a rozsáhlých souborů lékařských dat. V listopadu 2023 Agustina Saenz a další z katedry biomedicínské informatiky na Harvard Medical School zveřejnili online v časopise Lancet Digital Health globální rámec pro sdílení dat lékařských obrazových dat s názvem Artificial Intelligence Data for All Healthcare (MAIDA). Spolupracují se zdravotnickými organizacemi po celém světě na poskytování komplexních pokynů pro sběr dat a anonymizaci s využitím šablony US Federal Demonstration Partner (FDP) pro standardizaci sdílení dat. Plánují postupně zveřejňovat soubory dat shromážděné v různých regionech a klinických prostředích po celém světě. První soubor dat by měl být zveřejněn začátkem roku 2024 a další budou následovat s rozšířením partnerství. Projekt je důležitým pokusem o vybudování globálního, rozsáhlého a rozmanitého souboru veřejně dostupných dat o umělé inteligenci.
V návaznosti na tento návrh šla příkladem britská biobanka. Britská biobanka 30. listopadu zveřejnila nová data ze sekvenování celého genomu svých 500 000 účastníků. Databáze, která zveřejňuje kompletní sekvenci genomu každého z 500 000 britských dobrovolníků, je největší kompletní databází lidského genomu na světě. Výzkumníci z celého světa si mohou vyžádat přístup k těmto anonymizovaným datům a použít je k prozkoumání genetického základu zdraví a nemocí. Genetická data byla v minulosti vždy velmi citlivá pro ověřování a tento historický úspěch britské biobanky dokazuje, že je možné vybudovat otevřenou a globální rozsáhlou databázi bez ochrany soukromí. S touto technologií a databází lékařská umělá inteligence jistě přinese další skok.
Ověřování a hodnocení lékařské umělé inteligence
Ve srovnání s rychlým rozvojem samotné technologie lékařské umělé inteligence je vývoj ověřování a hodnocení lékařské umělé inteligence poněkud pomalý. Validace a hodnocení v obecné oblasti umělé inteligence často ignorují skutečné požadavky lékařů a pacientů na umělou inteligenci. Tradiční randomizované kontrolované klinické studie jsou příliš pracné na to, aby odpovídaly rychlé iteraci nástrojů umělé inteligence. Nejdůležitější věcí pro to, aby lékařská umělá inteligence skutečně přeskočila výzkum a vývoj do klinické praxe, je co nejrychlejší zlepšení systému ověřování a hodnocení vhodného pro nástroje lékařské umělé inteligence.
Ve výzkumné práci společnosti Google o Med-PaLM, publikované v časopise Nature, tým také publikoval benchmark pro hodnocení MultiMedQA, který se používá k posouzení schopnosti modelů velkých jazyků získávat klinické znalosti. Benchmark kombinuje šest existujících profesionálních datových sad lékařských otázek a odpovědí, které pokrývají profesionální lékařské znalosti, výzkum a další aspekty, a také online databázi lékařských otázek, která zohledňuje online otázky a odpovědi mezi lékařem a pacientem a snaží se z umělé inteligence vyškolit kvalifikovaného lékaře z mnoha hledisek. Tým dále navrhuje rámec založený na lidském hodnocení, který zohledňuje více dimenzí faktů, porozumění, uvažování a možného zkreslení. Jedná se o jeden z nejreprezentativnějších výzkumných projektů zaměřených na hodnocení umělé inteligence ve zdravotnictví publikovaných v tomto roce.
Znamená však skutečnost, že modely ve velkých jazykech vykazují vysokou úroveň kódování klinických znalostí, že modely ve velkých jazykech jsou kompetentní pro klinické úkoly v reálném světě? Stejně jako student medicíny, který složí zkoušku pro lékaře s perfektním skóre, má stále daleko k tomu, aby se stal samostatným primářem, nemusí být hodnotící kritéria navržená společností Google dokonalou odpovědí na téma hodnocení modelů umělé inteligence v lékařství. Již v letech 2021 a 2022 vědci navrhli směrnice pro podávání zpráv, jako jsou Decid-AI, SPIRIT-AI a INTRPRT, v naději, že povedou k ranému vývoji a validaci lékařské umělé inteligence za podmínky, že se zohlední faktory, jako je klinická praktičnost, bezpečnost, lidské faktory a transparentnost/interpretace. Nedávno časopis Nature Medicine publikoval studii vědců z Oxfordské a Stanfordské univerzity o tom, zda k validaci nástrojů umělé inteligence použít „externí validaci“ nebo „opakující se lokální validaci“.
Nezaujatá povaha nástrojů umělé inteligence je také důležitým směrem hodnocení, kterému se letos dostalo pozornosti jak v článcích časopisů Science, tak v NEJM. Umělá inteligence často vykazuje zkreslení, protože je omezena na trénovací data. Toto zkreslení může odrážet sociální nerovnost, která se dále vyvíjí v algoritmickou diskriminaci. Národní instituty zdraví (NIH) nedávno spustily iniciativu Bridge2AI, jejíž náklady se odhadují na 130 milionů dolarů, s cílem vytvořit rozmanité datové sady (v souladu s výše zmíněnými cíli iniciativy MAIDA), které lze použít k ověření nezaujatosti lékařských nástrojů umělé inteligence. Tyto aspekty MultiMedQA nezohledňuje. Otázka, jak měřit a validovat modely lékařské umělé inteligence, si stále vyžaduje rozsáhlou a hloubkovou diskusi.
V lednu publikoval časopis Nature Medicine článek s názvem „Nová generace medicíny založené na důkazech“ od Viveka Subbiaha z University of Texas MD Anderson Cancer Center, který zkoumal omezení klinických studií odhalená v kontextu pandemie COVID-19 a poukazoval na rozpor mezi inovací a dodržováním klinického výzkumného procesu. V neposlední řadě poukazuje na budoucnost restrukturalizace klinických studií – novou generaci klinických studií využívajících umělou inteligenci, tj. využití umělé inteligence z velkého množství historických výzkumných dat, dat z reálného světa, multimodálních klinických dat a dat z nositelných zařízení k nalezení klíčových důkazů. Znamená to, že technologie umělé inteligence a procesy klinické validace s využitím umělé inteligence se mohou v budoucnu vzájemně posilovat a společně vyvíjet? Toto je otevřená a podnětná otázka roku 2023.
Regulace lékařské umělé inteligence
Pokrok v technologii umělé inteligence představuje také výzvy pro regulaci umělé inteligence a tvůrci politik po celém světě na ně reagují pečlivě a opatrně. V roce 2019 FDA poprvé zveřejnila Návrh regulačního rámce pro změny softwaru zdravotnických prostředků s umělou inteligencí (Diskusní návrh), v němž podrobně popsala svůj potenciální přístup k předběžnému hodnocení umělé inteligence a softwarových úprav řízených strojovým učením. V roce 2021 FDA navrhla „Akční plán pro software založený na umělé inteligenci/strojovém učení jako zdravotnický prostředek“, který objasnil pět konkrétních regulačních opatření v oblasti umělé inteligence v oblasti lékařství. Letos FDA znovu vydala Předběžné podání žádosti o funkce softwaru zařízení, aby poskytla informace o doporučeních pro předběžné podání žádosti o hodnocení bezpečnosti a účinnosti softwarových funkcí zařízení ze strany FDA, včetně některých softwarových funkcí zařízení, které používají modely strojového učení trénované metodami strojového učení. Regulační politika FDA se vyvinula z původního návrhu v praktické pokyny.
Po zveřejnění Evropského prostoru zdravotních dat v červenci loňského roku EU opět schválila zákon o umělé inteligenci (Artificial Intelligence Act). První z nich si klade za cíl co nejlépe využít zdravotní data k poskytování vysoce kvalitní zdravotní péče, snížení nerovností a podpoře dat pro prevenci, diagnostiku, léčbu, vědecké inovace, rozhodování a legislativu a zároveň zajistit, aby občané EU měli větší kontrolu nad svými osobními zdravotními údaji. Druhý z nich jasně uvádí, že systém lékařské diagnózy je vysoce rizikový systém umělé inteligence a že je nutné zavést cílený silný dohled, dohled nad celým životním cyklem a dohled před hodnocením. Evropská agentura pro léčivé přípravky (EMA) zveřejnila návrh diskusního dokumentu o využití umělé inteligence na podporu vývoje, regulace a užívání léčiv s důrazem na zlepšení důvěryhodnosti umělé inteligence s cílem zajistit bezpečnost pacientů a integritu výsledků klinického výzkumu. Celkově se regulační přístup EU postupně formuje a konečné implementační detaily mohou být podrobnější a přísnější. V ostrém kontrastu s přísnou regulací EU britský regulační plán pro umělou inteligenci jasně ukazuje, že vláda plánuje zaujmout mírný přístup a prozatím nepřijímat nové zákony ani nezřizovat nové regulační orgány.
V Číně vydalo Centrum pro technické přezkumy zdravotnických prostředků (NMPA) Národního úřadu pro zdravotnické prostředky již dříve dokumenty, jako například „Body přezkumu softwaru pro asistované rozhodování s hlubokým učením“, „Zásady pro přezkum registrace zdravotnických prostředků s umělou inteligencí (návrh k připomínkování)“ a „Oběžník o zásadách pro klasifikaci a definici softwarových produktů s umělou inteligencí pro zdravotnické prostředky (č. 47 v roce 2021)“. Letos byl opět zveřejněn „Souhrn výsledků první klasifikace zdravotnických prostředků v roce 2023“. Tato série dokumentů jasněji a snadněji definuje, klasifikuje a reguluje softwarové produkty pro lékařství s umělou inteligencí a poskytuje jasné pokyny pro strategie umisťování produktů a registrace různých podniků v tomto odvětví. Tyto dokumenty poskytují rámec a manažerská rozhodnutí pro vědeckou regulaci zdravotnických prostředků s umělou inteligencí. Stojí za to očekávat, že program Čínské konference o lékařské umělé inteligenci, která se konala v Chang-čou od 21. do 23. prosince, zřídil speciální fórum pro digitální lékařskou správu a vysoce kvalitní rozvoj veřejných nemocnic a fórum pro rozvoj standardizace technologií testování a hodnocení zdravotnických prostředků s umělou inteligencí. V té době se setkání zúčastní zástupci Národní rozvojové a reformní komise a NMPA, kteří mohou zveřejnit nové informace.
Závěr
V roce 2023 se lékařská umělá inteligence začala integrovat do celého procesu předcházejícího i následného lékařství, zahrnujícího sběr nemocničních dat, fúzi, analýzu, diagnostiku a léčbu a screening komunity, a organicky spolupracovat s lékařskými pracovníky/pracovníky zabývajícími se kontrolou nemocí, což ukazuje potenciál přinést blaho lidskému zdraví. Začíná se rýsovat použitelný výzkum v oblasti lékařské umělé inteligence. V budoucnu bude pokrok lékařské umělé inteligence záviset nejen na samotném technologickém rozvoji, ale bude také vyžadovat plnou spolupráci průmyslu, univerzit a lékařského výzkumu a podporu tvůrců politik a regulačních orgánů. Tato mezioborová spolupráce je klíčem k dosažení lékařských služeb integrovaných s umělou inteligencí a jistě podpoří rozvoj lidského zdraví.
Čas zveřejnění: 30. prosince 2023




