Letošní cenu Lasker Basic Medical Research Award získali Demis Hassabis a John Jumper za jejich přínos k vytvoření systému umělé inteligence AlphaFold, který předpovídá trojrozměrnou strukturu proteinů na základě sekvence aminokyselin prvního řádu.
Jejich výsledky řeší problém, který dlouhodobě trápí vědeckou komunitu, a otevírají dveře k urychlení výzkumu v biomedicínské oblasti. Proteiny hrají klíčovou roli ve vývoji onemocnění: u Alzheimerovy choroby se skládají a shlukují; u rakoviny se ztrácí jejich regulační funkce; u vrozených metabolických poruch jsou dysfunkční; u cystické fibrózy se dostávají do nesprávného místa v buňce. Toto je jen několik z mnoha mechanismů, které způsobují onemocnění. Detailní modely struktury proteinů mohou poskytnout atomové konfigurace, řídit návrh nebo výběr molekul s vysokou afinitou a urychlit objevování léků.
Struktury proteinů se obecně určují rentgenovou krystalografií, nukleární magnetickou rezonancí a kryoelektronovou mikroskopií. Tyto metody jsou drahé a časově náročné. Výsledkem jsou stávající 3D databáze struktur proteinů s pouze asi 200 000 strukturními daty, zatímco technologie sekvenování DNA vytvořila více než 8 milionů proteinových sekvencí. V 60. letech 20. století Anfinsen a kol. zjistili, že 1D sekvence aminokyselin se může spontánně a opakovaně složit do funkční trojrozměrné konformace (obrázek 1A) a že molekulární „chaperony“ mohou tento proces urychlit a usnadnit. Tato pozorování vedou k 60leté výzvě v molekulární biologii: predikci 3D struktury proteinů z 1D sekvence aminokyselin. S úspěchem Projektu lidského genomu se naše schopnost získat 1D sekvence aminokyselin výrazně zlepšila a tato výzva se stala ještě naléhavější.
Předpovídání struktur proteinů je obtížné z několika důvodů. Zaprvé, všechny možné trojrozměrné pozice každého atomu v každé aminokyselině vyžadují rozsáhlý průzkum. Zadruhé, proteiny maximálně využívají komplementaritu ve své chemické struktuře k efektivní konfiguraci atomů. Vzhledem k tomu, že proteiny obvykle obsahují stovky „donorů“ vodíkových vazeb (obvykle kyslík), které by měly být blízko „akceptoru“ vodíkové vazby (obvykle dusík vázaný na vodík), může být velmi obtížné najít konformace, kde je téměř každý donor blízko akceptoru. Zatřetí, existuje jen omezené množství příkladů pro trénování experimentálních metod, takže je nutné pochopit potenciální trojrozměrné interakce mezi aminokyselinami na základě 1D sekvencí s využitím informací o vývoji relevantních proteinů.
Fyzika byla poprvé použita k modelování interakce atomů při hledání nejlepší konformace a byla vyvinuta metoda pro predikci struktury proteinů. Karplus, Levitt a Warshel získali v roce 2013 Nobelovu cenu za chemii za svou práci na výpočetní simulaci proteinů. Metody založené na fyzice jsou však výpočetně náročné a vyžadují přibližné zpracování, takže nelze předpovědět přesné trojrozměrné struktury. Dalším „znalostním“ přístupem je použití databází známých struktur a sekvencí k trénování modelů pomocí umělé inteligence a strojového učení (AI-ML). Hassabis a Jumper aplikují prvky fyziky i AI-ML, ale inovace a skok ve výkonu tohoto přístupu pramení především z AI-ML. Oba vědci kreativně zkombinovali rozsáhlé veřejné databáze s výpočetními zdroji průmyslové úrovně a vytvořili AlphaFold.
Jak víme, že „vyřešili“ hádanku strukturální predikce? V roce 1994 byla založena soutěž Critical Assessment of Structure Prediction (CASP), která se koná každé dva roky a sleduje pokrok strukturální predikce. Výzkumníci sdílejí 1D sekvenci proteinu, jehož strukturu nedávno vyřešili, ale jejíž výsledky dosud nebyly publikovány. Prediktor predikuje trojrozměrnou strukturu pomocí této 1D sekvence a hodnotitel nezávisle posuzuje kvalitu predikovaných výsledků jejich porovnáním s trojrozměrnou strukturou poskytnutou experimentátorem (poskytnutou pouze hodnotiteli). CASP provádí skutečně slepé hodnocení a zaznamenává periodické skoky ve výkonnosti spojené s metodologickými inovacemi. Na 14. konferenci CASP v roce 2020 ukázaly výsledky predikce AlphaFold takový skok ve výkonnosti, že organizátoři oznámili, že problém 3D predikce struktury byl vyřešen: přesnost většiny predikcí se blížila přesnosti experimentálních měření.
Širší význam spočívá v tom, že práce Hassabise a Jumpera přesvědčivě demonstruje, jak by AI-ML mohla transformovat vědu. Výzkum ukazuje, že AI-ML dokáže vytvářet komplexní vědecké hypotézy z více zdrojů dat, že mechanismy pozornosti (podobné těm v ChatGPT) dokáží objevit klíčové závislosti a korelace ve zdrojích dat a že AI-ML dokáže sama posoudit kvalitu svých výstupních výsledků. AI-ML v podstatě dělá vědu.
Čas zveřejnění: 23. září 2023




