Czy sztuczna inteligencja mogła przewidzieć pandemię?

07-07-2020 / Rafał Pikuła

W dobie pandemii wiele technologii, uznawanych za przełomowe, okazało się nieskutecznych. Sztuczna inteligencja (AI) ani nie przewidziała pojawienia się wirusa COVID-19, ani nie pomogła w znaczy sposób z jego walką. Jednak doświadczenia z tego zjawiska mogą być pomocne dla AI w przyszłości.

Jak to możliwe, że Stany Zjednoczone, ojczyzna takich potęg, jak Google, Apple, Amazon, ugięły się pod ciężarem epidemii tak szybko? Dlaczego ojczyzna technologicznych gigantów w żaden sposób nie wykorzystała technologicznej przewagi do walki z wirusem i przychodzącym wraz z nim kryzysem? Czy technologia jest bezbronna wobec naturalnych zjawisk? Dlaczego sztuczna inteligencja – której głównym laboratorium są przecież Stany Zjednoczone – nie przygotowała Amerykanów, ale także i nas, na pandemię?

Te pytania pojawiały się często w dyskusjach łączących technologię i koronawirusa. Oczywiście błyskawiczny rozwój epidemii w Stanach Zjednoczonych wynika w dużej mierze z wolnorynkowego modelu opieki zdrowotnej, gdzie publiczna służba zdrowia jest tylko kadłubowa. Zarazem jednak to właśnie w USA co roku federalne CDC (Centra Zapobiegania i Kontroli Chorób) urządza konkurs na przewidywania dotyczące rozwoju epidemii grypy. Gdy rozpoczęła się epidemia COVID-19, CDC ponownie ogłosiło konkurs na prognozę dotyczącą koronawirusa. Niestety kreślenie możliwych scenariuszy nie okazało się takie proste.

Przełomowe „odkrycie”

Oczywiście były pewne „przecieki”. 30 grudnia wybuch epidemii został zaobserwowany przez algorytm należący do kanadyjskiej firmy BlueDot. Firma poinformowała o nim swoich klientów dzień później. BlueDot korzysta ze sztucznej inteligencji, by przeczesywać internet w poszukiwaniu sygnałów wskazujących na zagrożenie epidemiologiczne. Jak twierdzi sama firma, system buduje złożone modele występowania i rozprzestrzeniania się chorób w oparciu o dane z ponad 100 źródeł. Są wśród nich lokalne wiadomości, fora internetowe, dane ze szpitali, informacje dotyczące zachorowań wśród zwierząt. Algorytm uwzględnia nawet dane demograficzne, transport lokalny i lotniczy czy dane klimatyczne.

Warto wyjaśnić, że system BlueDot wykorzystuje uczenie maszynowe i systemy przetwarzania języka naturalnego działające w ponad 60 językach. W firmie pracują także epidemiolodzy, którzy oceniają wychwycone przez algorytm przypadki i kompilują raporty, sprzedawane następnie klientom firmy. Wśród nich są organizacje rządowe, linie lotnicze, a także szpitale.

Firmy takie jak BlueDot wykorzystują szereg algorytmów przetwarzania języka naturalnego (NLP) do monitorowania serwisów informacyjnych i oficjalnych raportów opieki zdrowotnej w różnych językach na całym świecie, zaznaczając, czy wspominają o chorobach o wysokim priorytecie, takich jak COVID-19, czy innych – jak HIV/AIDS lub gruźlica. Ich narzędzia predykcyjne mogą również wykorzystywać dane z podróży lotniczych, aby ocenić ryzyko, że w węzłach tranzytowych pojawią się zainfekowani pasażerowie. 

– Algorytm BlueDot przeszukiwał na przykład wiadomości bieżące z obcojęzycznych serwisów newsowych, dane z biletów lotniczych, informacje rozmaitych serwisów poświęconych chorobom zwierząt i roślin oraz oficjalne obwieszczenia rządowe – o rewelacjach wokół BlueDot mówiła w rozmowie z Michałem Sutkowskim Aleksandra Przegalińska, badaczka z Akademii Leona Koźmińskiego.

Kamran Khan, prezes BlueDot, cytowany na łamach Wired mówił, że „o ile nie możemy ufać rządom krajów, to możemy wychwytywać informacje o potencjalnych ogniskach chorób z plotek, forów, blogów”. W przeczesywaniu sieci miał tkwić sekret „odkrycia” epidemii. Odkrycia, ale nie przewidzenia. Narracja, która pojawiła się w wielu doniesieniach prasowych mówiąca, że AI jest potężną nową bronią przeciwko chorobom, jest tylko częściowo prawdziwa.

Bez danych ani rusz

Will Douglas Heaven w „MIT Technology Review”, amerykańskim periodyku zajmujący się nowymi technologiami, wyjaśnił, że przewidzenie obecnej epidemii i możliwych scenariuszy jej rozwoju było niemożliwe, ale badania nad zastaną sytuacją mogą być kluczowe dla kolejnych zjawisk tego typu. O ile o grypie wiadomo już sporo, to natura patogenu, który pojawił się w Wuhan zaledwie kilka miesięcy temu, jest jeszcze niezbyt dobrze znana. Biologiczny aspekt koronawirusa nie był możliwy do zbadania, bowiem… brakowało danych. Bez nich, sztuczna inteligencja jest bezużyteczne. Zasadniczo potrafi ona analizować ogromne zasoby danych, ale nie jest czarodziejką: informacji nie wyczaruje. Z tego powodu wykrycie całkowicie nowego wirusa, takiego jakim jest koronawirus odpowiedzialny za COVID-19, było niemożliwe.

Sytuację skomplikowały również pierwsze informacje dotyczące koronawirusa – były chaotyczne i wewnętrznie sprzeczne. Drugą przeszkodą był brak współpracy międzynarodowej na początku pandemii: Chiny nie były zbyt skore do ujawniania prawdziwych danych w styczniu i lutym. Wirusy nie działają w granicach geopolitycznych i nie zwracają uwagi na międzypaństwowe waśnie bądź sojusze.

Kolejna kwestia do dostęp do pośrednich danych historycznych, niezwiązanych z epidemią i wirusem. Są one niezwykle pomocne, także przy analizowaniu bieżących, konkretnych danych. Narzędzia prognostyczne byłyby znacznie lepsze, gdyby dane dotyczące zdrowia publicznego nie były zamknięte w agencjach rządowych, tak jak ma to miejsce w wielu krajach, w tym w USA. Oznacza to, że AI musi w większym stopniu opierać się na łatwo dostępnych danych, takich jak wiadomości online. 

Lekcja na przyszłość  

Wiemy, czego zabrakło. Na szczęście już mamy dane dotyczące koronawirusa SARS-CoV-2 i choroby COVID-19. I te dane można w końcu wykorzystać. Oczywiście gdy pandemia się skończy, przekaz medialny się uspokoi, a działania rządów przestaną być błądzeniem we mgle. Hałas jest zawsze wrogiem algorytmów uczenia maszynowego, a to od solidnego podejścia do danych, które teraz mamy zależy sukces w przyszłości.

Oprócz przewidywania przebiegu epidemii wielu ma nadzieję, że sztuczna inteligencja pomoże zidentyfikować osoby zarażone. AI ma tutaj udokumentowane osiągnięcia. Modele uczenia maszynowego do badania obrazów medycznych mogą wychwycić wczesne oznaki choroby. Ale modele te zazwyczaj wymagają dużej ilości danych do nauki. I znów wracamy do kwestii zarządzania danymi.

Czy uczenie maszynowe może zdiagnozować Covid-19 na podstawie tomografii komputerowej tkanki płucnej, jeśli zostanie przeszkolony w wykrywaniu charakterystycznych objawów choroby na zdjęciach? Alexander Selvikvåg Lundervold z Uniwersytetu Nauk Stosowanych w Norwegii Zachodniej w Bergen w Norwegii, który jest ekspertem w dziedzinie uczenia maszynowego i obrazowania medycznego, wyjaśnia, że obrazowanie nie jest właściwą drogą. Po pierwsze, fizyczne oznaki choroby mogą nie pojawić się w skanach do pewnego czasu po infekcji, co czyni ją niezbyt przydatną jako wczesną diagnostykę.

Po drugie wciąż dostępnych jest za mało danych szkoleniowych, zatem trudno jest ocenić dokładność takich badań.  Większość systemów rozpoznawania obrazów –  w tym te, które są przeszkolone w zakresie obrazów medycznych – jest dostosowana do modeli najpierw przeszkolonych w ImageNet, powszechnie stosowanym zestawie danych obejmującym miliony codziennych obrazów.

– Aby sklasyfikować coś prostego, co jest zbliżone do danych ImageNet, na przykład zdjęcia psów i kotów, można to zrobić przy bardzo małej ilości danych. Subtelne odkrycia na obrazach medycznych, wymagają więcej danych porównawczych – wyjaśniał Lundervold w serwisie Medrxiv.

Droga do przewidzenia kolejnej epidemii, bądź stworzenia metod szybkiego leczenia wciąż daleka. Nie mamy jeszcze wystarczających informacji na temat mutacji wirusa. Maksymalne wykorzystanie sztucznej inteligencji wymaga dużej ilości danych (uwolnionych), czasu, a przede wszystkim kompleksowej współpracy pomiędzy władzą, korporacjami i sektorem medycznym. Potrzebny jest inteligentny, innowacyjny model partnerstwa publiczno-prywatnego. Dużo więcej więc zależy od ludzi, mniej od technologii.