W lesie ze sztuczną inteligencją. I to, wbrew pozorom, jest dobra wiadomość #TuesdAI
Skuteczna ochrona przyrody wymaga wiedzy: o procesach w niej zachodzących, o zachowaniach poszczególnych gatunków, o ich liczebności itd. Wiedza ta jest wynikiem analizy informacji, pozyskanych w terenie. Oczywiście im więcej informacji zdobędziemy, tym więcej cennych obserwacji uda się z nich wydobyć. Jednak z drugiej strony duży zbiór danych może nastręczać problemów z ich sprawną analizą. Dotychczas był to paradoks trudny do rozwiązania. Na szczęście dziś wykorzystanie sztucznej inteligencji pomaga sobie z nim poradzić.
Perła w koronie
Choć nie brakuje w Polsce cennych przyrodniczo obszarów z bogatą fauną i florą, to jedno z nich zajmuje czołowe miejsce u wszystkich miłośników przyrody i naukowców zajmujących się środowiskiem naturalnym. To Puszcza Białowieska. Ten ostatni europejski las nizinny, w dużym stopniu zachowany w naturalnym kształcie, można porównać tylko z afrykańską równiną Serengeti czy amazońskimi lasami deszczowymi.
Od niemal 60 lat wiedzę na temat życia zwierząt na tym obszarze zbiera i gromadzi Instytut Biologii Ssaków, stanowiący samodzielną jednostkę naukowo-badawczą Polskiej Akademii Nauk. Ponad półwieczna działalność Instytutu nie spowodowała jednak wyczerpania obszaru jego działań. Przyroda Puszczy Białowieskiej, w tym życie ssaków ją zamieszkujących, wciąż skrywa wiele tajemnic. Natomiast dziś naukowcy mają kolejne narzędzie, które pomaga w ich poznaniu – sztuczną inteligencję.
W czatowni i przy komputerze
Poznanie przyrody i sposobów jej funkcjonowania to praca bazująca przede wszystkim na obserwacjach dokonywanych w terenie. Nie da się wyodrębnić fragmentu środowiska i przenieść go do laboratorium, bo takie działanie samo w sobie już będzie miało wpływ na wyniki badań, na skutek zakłócenia naturalnych procesów przyrodniczych. Zwierzęta zamknięte w zagrodach mogą się na przykład zachowywać zupełnie inaczej niż na wolności, co zafałszuje wyniki badań. Poza tym, raczej trudno sobie wyobrazić laboratorium wielkości kilkudziesięciu km2, w którym można by śledzić procesy ekologiczne operujące w szerszych skalach przestrzennych (np. w skali krajobrazowej). Nie pozostaje zatem nic innego, jak obserwacje bezpośrednio w terenie, w naturalnym laboratorium procesów przyrodniczych jakim jest właśnie Puszcza Białowieska.
Te zaś nie należą do najłatwiejszych. Zwierzęta w środowisku naturalnym – szczególnie w zurbanizowanej Europie, gdzie w dodatku nierzadko prowadzi się wciąż polowania – starają się unikać człowieka. Do tego szerokie obszary, na których przebywają przede wszystkim duże zwierzęta – wilki, żubry, dziki, jelenie itd. – wymagają zaangażowania do obserwacji wielu osób. Stąd zarówno Instytut Biologii Ssaków, jak i wiele innych jednostek naukowych w Polsce i na świecie od lat do tego typu obserwacji wykorzystują fotopułapki.
Co to takiego? Najprościej mówiąc to urządzenia składające się z kamery i czujnika ruchu. Kiedy czujnik wykryje ruch w otoczeniu, automatycznie włącza kamerę, która nagrywa film lub wykonuje zdjęcia. Pozwala to na pozyskanie licznych danych na temat zwierząt, ich życia i zachowań, bez konieczności angażowania fizycznie naukowców na długie godziny, które musieliby spędzić w czatowniach na obserwacjach. Wystarczy zgromadzone przez urządzenie dane pobrać na dysk, aby wykorzystać je w badaniach.
W powodzi danych
To wszystko brzmi całkiem fajnie. Fotopułapka pozyskuje niezbędne dane umożliwiając przy tym standaryzację samej obserwacji, czyli wyeliminowanie tzw. efektu obserwatora.. Jednak aby móc wykorzystać zgromadzone przez urządzenie informacje, trzeba je uporządkować, przesortować, sklasyfikować, oznaczyć itd. Zrobienie tego z danymi wygenerowanymi przez jedno urządzenie jeszcze nie nastręcza problemu, ale co w przypadku, kiedy w danym projekcie użytych zostaje kilkadziesiąt lub kilkaset takich fotopułapek? Kto ma opracowywać pozyskiwane dane? Kiedy znaleźć na to czas? Skąd pozyskać środki na wynagrodzenie dla takiego sztabu ludzi?
To wyzwania, przed którymi stanęli pracownicy Instytutu Biologii Ssaków PAN. Początkowo naukowcy tworzyli katalogi, podkatalogi, foldery i podfoldery, aby skategoryzować zebrany materiał. To spowodowało powstanie skomplikowanych struktur hierarchicznych, opisywanych w arkuszach kalkulacyjnych, w których mało kto potrafił się odnaleźć i wyabstrahować potrzebne informacje. W efekcie system stał się niewydajny, a pracownicy Instytutu, mimo posiadania ogromnego zbioru informacji, nie mogli zwiększyć efektywności swych badań.
Technologia pomaga technologii
Tak jak technologia w postaci fotopułapek przyszła wcześniej na pomoc naukowcom w gromadzeniu danych, tak i pomocą w ich skatalogowaniu i opracowaniu okazała się technologia. Doktorant IBS PAN, Jakub Bubnicki wraz z zespołem wpadli na pomysł opracowania specjalnego oprogramowania, które jest rozwijane pod nazwą TRAPPER. To bazodanowa aplikacja sieciowa, wspierająca zarządzanie projektami, w których wykorzystywane są fotopułapki. Ułatwia ona klasyfikację nagrań czy zdjęć oraz pozwala na współdzielenie i ponowne wykorzystanie zebranych danych. TRAPPER to projekt open source, którym opiekuje się powołana przez naukowców fundacja Open Science Conservation Fund.
Brzmi fantastycznie, prawda? Jest tylko jeden mały szkopuł. „Obróbką” danych w dalszym ciągu musi zajmować się człowiek. Dzięki współdzieleniu danych można co prawda wreszcie do tego zadania zaangażować szerszą grupę ludzi – np. studentów – ale trudno wyobrazić sobie, aby z ekscytacją podchodzili oni do zadania, polegającego na wielodniowym przeglądaniu nagrań czy zdjęć i manualnym odsiewaniu materiału bezwartościowego czy katalogowaniu gatunków zwierząt, które uwieczniła fotopułapka.
Tymczasem materiał do obróbki może być naprawdę pokaźny. Na przykład w czasie jednej sesji monitoringowej, która trwa miesiąc i do której użyto 70 – 80 fotopułapek, może zostać wygenerowanych aż 40 tys. filmów. Z tego zaś 50 – 60 proc. materiału to nagrania puste, powstałe np. na skutek tego, że wiatr poruszył gałązką, co uruchomiło nagrywanie w urządzeniu. Wychodzi więc na to, że praca osób opracowujących materiał, to w połowie kasowanie danych, a więc działania całkowicie nieprzydatne do dalszych badań.
Nadać sens działaniom ludzi
Aby więc potencjał ludzki wykorzystać do działań posiadających większy sens niż tylko selekcja i kasowanie niepotrzebnych danych, naukowcy z IBS PAN, we współpracy z doktorantami Politechniki Białostockiej oraz lokalnymi entuzjastami języka Python z grupy PyStok, postanowili wzbogacić aplikację TRAPPER o sztuczną inteligencję. W tym celu zespół odpowiedzialny za aplikację wystąpił do Microsoft z wnioskiem o grant w ramach programu AI for Good. Celem realizowanego przez Microsoft programu jest bowiem wspieranie grantami i rozwiązaniami technologicznymi tych organizacji, które zajmują się rozwiązywaniem rozmaitych problemów na całym świecie. Przedsięwzięcie podzielono na kilka inicjatyw: AI for Earth (sprawy środowiskowe), AI for Health (kwestie zdrowotne), AI for Accessibility (rozwiązania dla osób z niepełnosprawnościami), AI for Humanitarian Action (akcje humanitarne) oraz AI for Cultural Heritage (ochrona dziedzictwa kulturowego).
Zespół otrzymał wsparcie w postaci dostępu do mocy obliczeniowej chmury Azure. Aktualnie trwa integracja aplikacji TRAPPER m.in. z platformą Azure i wdrażanie szeroko pojętej technologii AI, w tym modelu detekcji zwierząt na zdjęciach MEGADETECTOR opracowanego przez grupę badawczą Microsoft związaną z projektem AI4EARTH pod kierunkiem Dan’a Morrisa. Pomoże ona w automatycznym klasyfikowaniu i oznaczaniu zdjęć i filmów wideo rejestrowanych przez fotopułapki. Innymi słowy sztuczna inteligencja zajmie się nie tylko odsiewaniem bezwartościowego materiału, ale także np. przypisywaniem zebranych nagrań i fotografii do określonych gatunków zwierząt. Łatwo się domyślić, że rozwiązanie to znacznie poprawi efektywność pracy naukowców, którzy w rezultacie będą mogli zająć się szczegółową analizą wartościowego materiału badawczego.
AI dla nowych obszarów badawczych
„Korzyść z wdrożenia sztucznej inteligencji do analizy danych to jednak nie tylko zwiększenie efektywności pracy badaczy czy wymierne oszczędności finansowe dla instytucji naukowej, związane z mniejszą liczbą osób potrzebnych do obsługi danego projektu badawczego. To także otwarcie przed naukowcami zupełnie nowych możliwości badawczych. W celu zbierania danych w środowisku przyrodniczym można dziś bowiem umieścić niemal nieograniczoną liczbę różnorodnych sensorów – nie tylko fotopułapki. Dotychczas nie podejmowano szerzej takich działań, gdyż kłopotliwe było właśnie odpowiednie opracowanie zgromadzonych danych. Dzięki sztucznej inteligencji staje się to jednak możliwe.” – wyjaśnia Jakub Bubnicki.
Czy zatem powinniśmy już niedługo spodziewać się lasów, łąk i rzek, w których będzie „roiło się” od różnorodnych czujników, monitorujących najdrobniejsze szczegóły dotyczące toczącego się tam życia? Czy z pomocą sztucznej inteligencji odkryjemy kolejne fascynujące tajemnice świata przyrody? Wszystko okaże się już wkrótce.