AI odkrywa przeszłość
Prace na stanowisku archeologicznym. Biskupice k. Wieliczki, 2020 r.
Fot. Marek Lasyk / Reporter
Wywiady

AI odkrywa przeszłość

Czy sztuczna inteligencja zmieni oblicze archeologii i sposób, w jaki chronimy nasze dziedzictwo kulturowe? Rozmowa z dr Michałem Jakubczakiem z Instytutu Archeologii i Etnologii Polskiej Akademii Nauk o automatycznym mapowaniu stanowisk archeologicznych.

Powszechnie myślimy o archeologii w kontekście spektakularnych odkryć – starych monet, tajemniczych kopców czy kurhanów. Tymczasem nowoczesna archeologia zdaje się zyskiwać coraz więcej, dzięki rozwojowi technologii, a w szczególności dzięki sztucznej inteligencji. W jaki sposób AI wspomaga badania archeologiczne?

Sztuczna inteligencja to przełomowe narzędzie także dla archeologii. Możliwości jest nieskończoność.

Największym zyskiem, który uzyskujemy dzięki sztucznej inteligencji, jest szybkość przetwarzania danych. W archeologii, czy w ogóle w dziedzictwie kulturowym, ilość danych, które generujemy różnymi metodami, jest przeogromna. Dzięki AI jest możliwe przyspieszenie i usprawnienie analizy danych, co jest niezwykle przydatne, zwłaszcza gdy mamy do czynienia z dużymi zbiorami informacji. Analizowanie tego typu informacji ręcznie zajmuje nam tygodnie lub wręcz miesiące pracy. Właśnie tutaj pojawia się AI, która poprzez uczenie maszynowe może uczyć się wzorców.

Fot. M. Jakubczak
AI odkrywa przeszłość
Jeden z kurhanów znalezionych z użyciem sieci

Projekt, nad którym pracuje pan razem z zespołem, dotyczy rozpoznawania obiektów archeologicznych, takich jak kurhany, na podstawie danych z lotniczych skanów. Czym dokładnie jest uczenie maszynowe i jak wygląda proces uczenia takiej sztucznej inteligencji?

Dokładnie to zajmujemy się obecnie sieciami neuronowymi. Uczenie maszynowe pozwala nam nauczyć program szukania wzorców na podstawie przykładów, które mu pokazujemy. Dzięki temu, pokazując odpowiednią liczbę kopców na obrazach z lotniczego skaningu laserowego LiDAR, możemy nauczyć sieć neuronową znajdowania takich samych lub wystarczająco podobnych obiektów.

Uczenie maszynowe umożliwia programowi rozpoznawanie wzorców, opierając się na tysiącach przykładów, które mu pokażemy. Wymaga to tytanicznej pracy ze strony naukowca.

Musimy mieć wystarczająco dobrej jakości dane i odpowiednią liczbę anotacji, czyli zaznaczonych obiektów, tak aby sieć neuronowa mogła się tego uczyć. Na przykład jeśli chcemy, by AI rozpoznawała kurhany na obrazach ze skaningu laserowego, musimy najpierw ręcznie oznaczyć takie obiekty na setkach czy tysiącach obrazów, aby program mógł rozpoznawać podobne struktury. Proces opisu i przygotowania danych bywa bardzo czasochłonny i wymaga precyzji. Zawsze trzeba zadać sobie pytanie, czy taka inwestycja czasu się opłaca. Sam proces bywa znacznie bardziej czasochłonny niż realna praca algorytmów. Trzeba także pamiętać, że

sieci neuronowe, nie działają twórczo. Nie jest tak, że sieć neuronowa potrafi robić rzeczy, których nie umie człowiek.

Ona jest w stanie zrobić dużo szybciej pracę, którą my jesteśmy w stanie zrobić ręcznie, ale nie osiąga wyższej precyzji niż człowiek, który wykonywał anotacje. To niesamowicie skuteczne narzędzie, ale bardzo wymagające, jeśli chodzi o ilość wysokiej jakości danych i anotacji.

Oprac. M. Leloch
AI odkrywa przeszłość
Graf przedstawiający schemat prac nad sieciami neuronowymi

To właśnie ilość i jakość danych jest największym wyzwaniem?

Tak. Aby algorytmy działały skutecznie, muszą mieć dostęp do ogromnej liczby przykładów o jednolitej jakości. Tymczasem w archeologii często dane pochodzą z różnych okresów, różna była metodyka ich pozyskania i już samo ich ujednolicanie jest bardzo pracochłonne. To trochę tak, jakbyśmy mieli ogromne archiwa pełne danych zebranych przy użyciu różnych metod, ale wszystkie trzeba uporządkować, zanim będzie można ich skutecznie użyć. Na same przygotowanie danych potrzeba często tygodni mozolnej pracy. Dla porównania, w przypadku naszego projektu gdy AI miała już przygotowane dane, była w stanie przeszukać teren Polski w ciągu zaledwie kilku dni, a i to tylko przez nasze ograniczenia sprzętowe. Dysponując mocniejszymi komputerami moglibyśmy zrobić to w kilka godzin.

Kiedy pracowaliście nad tym algorytmem wykrywania kurhanów, jak przebiegało testowanie?

Wzięliśmy fragment Lubelszczyzny, a dokładnie Kotlinę Hrubieszowską, Grzędę Sokalską i Równinę Bełską. Przejrzałem ten obszar dwukrotnie, znalazłem i ręcznie zaznaczyłem wszystkie kurhany widoczne na danych LiDAR. Następnie wykorzystaliśmy stworzony wcześniej model sieci neuronowej U-net do sprawdzenia tego obszaru czyli około dwóch tysięcy kilometrów kwadratowych.

Oprac. M. Jakubczak
AI odkrywa przeszłość
Położenie obszarów do nauki, walidacji i testowania

Ja znalazłem około 480 kopców, natomiast sieć neuronowa znalazła mniej więcej
80 % z nich, a także nieco ponad
100 obiektów zaznaczyła błędnie jako kopce.

Ale co ciekawe, odnalazła kilka kurhanów, których ja nie znalazłem, a powtórzę, prześledziłem dokładnie obszar kilkakrotnie. Czyli wskaźnik F1 wyniósł 75% – jest to wartość służąca do oceny jakości danych. To bardzo obiecujące wyniki.

1. Oprac. M. Jakubczak
2. Oprac. M. Jakubczak
AI odkrywa przeszłość
AI odkrywa przeszłość
Obszar testowy z częścią znalezionych przez sieć neuronową kurhanów (slajd pierwszy); zbliżenie – przykłady znalezionych obiektów (slajd drugi)

Jak dużo w tej pracy jest archeologii, a jak dużo IT?

Jest to narzędzie coraz prostsze w obsłudze, jednak wciąż nie na tyle, żeby zrobił to ktoś bez doświadczenia.

Wiele osób patrzy na sztuczną inteligencję przez pryzmat wielkich modeli językowych jak choćby ChatGPT, który jest nieco odmiennym tworem od tego, czego my używamy.

Uczenie maszynowe nie działa na zasadzie prostego wklepania komendy. Trzeba mieć podstawową wiedzę z programowania i obsługi systemu, a więc współpraca ze specjalistami z dziedziny IT jest nieodzowna.

Wróćmy do LIDAR. Czym dokładnie jest? Kto ma dostęp do tych danych?

Od 2010 roku rozpoczął się w Polsce projekt o nazwie ISOK. Był to projekt związany z działaniami przeciwpowodziowymi i polegał na skanowaniu dolin największych rzek w celach przeciwpowodziowych. W ramach tego programu aktualnie mamy zeskanowaną całą Polskę z użyciem LiDAR, czyli lotniczego skaningu laserowego. Oczywiście wykorzystując lotnicze skanowanie laserowe, możemy znaleźć tylko obiekty widoczne w rzeźbie powierzchni terenu. Jednak jeśli wykorzystamy na przykład zdjęcia lotnicze czy satelitarne, które potrafią pokazywać struktury pod ziemią, AI może zostać wykorzystana do poszukiwań także stanowisk bez zachowanej rzeźby.

To znaczy, że dane są dostępne dla każdego?

Dane pomiarowe LiDAR i cieniowany model terenu są dostępne zupełnie za darmo dla wszystkich.

Można na stronie Geoportal.gov.pl podejrzeć cieniowany numeryczny model terenu, czyli podstawową pochodną tego projektu. Jeśli ktoś zajmuje się tym głębiej, może pobrać dane w formie chmury punktów i przeanalizować je dokładniej. Jest to świetna baza i początek. Nie należy jednak popadać w pułapkę zachwytu, bo oczywiście nie wyczerpuje to możliwości skaningu laserowego. Jesteśmy na pewnym etapie, wyniki są świetne, ale to nie koniec. Kilka lat temu brałem w projekcie związanym z analizą Puszczy Białowieskiej. Powtórne skanowanie w znacznie wyższej rozdzielczości pozwoliło znaleźć znacząco więcej stanowisk archeologicznych, zupełnie niewidocznych na danych z programu ISOK.

Chcesz być na bieżąco z przeszłością?

Podanie adresu e-mail i kliknięcie przycisku “Zapisz się do newslettera!” jest jednoznaczne z wyrażeniem zgody na wysyłanie na podany adres e-mail newslettera Narodowego Instytutu Konserwacji Zabytków w Warszawie zawierającego informacje o wydarzeniach i projektach organizowanych przez NIKZ. Dane osobowe w zakresie adresu e-mail są przetwarzane zgodnie z zasadami i warunkami określonymi w Polityce prywatności.

Czy usprawniając swój projekt, korzystacie z doświadczenia naukowców w innych krajach?

Oczywiście, znamy się i współpracujemy. Zorganizowaliśmy w Rzymie sesję na konferencji, gdzie zebrała się większość osób zajmujących się tematem sieci neuronowych w archeologii. W każdym kraju są już badacze patrzący w tę stronę, chociaż większość środowiska nadal jest na etapie opracowywania standardów metodologicznych. Publikacji naukowych opisujących skuteczne zastosowanie tych technologii w archeologii nie ma aż tak wiele, jak mogłoby się wydawać. Niewiele jest jeszcze prac pokazujących praktyczne zastosowanie tej technologii na dużą skalę. To pokazuje, że mimo potencjału, praca z AI w tej dziedzinie wciąż jest wyzwaniem. Wyniki wszędzie są obiecujące. Wszyscy jednak mierzymy się z tym samym wyzwaniem – finansowaniem i ilością pracy potrzebną choćby do wprowadzania i anotowania danych.

A może łatwiej i taniej byłoby stworzyć jeden system dla na przykład krajów Unii Europejskiej?

Na obecnym etapie technologicznym nie wydaje się to możliwe, zawsze napotykamy jakieś różnice regionalne. Kurhany w Polsce różnią się nieco od tych w Niemczech czy Francji, a AI najlepiej działa na jednolitych danych. Na dodatek różnice w topografii terenu sprawiają, że modele AI działają różnie w zależności od regionu. Nasz model w Polsce Wschodniej rozpoznaje kopce bardzo skutecznie, ale na Pomorzu lub Śląsku radzi sobie gorzej, ponieważ dane z tych terenów nie mamy wielu anotacji. W idealnym świecie każdy kraj miałby zespół archiwizujący i analizujący te dane na bieżąco, ale rzeczywistość naukowa bywa bardziej skomplikowana.

Oprac. M. Jakubczak
AI odkrywa przeszłość
Przykłady kopców i transzei znalezionych przez sieć neuronową

A co z możliwością komercjalizacji AI w archeologii? Czy jest szansa, aby rozwój tej technologii był dochodowy?

To trudne pytanie. W archeologii trudno mówić o komercjalizacji danych czy odkryć, gdyż dotyczą one ochrony dziedzictwa i powinny trafiać do konserwatorów, środowiska naukowego i pasjonatów. Byłoby nieetyczne, gdybyśmy takie rozwiązania trzymali dla siebie, a potem sprzedawali. Natomiast w innych sektorach, takich jak analiza danych dla farm fotowoltaicznych czy automatyczne wykrywanie defektów, AI jest komercjalizowana na dużą skalę i przynosi zyski. Jednym z bardziej zaawansowanych sektorów jest medycyna, zwłaszcza analiza tomografii komputerowych w diagnostyce nowotworów – to dziedziny, gdzie AI przynosi wymierne korzyści i znajduje szerokie zastosowanie.

Jakie widzi Pan potencjalne przyszłe zastosowania AI w ochronie dziedzictwa?

Możliwości są szerokie i wciąż pojawiają się nowe.

AI mogłaby na przykład monitorować stan zachowania zabytków na przestrzeni lat i wskazywać, które wymagają dodatkowej ochrony lub badań ratunkowych.

Można ją wykorzystać w eksploracji tekstu, co umożliwia dokładniejszą i szybszą kwerendę źródeł pisanych. Możemy używać jej do rozpoznawania zabytków, budowania typologii czy w badaniach traseologicznych. AI w archeologii ma szansę zmienić sposób, w jaki chronimy i rozumiemy nasze dziedzictwo. Już jest wykorzystywana w celu sprawdzania, poszukiwania podobieństw, na przykład wyszukiwania podobnych dzieł sztuki lub poszukiwania zaginionych. Dzięki niej możemy szybko przeszukiwać duże ilości danych. Nietrudno sobie wyobrazić algorytm, który po zdjęciu monitoruje aukcje dzieł sztuki na całym świecie. Dobrym przykładem jest wykorzystanie w numizmatyce do rozpoznawania monet, ponieważ AI jest bardzo wrażliwa na drobne różnice i można ją tak wyszkolić, by to na nich się skupiała. Istnieje cała gałąź SI zwana text mining, która dąży do budowania systemów zdolnych rozpoznawać kontekst danych zdań i słów, a nie tylko ich proste znaczenie semantyczne. To metoda pozwalająca nie tylko archiwizować teksty, ale także analizować te  danych.

Fot. Henryk Zgiet / KURIER PORANNY / GAZETA WSPOLCZESNA / POLSKA PRESS
AI odkrywa przeszłość
Wykopaliska archeologiczne w Supraślu, 2017 r.

Na koniec pytanie, które spędza sen z powiek pracownikom każdej branży. Czy AI nie zabierze archeologom pracy?

To bardzo częste pytanie, ale nie martwiłbym się o to. W nauce, a szczególnie w archeologii, nie widzę takiego zagrożenia. Odrzucanie sztucznej inteligencji nic nam nie da, bo świat jest skazany na rozwój tej  technologii. Ale trzeba pamiętać, że

sieć nie wie  więcej niż to, co człowiek który ją programował.

Może być lepsza w wyszukiwaniu wzorców, szybsza w przetwarzaniu danych, ale zawsze musi być człowiek, który zadaje odpowiednie pytania i zinterpretuje wyniki. Nie obawiam się o pracę archeologów.

Fot. Paweł F. Matysiak / POLSKA PRESS
AI odkrywa przeszłość
Wykopaliska archeologiczne na Placu Kolegiackim w Poznaniu, 2018 r.

Agata Jankowska

Dziennikarka, reportażystka, autorka książek, prelegentka i panelistka. Specjalizuje się w tematach społecznych, biznesowych, ekonomicznych i psychologicznych. Publikowała w tygodniku Przekrój i magazynie Wysokie Obcasy. Przez lata związana z działem społecznym tygodnika Wprost. Obecnie pisze do magazynu Forbes Woman i publikuje w magazynie Elle. Jest autorką książek: “Męskie sprawy. Życie, seks i cała reszta” (Świat Książki), “In vitro. Rozmowy intymne” (Pruszyński. Sp. z.o.o.), “ Hajland. Jak ćpają nasze dzieci”(Wielka Litera). Nominowana do nagrody Grand Press i do nagrody Korony Równości.

Popularne

17 pudeł chaosu albo zaskakująco współczesna wrażliwość

Oryginalny i odświeżający widzenie XX-wiecznej fotografii dorobek Danuty Rago został niedawno przywołany wystawą „Fabryka Złudzeń” przez Fundację Archeologia Fotografii. Digitalizowane przez FAF archiwum udowadnia, że zapomniana fotoreporterka potrafiła z artystycznym zmysłem tworzyć zarówno pierwsze sesje reklamowe, ciekawą estetycznie dokumentację industrializacji,...