Przełomowe narzędzie dla programistów stworzyli naukowcy z Polski, Czech i Hiszpanii. Opracowane przez nich rozwiązanie pozwala budować bardziej zaawansowane, elastyczne i transparentne modele uczenia maszynowego.
Hypercomplex Keras – to biblioteka architektur sieci neuronowych opracowana przez badaczy z Politechniki Krakowskiej, Uniwersytetu Warmińsko-Mazurskiego w Olsztynie, Politechniki w Walencji i Uniwersytetu w Ostrawie. Powstała w ramach międzynarodowego projektu finansowanego przez Narodową Agencję Wymiany Akademickiej. Narzędzie pomaga nawet początkującym programistom w łatwy sposób tworzyć nowe sztuczne sieci neuronowe, oparte na liczbach hiperzespolonych.
Środowiska akademickie i naukowcy zajmujący się AI i uczeniem maszynowym mogą wykorzystać wyniki naszych badań, aby usprawnić istniejące modele, a także lepiej zrozumieć działanie sieci neuronowych – wskazuje dr Radosław Kycia z Katedry Informatyki Wydziału Informatyki i Telekomunikacji Politechniki Krakowskiej i dodaje: – Jesteśmy świadkami narodzin nowej ery w sztucznej inteligencji – ery hiperzespolonej.
Skomplikowane sieci w prostej formie
Biblioteka Hypercomplex Keras była tworzona przy wsparciu międzynarodowej społeczności deweloperów narzędzia Keras.
Keras dostarcza specjalistycznych warstw do konstrukcji sieci neuronowych. Te warstwy układane są jedna na drugiej jak klocki, tworząc skomplikowaną sieć neuronową o większych możliwościach. Nasze narzędzie jest analogiczną biblioteką, za pomocą której udostępniamy warstwy, w których neurony potrafią wykonywać operacje, ale przy użyciu dowolnej algebry hiperzespolonej. I tak, skomplikowany konstrukt jakim są sieci hiperzespolone, jest dostępny dla programisty lub technika niemającego specjalistycznej wiedzy z zakresu struktur hiperzespolonych – tłumaczy dr Radosław Kycia.
Narzędzie zaproponowane przez polskich naukowców jest odpowiedzią na potrzeby specjalistów od AI. Przed upublicznieniem biblioteki Hypercomplex Keras, wykorzystanie sieci hiperzespolonych ograniczało się do zaledwie kilku wybranych typów liczb hiperzespolonych, szczególnie czterowymiarowych, które są preferowane w przetwarzaniu obrazów. Rezultatem międzynarodowego projektu jest m.in. opracowanie nowych architektur hiperzespolonych sieci neuronowych, udostępnionych w postaci bezpłatnego i otwartego (Open Source) pakietu Hypercomplex Keras.
Biblioteka zaproponowana przez naukowców integruje się z – popularnym już wcześniej – narzędziem Keras do efektywnego tworzenia skomplikowanych, specjalistycznych warstw neuronowych pozwalających konstruować sieci neuronowe. Przede wszystkim jednak stanowi znaczne rozszerzenie znanej programistom biblioteki. Może być teraz wykorzystywana przez praktycznie każdego do tworzenia własnych, użytecznych rozwiązań AI. Co ważne, bibliotekę Hypercomplex Keras można zainstalować przez standardowy instalator pakietów dla języka programowania Python.
W innowacyjnej bibliotece zaimplementowano kilka warstw: gęstą – do ogólnego przetwarzania oraz konwolucyjne do specjalistycznego przetwarzania danych jednowymiarowych (szeregi czasowe, np. indeksy giełdowe), dwuwymiarowych (obrazy, migawki filmów) i trójwymiarowych (dane przestrzenne). Ze względu na uniwersalność rozwiązania, może być ono zastosowane do praktycznie każdego zagadnienia związanego z przetwarzaniem danych – od analizy tych finansowych, po medycynę i robotykę.
Ponieważ nasze narzędzie łatwo integruje się z biblioteką Keras, umożliwiamy badaczom i programistom z całego świata eksperymentowanie z nowymi architekturami sieci neuronowych. Jest to również istotne rozszerzenie obecnych sieci opartych na liczbach rzeczywistych. Dlatego myślę, że jesteśmy świadkami narodzin nowej ery w sztucznej inteligencji, ery hiperzespolonej – podkreśla dr Kycia.
Liczby hiperzespolone czyli jakie?
Liczby hiperzespolone, na których zasadza się biblioteka Hypercomplex Keras, są fascynującymi obiektami matematycznymi, rozszerzającymi liczby rzeczywiste.
Można je sobie wyobrazić jako pary, trójki, a nawet całe sekwencje liczb. Możemy je mnożyć w ustalony sposób, tak aby spełnione były – przynajmniej częściowo – prawa mnożenia i dodawania, znane nam z arytmetyki liczb rzeczywistych. Dzięki tym właściwościom uzyskujemy efekt, jakbyśmy do świata liczb rzeczywistych dodali nowe wymiary – tłumaczy dr Kycia.
Przykładami liczb hiperzespolonych są liczby zespolone, kwaterniony, oktoniony oraz algebry Clifforda, mające znaczenie w opisie przyrody na fundamentalnym poziomie (większa część praw fizyki).
Biblioteka Hypercomplex Keras umożliwia tworzenie sztucznych sieci neuronowych, w których wewnętrzne przetwarzanie danych odbywa się przy użyciu arytmetyki liczb hiperzespolonych (w odróżnieniu od arytmetyki liczb rzeczywistych, wykorzystywanej we wcześniejszych rozwiązaniach). Taka sieć zbudowana jest z neuronów (perceptronów), które stanowią jej podstawową jednostkę. Pobierają one sygnał zakodowany w postaci zestawu liczb (np. wzrost osób), a następnie przetwarza go wykonując mnożenie tych liczb przez wagi będące cechą charakterystyczną neuronu (wagi ustawiane są w procesie uczenia neuronu). Wynikiem mnożenia jest liczba rzeczywista (trzymając się przykładu wzrostu osób – niski lub wysoki), którą funkcja aktywacji przekształca w sygnał: pobudzenie neuronu lub brak pobudzenia. Ten model matematyczny odzwierciedla zachowanie neuronu biologicznego, choć – jak podkreślają naukowcy – jest znacznym uproszczeniem naturalnych mechanizmów.
Z perceptronów tworzy się warstwy, pozwalające zbudować skomplikowany model sieci neuronowej. Badacze, odwołując się do kulinariów, porównują sztuczną sieć neuronową do ciasta przekładańca – warstwa układana jest na warstwie. Dane podawane są na górze sieci i „przepływają” przez neurony kolejnych, niższych warstw. Końcowa warstwa zwraca wynik obliczenia.
W naszych badaniach staraliśmy się łączyć aspekty matematyczne związane z hiperzespolonymi strukturami oraz najnowsze trendy w rozwoju sieci neuronowych – podkreśla dr Agnieszka Niemczynowicz, kierowniczka projektu finansowanego przez NAWA (UWM/PK). – Chcieliśmy stworzyć nowe architektury sieci neuronowych, które mogą być definiowane dla dowolnych struktur hiperzespolonych i tym samym dać możliwość elastycznego projektowania i eksperymentowania z sieciami neuronowymi opartymi na dowolnych liczbach hiperzespolonych, dostosowując ich właściwości do konkretnych zadań w AI. Pamiętajmy, że sieci neuronowe zbudowane z wykorzystaniem liczb hiperzespolonych zyskują niesamowite możliwości i potrafią przetwarzać informacje w sposób dotychczas nieosiągalny dla tradycyjnych sieci. To z kolei otwiera drogę do tworzenia bardziej wydajnych, elastycznych i inteligentnych systemów sztucznej inteligencji.
Namacalne rezultaty
Prace polskich naukowców zaowocowały powstaniem ogólnego matematycznego języka opisu hiperzespolonych sieci neuronowych, opartego na tensorach, czyli – w języku informatyków – wielowymiarowych tablicach. Operacje na tensorach mają fundamentalne znaczenie w skomplikowanych sieciach neuronowych i są wysoce zoptymalizowane pod względem szybkości ich wykonywania. Posiadanie matematycznej struktury liczb hiperzespolonych przedstawionej w postaci tensorowej pozwala na jej zaimplementowanie w niezwykle efektywny sposób.
Jedną z dziedzin, w której sieci hiperzespolone pokazują swoją wyższość nad klasycznymi rozwiązaniami, jest analiza obrazów. Zdolność rozpoznawania wzorców na obrazach powiązana jest z liczbą parametrów ustawianych w procesie jej trenowania. Im mniejsza liczba parametrów tym trenowanie i odpowiedzi zajmują mniej czasu. Testem dla sztucznych sieci neuronowych jest np. sprawdzenie, w jaki sposób radzą sobie z rozpoznawaniem objawów chorobowych na obrazach, np. nowotworu na zdjęciach tkanki. W tego rodzaju testach sieci hiperzespolone uzyskiwały podobne rezultaty do sieci klasycznych, ale przy znacznie mniejszej liczbie parametrów.
Beneficjentami wyników naszego projektu w sposób naturalny i bezpośredni są środowiska akademickie i naukowcy zajmujący się AI i uczeniem maszynowym, czyli specjaliści, którzy mogą wykorzystać wyniki naszych badań, aby usprawnić istniejące modele i umożliwić lepsze zrozumienie sieci neuronowych. Otwiera to też nowe kierunki badań. Z kolei matematycy i teoretycy obliczeniowi mogą wykorzystać wyniki badań do opracowania nowych formalnych metod analizy i optymalizacji sieci neuronowych – wymienia dr Radosław Kycia.
Wskazuje również, że wyniki prac projektowych mogą wesprzeć specjalistów od wyjaśnialnej sztucznej inteligencji (ang. eXplainable AI, XAI), która pomaga opisać model AI, zrozumieć wynik zwracany przez AI i potencjalne błędy. Wyjaśnialna sztuczna inteligencja odgrywa również rolę w charakteryzowaniu dokładności, uczciwości i przejrzystości wyników modelu w procesach decyzyjnych opartych na sztucznej inteligencji.
Nauka w służbie społeczeństwu
Nowatorskie architektury sieci neuronowych z pewnością znajdą zastosowanie w wielu dziedzinach życia, przyczynią się do wzrostu efektywności, precyzji oraz bezpieczeństwa systemów opartych na sztucznej inteligencji. Przykłady?
W branży medycznej bardziej zaawansowane i wyjaśnialne sieci neuronowe mogą wspierać diagnostykę, personalizację terapii oraz ułatwiać analizę obrazów medycznych. W sektorze energetycznym, strategicznym dla geopolitycznego bezpieczeństwa – takie procesy jak inteligentne zarządzanie zużyciem energii, przewidywanie awarii oraz optymalizacja systemów elektroenergetycznych mogą odbywać się jeszcze sprawniej dzięki bardziej adaptacyjnym i precyzyjnym modelom. Albo sektor finansów: tu znaczenie nowych architektur sieci neuronowych dla analizy ryzyka, detekcji anomalii i automatyzacji procesów decyzyjnych jest nie do przecenienia, zwłaszcza mając na uwadze zwiększenie transparentności i interpretowalności wyników finansowych – wymienia dr Kycia.
Badacz zwraca uwagę także na agendy rządowe jako beneficjentów nowych rozwiązań. Lepsze zrozumienie działania modeli sprzyjać będzie wdrażaniu bardziej adekwatnych i odpowiedzialnych regulacji prawnych związanych z wykorzystaniem mechanizmów sztucznej inteligencji. Wreszcie – instytucje związane z cyberbezpieczeństwem będą mogły wykorzystywać nowe rozwiązania w zakresie analizy danych wywiadowczych, wykrywania zagrożeń oraz optymalizacji strategii bezpieczeństwa.
W interesie nas wszystkich jest, aby użytkownicy końcowi systemów opartych na sztucznej inteligencji zyskali dostęp do bardziej przejrzystych, sprawiedliwych i wydajnych rozwiązań. Wprowadzenie nowych architektur sieci neuronowych może zwiększyć zaufanie do AI poprzez lepsze zrozumienie mechanizmów jej działania, co ma kluczowe znaczenie w obszarach wymagających wysokiej odpowiedzialności, takich jak medycyna, prawo czy administracja publiczna. Również specjaliści z różnych dziedzin, takich jak lekarze, inżynierowie czy prawnicy, mogą korzystać z bardziej interpretowalnych systemów AI, co usprawni ich pracę i umożliwi bardziej świadome podejmowanie decyzji – dodaje naukowiec z Politechniki Krakowskiej.
Aby rezultaty projektu szybciej ujrzały światło dzienne, jego autorzy podzielili się nimi w branżowym portalu arXiv, gdzie znaleźć można artykuł opisujący matematyczne aspekty sieci hiperzespolonych oraz tekst na temat działania biblioteki Hypercomplex Keras z praktycznego punktu widzenia.
Projekt „Partnerstwa strategiczne na rzecz matematycznych aspektów zespolonych, hiperzespolonych i rozmytych sieci neuronowych” był realizowany w latach 2022–2024 w ramach współpracy: Uniwersytetu Warmińsko-Mazurskiego w Olsztynie, Politechniki Krakowskiej, Politechniki w Walencji (Hiszpania) i Uniwersytetu w Ostrawie (Czechy). Całkowita kwota dofinansowania z NAWA wyniosła ponad 852 tys. zł.
źródło: PK