W Akademickim Centrum Komputerowym Cyfronet AGH uruchomiono najszybszy w Polsce akademicki system obliczeniowy dedykowany dla potrzeb sztucznej inteligencji o mocy ponad 4 Pflops (petaflopsów). Nowa infrastruktura została dołączona do Prometheusa, największego polskiego superkomputera, dzięki czemu możliwe jest wzbogacenie tradycyjnych symulacji o metody oparte o uczenie maszynowe prowadzone w tym samym środowisku obliczeniowym i na wspólnych zbiorach danych.
Nowy system zbudowany jest z czterech serwerów HPE Apollo 6500, z których każdy wyposażony jest w dwa procesory Intel Xeon Gold 5220, osiem akceleratorów NVIDIA Tesla V100 oraz 384 GB pamięci operacyjnej. System posiada moc obliczeniową ponad 4 Pflops (petaflopsów) dla operacji tensorowych i 256 TFLOPS (teraflopsów) dla standardowych obliczeń wykonywanych na liczbach podwójnej precyzji, co czyni go najszybszym dedykowanym rozwiązaniem dla sztucznej inteligencji dostępnym dla potrzeb nauki w Polsce.
Zastosowane akceleratory NVIDIA Tesla V100 występują w postaci modułów wykorzystujących specjalizowany interfejs SXM2, w zastępstwie tradycyjnego złącza PCI Express, co umożliwia zastosowanie magistrali NVLINK oferującej przepustowość do 300 GB/s. Każdy moduł dysponuje wysokowydajną pamięcią HBM2 o pojemności 32 GB i przepustowości 900 GB/s. Serwery zostały połączone siecią Infiniband o prędkości 400 Gb/s i dołączone do istniejącej infrastruktury Prometheusa. Dzięki temu mogą korzystać z ponad 10 PB pamięci dyskowej, oferującej prędkość dostępu na poziomie 180 GB/s, co jest szczególnie istotne dla uzyskania najwyższej wydajności uczenia maszynowego. Nowa infrastruktura umożliwi prowadzenie badań z wykorzystaniem metod sztucznej inteligencji, które mogą być także użyte do wzbogacenia prac badawczych prowadzonych w oparciu o symulacje HPC (high performance computing).
Cyfronet AGH realizuje obecnie szereg projektów wykorzystujących metody sztucznej inteligencji w różnych dziedzinach. Przykładem mogą być obliczenia w diagnostyce medycznej, gdzie automatyczne rozpoznawanie obrazów stosuje się do klasyfikacji zdjęć z mikroskopów, w celu określenia typów przeciwciał obecnych w próbkach krwi pobranych od pacjentów, oraz zastosowanie technik uczenia maszynowego do pozyskania brakujących informacji medycznych o konkretnym przypadku leczenia, w warunkach niedostatecznych, lub sprzecznych, danych szpitalnych. System będzie służył do badań w zakresie chemii, biologii, medycyny oraz rozwoju algorytmów dla autonomicznych pojazdów. System został oddany do użytku w grudniu tego roku i jest dostępny za pośrednictwem infrastruktury PLGrid.
źródło: AGH