Wokół nauki
01 Grudnia
Rys. Sławomir Makal
Opublikowano: 2022-12-01

Zasoby naukowe w internecie

W niniejszym artykule przedstawiona jest wstępna typologia zasobów naukowych w internecie, zilustrowana wybranymi przykładami, uzupełniona o wskazówki dotyczące wyszukiwania informacji. Pojawia się także krótki komentarz dotyczący jakości omawianych zasobów.

Zasoby naukowe w internecie często kojarzone są wyłącznie z publikacjami naukowymi dostępnymi online, jednak zjawisko to i zagadnienie są znacznie szersze, wielowymiarowe, a także interdyscyplinarne. Problematyka obejmuje m.in. definicję, charakterystykę i kategoryzację/typologię takich zasobów, ich rolę i faktyczne wykorzystanie we współczesnej nauce, szeroko rozumiane zarządzanie nimi, ocenę jakości danych, informacji i wiedzy. Ważna jest też kwestia pozyskiwania treści naukowych z sieci, zwłaszcza pozyskiwania efektywnego, czyli takiego, które prowadzi do zaspokojenia potrzeb informacyjnych naukowców, doktorantów, studentów, biznesu, urzędników i innych zainteresowanych grup, także w kontekście kompetencji i zachowań informacyjnych tych osób. Namysłu wymagają również dylematy otwartego dostępu do zasobów naukowych różnego typu, z uwzględnieniem argumentów za i przeciw, aspektów organizacyjnych, politycznych, technicznych, trendów nauki współczesnej (np. nauka obywatelska), a nawet praw człowieka. To, rzecz jasna, nie jest kompletny wykaz wszystkich możliwych pytań związanych z zasobami naukowymi w sieci. Widać jednak, że całościowe i pogłębione ujęcie tej problematyki wymagałoby raczej obszernej monografii, a także odwołania się do dorobku wielu dyscyplin, w tym nauk o komunikacji społecznej i mediach, w szczególności informatologii i zarządzania informacją, naukoznawstwa i filozofii nauki, informatyki, prawa, osiągnięć praktyki bibliotekarskiej, polityki naukowej i wielu innych. W niniejszym artykule przedstawiony jest zatem jedynie niewielki wycinek wskazanego zagadnienia, mianowicie wstępna typologia zasobów naukowych w internecie, zilustrowana wybranymi przykładami, uzupełniona o wskazówki dotyczące wyszukiwania informacji. Pojawia się także krótki komentarz dotyczący jakości omawianych zasobów.

Definicja i typologia zasobów naukowych w internecie

Zasoby (treści) naukowe w internecie można roboczo określić jako zasoby zapisanej (albo może lepiej: utrwalonej na nośnikach cyfrowych) wiedzy naukowej oraz zasoby wspomagające badania i rozwój nauki (a dokładniej: powstałe celowo, by takie wsparcie oferować) dostępne online. Oczywiście definicja zasobów naukowych zależy także od sposobu rozumienia terminów „nauka”, „naukowy” i „wiedza”, a to otwiera bardzo szeroki wachlarz zagadnień o charakterze naukoznawczym, filozoficznym, epistemologicznym etc., które nie będą tutaj poruszane. W sieci funkcjonują też materiały popularnonaukowe, edukacyjne i związane ze szkolnictwem wyższym, często powiązane z zasobami naukowymi, dlatego również do nich warto się, przynajmniej częściowo, odnieść.

Do zasobów naukowych nie zaliczymy natomiast danych publicznych, statystyk i wykazów urzędowych, jak Bank Danych Lokalnych (https://bdl.stat.gov.pl/bdl/start), Eurostat https://ec.europa.eu/eurostat) czy Rejestr Szkół i Placówek Oświatowych (https://rspo.gov.pl/). Oczywiście mogą one stanowić materiał badawczy do analizy, ale na podobnej zasadzie jak właściwie wszystko, co znajduje się w internecie.

Typologii zasobów naukowych online można dokonać posługując się różnymi kryteriami. Jednym z nich jest rodzaj dostępu, który zasadniczo może być otwarty bądź restrykcyjny, występują także stany pośrednie. Otwarty dostęp (Open Access), obecnie mocno promowany, oznacza powszechny, trwały i wolny dostęp do treści naukowych i edukacyjnych online. Dostęp restrykcyjny, czyli jakoś ograniczony, może dotyczyć zasobów płatnych albo przeznaczonych wyłącznie dla określonych grup użytkowników.

Kolejne kryterium stanowi stopień przetworzenia informacji (wiedzy). Wyróżnić można źródła o charakterze pierwotnym (ang. primary), np. zbiory „surowych” danych badawczych (zob. dalej); opracowania (ang. secondary), jak artykuły, encyklopedie, np. Powszechna Encyklopedia Filozofii (http://ptta.pl/pef/), słowniki; oraz źródła „trzeciego rzędu” (ang. tertiary), skierowujące, odsyłające do istniejących publikacji, jak bibliografie, katalogi bibliotek akademickich, np. NUKAT (http://katalog.nukat.edu.pl/), przewodniki dziedzinowe (ang. subject gateways), np. BazTOL Polskie zasoby sieciowe z zakresu nauk technicznych (http://baztol.library.put.poznan.pl/baztol/pl/baztol.html).

Przedstawiona dalej wstępna typologia opiera się z kolei na połączonych kryteriach zawartości informacyjnej oraz funkcji określonych zasobów naukowych. Te ostatnie można „z grubsza” podzielić na: publikacje naukowe (także popularnonaukowe i edukacyjne) oraz ich kolekcje – archiwa, bazy, biblioteki cyfrowe, repozytoria, naukowe serwisy wyszukiwawcze, ogólne i specjalistyczne, w tym m.in. katalogi i wykazy, np. Open DOAR (https://v2.sherpa.ac.uk/opendoar/) oraz wyszukiwarki naukowe różnego typu, zbiory danych badawczych (materiału empirycznego), akademickie/naukowe portale społecznościowe, serwisy metodologiczne i narzędziowe, serwisy związane z organizacją i zarządzaniem nauką, źródła informacji o naukowcach i nauczycielach akademickich.

Publikacje naukowe, ich kolekcje oraz wyszukiwanie

Tradycyjnie publikacje naukowe przybierają postać opracowań, tekstów różnego typu, jak artykuły w czasopismach naukowych, książki: monografie i prace zbiorowe, w tym materiały konferencyjne, raporty z badań, dysertacje na stopień, opracowane materiały źródłowe, a także podręczniki, poradniki i wydawnictwa informacyjne (bibliografie, encyklopedie, słowniki). Wszystkie te kategorie, powstałe w czasach druku, funkcjonują również w internecie. W sieci istnieją ponadto inne, nowe formy: blogi naukowe, grupy dyskusyjne, prezentacje konferencyjne i dydaktyczne, filmy – nagrane wykłady lub wystąpienia konferencyjne, wywiady, serwisy bieżących wiadomości naukowych, podkasty, webinaria. Czy są to też publikacje naukowe, czy „jedynie” popularnonaukowe? Większość wymienionych nowych form zapewne należy uznać za popularnonaukowe (nie są recenzowane), aczkolwiek nasuwają się tutaj pewne wątpliwości. Powiedzmy, wykład znanego uczonego dostępny na YouTube ma prawdopodobnie większą wartość poznawczą niż przyczynkarski list do redakcji. Rzecz pozostaje zatem do dyskusji. Ma też wymiar praktyczny, np. co wolno cytować, a czego nie w pracach magisterskich i doktorskich, i jak to robić.

Kolekcje publikacji naukowych online mogą mieć formę archiwów dziedzinowych, czasopism elektronicznych, pełnotekstowych baz danych, repozytoriów instytucjonalnych, zwłaszcza uczelnianych, zbiorów prac na prywatnych stronach naukowców. Czasami wchodzą też w skład bibliotek cyfrowych.

Komercyjne systemy informacyjne o publikacjach naukowych, tworzone przez różnych wydawców, jak bazy EBSCO, JSTOR, Sage, Scopus, Springer, Wiley, Web of Science i wiele innych, generalnie obecnie są dostępne w sposób mniej lub bardziej restrykcyjny, czyli dla uprawnionych osób (czytelników, pracowników, studentów) przez witryny bibliotek akademickich. Z reguły wyszukiwanie w nich daje wysoce relewantne rezultaty w odniesieniu do publikacji światowych, w języku angielskim, z polskimi różnie bywa i zależy też od uprawianej dyscypliny.

W odniesieniu do publikacji w wolnym dostępie warto zwrócić uwagę na różny ich status, w sieci znajdziemy nie tylko recenzowane pełnotekstowe czasopisma naukowe, ale także np. preprinty, czyli wersje autorskie prac, przed procesem redakcyjnym.

Najpopularniejszą i czasami jedyną używaną wyszukiwarką publikacji naukowych (nie zasobów naukowych w ogóle) jest Google Scholar (https://scholar.google.com/). Należy jednak pamiętać, że indeksuje ona nie wszystkie istniejące opracowania, ponadto nie wszystkie odnalezione publikacje są w otwartym dostępie (brakuje pełnych tekstów), często też jest za dużo rezultatów, w tym „śmieci” różnego typu. Ten ostatni problem można częściowo rozwiązać poprzez oferowane przez wyszukiwarkę narzędzia, o których wielu użytkowników nie wie, jak operatory boolowskie, cudzysłów, komendy (author, filetype, intitle, site, source i inne), formularz szukania zaawansowanego, funkcje „Cytowane przez” i „Powiązane artykuły”. Warto jednak, dla porównania i uzupełnienia, skorzystać także z innych globalnych wyszukiwarek publikacji naukowych i nie tylko, jak indeksująca ponad 300 milionów dokumentów z prawie 1000 źródeł BASE Biefeld Academic Search Engine (https://lab.base-search.net/), CORE (https://core.ac.uk/) oferująca ponad 207 milionów pełnotekstowych prac naukowych z całego świata w wolnym dostępie, Semantic Scholar (https://www.semanticscholar.org/) obejmujący ponad 206 milionów prac ze wszystkich dziedzin nauki, DOAB Directory of Open Access Books (https://www.doabooks.org/) czy DOAJ Directory of Open Access Journals (https://doaj.org/). Publikacje naukowe można też odnaleźć, używając wyszukiwarki specjalistycznej Google Książki (https://books.google.pl/), która wprawdzie nie ma charakteru akademickiego, oferuje jednak pełny lub częściowy dostęp do bardzo wielu tekstów naukowych.

Publikacje naukowe możemy znaleźć również w bibliotekach cyfrowych, jak POLONA (https://polona.pl/) oraz Europeana (https://www.europeana.eu/pl), a także poprzez wyszukiwarkę FBC (https://fbc.pionier.net.pl/), chociaż generalnie nie są to poświęcone nauce serwisy. Rezultaty badań wspieranych przez fundusze i programy europejskie zawarte są w ogólnodostępnej bazie CORDIS (https://cordis.europa.eu/).

Oprócz wymienionych serwisów wyszukiwawczych ogólnonaukowych istnieją również specjalistyczne, np. dotyczące poszczególnych dziedzin wiedzy, jak ArXiv (https://arxiv.org/ – fizyka, matematyka, ekonomia), PhilSci Archive (http://philsci-archive.pitt.edu/ – filozofia nauki), PubMed (https://pubmed.ncbi.nlm.nih.gov/ – medycyna, biologia, biotechnologia) czy Medioteka (http://medioteka.uw.edu.pl/dlibra – nauki o komunikacji społecznej i mediach).

Wskazane tu narzędzia i sposoby odnajdywania pełnych tekstów publikacji naukowych stanowią oczywiście pewien wybór, istnieją inne jeszcze podejścia i techniki, np. wykorzystanie serwisu Internet Archive Wayback Machine (https://archive.org/web/) do zlokalizowania materiałów (nie tylko publikacji), które zniknęły z bieżącej sieci.

Dane badawcze i ich zbiory

Dane badawcze mają charakter empiryczny, stanowią materiał pierwotny, źródłowy, będący podstawą do dalszych analiz i dociekań. Wśród nich można wyróżnić tzw. dane wywołane, czyli oryginalne materiały wytworzone w ramach jakiegoś przedsięwzięcia badawczego, np. ankiety wypełnione przez respondentów albo nagrania odgłosów wielorybów, oraz dane niewywołane, czyli już jakoś wcześniej istniejące, ale wyszukane i celowo zgromadzone na potrzeby konkretnego projektu naukowego, np. wpisy w portalach społecznościowych albo regulaminy korzystania z bibliotek. Wedle innego podziału wyodrębnia się tzw. dane surowe, nieprzeanalizowane, uzyskane bezpośrednio w wyniku zastosowania konkretnych narzędzi badawczych, oraz dane przetworzone w większym lub mniejszym stopniu. Warto zaznaczyć na marginesie, że „surowe dane” to jednak pewna metafora, w wyniku rozważań filozofii nauki wiemy, że „czyste”, całkowicie nieprzetworzone dane nie istnieją. Dane badawcze należy odróżnić od danych publicznych.

Dane badawcze mogą mieć postać liczbową, tekstową, graficzną, dźwiękową, multimedialną, cyfrową i tradycyjną, ilościową (np. wyniki pomiarów różnego typu), jakościową (np. rysunki sporządzone przez badanych) lub mieszaną. Powstają w wyniku zastosowania różnorodnych technik badawczych, funkcjonują we wszystkich dziedzinach wiedzy, są wykorzystywane jako uzasadnienie w procesie dociekań oraz uznawane przez społeczność naukową za niezbędne do oceny rezultatów badań.

Obecnie prowadzona jest polityka otwartego (lub częściowo otwartego) dostępu do danych badawczych, zarówno w Polsce, jak i na świecie, publiczny dostęp do nich często jest warunkiem koniecznym przyjęcia artykułu do publikacji w wiodących czasopismach naukowych lub uzyskania finansowania badań, a sprawę regulują odpowiednie przepisy i wytyczne. Argumentów za takim podejściem jest wiele, m.in. umożliwia to powtórne wykorzystanie raz zgromadzonych danych, a także zwiększa intersubiektywną sprawdzalność ustaleń naukowych, co generalnie jest warunkiem naukowości. Rzecz jasna zagadnienie to jest wieloaspektowe, doczekało się też bogatej literatury przedmiotu, jest sporo kwestii trudnych i dyskusyjnych i to pod wieloma względami, jednak w tym krótkim artykule nie ma miejsca do podjęcia takich rozważań.

W efekcie w internecie znajdują się liczne kolekcje danych badawczych w postaci baz i repozytoriów, w tym prowadzone przez uczelnie, ich konsorcja lub inne placówki naukowe, np. RepOD (https://repod.icm.edu.pl/), RDS Repozytorium Danych Społecznych (https://rds.icm.edu.pl/), Harvard Dataverse (https://dataverse.harvard.edu/), organizacje komercyjne, np. Mendeley Data (https://data.mendeley.com/ – Elsevier Inc.) lub instytucje/programy rządowe, np. UK Data Service (https://ukdataservice.ac.uk/).

Wyszukiwanie danych badawczych i ich zbiorów umożliwiają serwisy wyszukiwawcze różnego typu, m.in.:

Warto zaznaczyć, że dotarcie do konkretnego zbioru danych badawczych często wymaga postępowania wieloetapowego, czyli najpierw odnalezienia odpowiedniego repozytorium, a następnie potrzebnej kolekcji w tym repozytorium.

Inny rodzaj dostępu do danych badawczych oferują tzw. data journals, czyli czasopisma poświęcone informowaniu o takich danych, np. Data in Brief (https://www.journals.elsevier.com/data-in-brief) albo Journal of Open Archeology Data (https://openarchaeologydata.metajnl.com/).

Akademickie portale społecznościowe

Akademickie/naukowe portale społecznościowe nie są klasycznymi, „oficjalnymi” źródłami informacji o publikacjach, tym niemniej bywają bardzo przydatne, a ich potencjał dla rozwoju badań i komunikacji naukowej jest spory. Służą do samopublikacji opracowań naukowych (artykuły, książki, rozprawy), dydaktycznych (infografiki, podręczniki, prezentacje) oraz zbiorów danych badawczych, zgodnie z tzw. zieloną drogą Open Access. Można też zwrócić się do autora/autorki o przesłanie pełnego tekstu w przypadku jego braku. Po drugie, sprzyjają nawiązywaniu kontaktów, dyskusji z innymi badaczami, promowaniu projektów badawczych, a także oferowaniu i poszukiwaniu pracy.

Do znanych akademickich portali społecznościowych należą istniejące od ponad 10 lat Academia.edu (https://www.academia.edu/ – ponad 186 mln użytkowników), ResearchGate (https://www.researchgate.net/ – ponad 20 mln użytkowników) oraz wspomniany już Figshare (https://figshare.com/).

Serwisy metodologiczne i narzędziowe

W tej kategorii umieszczone są portale dotyczące metod i technik badawczych, przydatnego oprogramowania, terminologii, tłumaczeń etc. Oto kilka interesujących przykładów.

Academic Phrasebank (https://www.phrasebank.manchester.ac.uk/) zawiera obszerny, uporządkowany wykaz porad, wyrażeń i zwrotów przydatnych każdemu, kto pisze tekst naukowy w języku angielskim. Witryny Methodspace (https://www.methodspace.com/) oraz National Centre for Research Methods (https://www.ncrm.ac.uk/) poświęcone są metodologii badań, w szczególności w naukach społecznych. Oferują artykuły, filmy, porady, webinaria, wykazy publikacji metodologicznych etc. w wolnym dostępie. Strony własne producentów przynoszą informacje o różnorodnym oprogramowaniu przydatnym w badaniach naukowych. Serwisy bibliotek akademickich informują o bibliometrii, cytowaniach i punktowej ocenie publikacji naukowych (np. Biblioteka Jagiellońska – Usługi bibliometryczne https://bj.uj.edu.pl/dzialalnosc/projekty/bibliometria).

Serwisy związane z organizacją i zarządzaniem nauką oraz o ludziach nauki

Osobną grupę stanowią serwisy związane z organizacją i szeroko rozumianym zarządzaniem nauką i szkolnictwem wyższym. Jest ich obecnie wiele, zarówno polskich, jak i zagranicznych, w tym unijnych.

Kompleksową informację we wskazanym zakresie oferują w Polsce zintegrowane systemy POL-on (https://polon.nauka.gov.pl/) oraz zawierający analizy i raporty RAD-on (https://radon.nauka.gov.pl/). Różnorodne dane dotyczące finansowania działalności naukowej, edukacyjnej i wdrożeniowej, funduszy, konkursów, programów, projektów etc. znajdziemy przede wszystkim na oficjalnych stronach rządowych, np. Narodowego Centrum Badań i Rozwoju (https://www.gov.pl/web/ncbr) czy Narodowego Centrum Nauki (ncn.gov.pl), a także w serwisach Unii Europejskiej, np. Research and Innovation – Finansowanie (https://ec.europa.eu/info/research-and-innovation/funding_pl), oraz organizacji pozarządowych, np. Fundacji na rzecz Nauki Polskiej (https://www.fnp.org.pl/).

Oferty pracy dla naukowców w krajach Europy i innych kontynentów zawiera portal Komisji Europejskiej EURAXESS (https://euraxess.ec.europa.eu/), a w Polsce – Akademicka Baza Ogłoszeń (https://bazaogloszen.nauka.gov.pl/).

Przydatna może też być informacja o ludziach nauki i szkolnictwa wyższego. Urzędową znajdziemy m.in. w systemach RAD-on (baza „Nauczyciele akademiccy, inne osoby prowadzące zajęcia, osoby prowadzące działalność naukową oraz osoby biorące udział w jej prowadzeniu” https://radon.nauka.gov.pl/dane/nauczyciele-akademiccy-badacze-i-osoby-zaangazowane-w-dzialalnosc-naukowa), POL-on (np. „Ogólnopolski wykaz osób, którym nadano tytuł profesora” https://polon.nauka.gov.pl/opi/aa/prof/zestawienie?execution=e2s1) oraz w bazie Nauka Polska (https://nauka-polska.pl/). Nieoficjalną znajdziemy m.in. w omówionych już naukowych portalach społecznościowych albo w profilach Google Scholar.

Ocena jakości zasobów naukowych

Ważnym i również wieloaspektowym zagadnieniem jest ocena jakości zasobów naukowych, zresztą nie tylko w sieci, ale generalnie. Istnieje szereg kryteriów i sposobów oceny jakości zasobów internetowych w ogóle, należą do nich m.in. wskaźniki związane z treścią serwisów (aktualność, autorstwo, kompletność, obiektywność, wiarygodność) i formą (architektura informacji, dostępność, funkcjonalność, technologia oraz doświadczenie użytkownika, przyjazność, relewantność do potrzeb). Zasoby naukowe, rzecz jasna, również mogą podlegać ocenie wedle tych kryteriów, dodatkowo jednak należy uwzględnić specyficzne dla nauki wskaźniki, zwłaszcza w odniesieniu do tych źródeł online, które zawierają dane i wiedzę naukową, jak artykuły i książki oraz ich kolekcje. „Od razu” w tle pojawia się filozoficzna/naukoznawcza kwestia cech wiedzy naukowej jako takiej, demarkacji nauki od nie-nauki, akceptowanego przez społeczność naukową sposobu uzasadniania wyników badań, właściwych metod gromadzenia danych empirycznych etc. Oczywiście prostsze jest odróżnienie publikacji naukowej od nienaukowej na podstawie kryteriów formalnych, jak bycie recenzowanym, posiadanie aparatu informacyjnego (słowa kluczowe, abstrakt, przypisy, bibliografia) i odpowiedniej struktury, autorstwo i miejsce publikacji. Wiadomo jednak, że to nie zawsze działa ze stuprocentową pewnością, przykład stanowią znane prowokacje, jak tzw. afera Sokala. Także w odniesieniu do zasobów o charakterze administracyjnym, organizacyjnym ocena jakości informacji jest istotna, a warto zaznaczyć, że prawdopodobnie nie istnieje coś takiego jak bezbłędne źródło informacji, również w serwisach urzędowych zdarzają się, chociaż nie powinny, pomyłki, które czasami mogą mieć daleko idące negatywne skutki. Truizmem jest apel, by zawsze sprawdzać i porównywać informację z różnych źródeł. Ocena jakości zasobów naukowych w internecie jest ważna również w kontekście niepokojących zjawisk współczesnych, jak drapieżne czasopisma i konferencje, fabryki artykułów, „punktoza”, popularność i aktywność publikacyjna ruchów pseudonaukowych, zamykanie się w bańkach informacyjnych.

Problem jakości dotyczy też samego procesu wyszukiwania, oceny i doboru (selekcji) zasobów naukowych. Brak umiejętności wyszukiwawczych, niskie kompetencje cyfrowe i medialne stanowią bariery informacyjne i mogą przyczynić się m.in. do nieodnalezienia adekwatnych publikacji, a w konsekwencji np. do nieznajomości rzeczywistego stanu badań w danym zakresie. Co więcej, ze względu na ogrom zasobów naukowych warto we wstępie do każdej pracy naukowej jasno napisać, skąd „wzięliśmy” wykorzystywane publikacje i inne materiały oraz na podstawie jakich kryteriów dokonaliśmy ich takiego, a nie innego wyboru na potrzeby pisanego dzieła. Z tą myślą pozostawiam czytających.

dr Sabina Cisek, Instytut Studiów Informacyjnych

Wydział Zarządzania i Komunikacji Społecznej

Uniwersytetu Jagiellońskiego w Krakowie

Dyskusja (0 komentarzy)