Kropki, przecinki, średniki czy wykrzykniki są uniwersalnym i niezbędnym dopełnieniem matematycznej perfekcji każdego badanego języka – twierdzą naukowcy z Instytutu Fizyki Jądrowej PAN, którzy przeanalizowali pod tym kątem interpunkcję kilkuset dzieł literackich.
Wielu osobom interpunkcja jawi się jako zło konieczne, gdy tylko można z chęcią ignorowane. Najnowsze analizy literatury napisanej we współcześnie wiodących językach świata każą zmienić ten osąd. W kilkuset dziełach powstałych w siedmiu językach, głównie zachodnich, zaobserwowano bowiem te same cechy statystyczne schematów używania znaków przestankowych! Interpunkcja okazuje się być uniwersalnym i niezbędnym dopełnieniem matematycznej perfekcji każdego badanego języka. Tak niezwykły wniosek o roli niepozornych przecinków, wykrzykników czy kropek płynie z artykułu naukowców z Instytutu Fizyki Jądrowej PAN w Krakowie, opublikowanego na łamach czasopisma Chaos, Solitons & Fractals.
Obecne analizy są rozwinięciem naszych wcześniejszych wyników nad multifraktalnymi cechami zmienności długości zdań dzieł literatury światowej. Czym bowiem jest długość zdania? To nic innego jak odległość do kolejnego, konkretnego znaku interpunkcyjnego: kropki. Teraz wzięliśmy więc pod statystyczną lupę wszystkie znaki interpunkcyjne, przyjrzeliśmy się także, co się dzieje z interpunkcją podczas tłumaczeń – tłumaczy prof. dr hab. Stanisław Drożdż z IFJ PAN i Politechniki Krakowskiej.
W poszukiwaniu matematycznego wzorca
Badaniom poddano dwa zbiory tekstów. Główne analizy dotyczące interpunkcji wewnątrz każdego z języków przeprowadzono na 240 cieszących się dużą popularnością dziełach literackich, napisanych w siedmiu językach, głównie zachodnich: angielskim (44), niemieckim (34), francuskim (32), włoskim (32), hiszpańskim (32), polskim (34) i rosyjskim (32). Taki a nie inny dobór języków wynikał z przyjętego kryterium: badacze założyli, że danym językiem powinno posługiwać się nie mniej niż 50 milionów ludzi, a napisane w nim dzieła powinny być nagrodzone nie mniej niż pięcioma literackimi Nagrodami Nobla. Ponadto dla statystycznej wiarygodności wyników badań każda książka musiała zawierać co najmniej 1500 sekwencji wyrazów rozdzielonych znakami interpunkcyjnymi. Osobny zbiór przygotowano pod kątem obserwacji stabilności interpunkcji w tłumaczeniach. Zawierał on 14 dzieł, z których każde było dostępne w każdym z badanych języków (dwie z 98 wersji językowych jednak pominięto z uwagi na ich niedostępność). Łącznie w obu zbiorach wśród autorów znaleźli się tacy twórcy, jak: Joseph Conrad, Charles Dickens, Artur Conan Doyle, Ernest Hemingway, Joseph Rudyard Kipling, George Orwell, Jerome David Salinger, Adeline Virginia Woolf, Günter Grass, Franz Kafka, Thomas Mann, Friedrich Nietzsche, Johann Wolfgang von Goethe, Alexandre Dumas, Victor Hugo, Marcel Proust, Jules Verne, Umberto Eco, Miguel de Cervantes, Henryk Sienkiewicz czy Władysław Reymont.
Uwagę krakowskich badaczy przykuł przede wszystkim rozkład statystyczny odległości między kolejnymi znakami interpunkcyjnymi. Szybko się okazało, że we wszystkich badanych językach najlepiej opisuje go jeden z precyzyjnie określonych wariantów rozkładu Weibulla. Krzywa tego typu ma charakterystyczny kształt: początkowo rośnie gwałtownie, by po osiągnięciu wartości maksymalnej nieco wolniej opaść do pewnej wartości krytycznej, poniżej której zdąża do zera już z małą i ciągle malejącą dynamiką. Rozkładem Weibulla zwykle opisuje się zjawiska związane z przetrwaniem (np. liczbę ludności w funkcji wieku), ale także różne procesy fizyczne, jak choćby rosnące zmęczenie materiałów.
Zgodność rozkładu długości sekwencji wyrazów między znakami interpunkcyjnymi z funkcjonalną postacią rozkładu Weibulla była tym lepsza, im więcej rodzajów znaków interpunkcyjnych uwzględnialiśmy w analizach; dla wszystkich znaków zgodność ta okazywała się niemal pełna. Jednocześnie między poszczególnymi językami są widoczne pewne różnice w rozkładach, ale sprowadzają się one tylko do doboru nieco innych wartości parametrów rozkładu, charakterystycznych dla danego języka. Interpunkcja wydaje się więc być integralną częścią wszystkich badanych języków, a ponieważ rozkład Weibulla dotyczy takich zjawisk, jak przetrwanie, z wcale nie za dużym przymrużeniem oka można stwierdzić, że interpunkcja ma w swoją naturę literalnie wkomponowaną walkę o przeżycie – zauważa prof. Drożdż.
Niemieckie esperanto
Kolejny etap analiz polegał na wyznaczaniu funkcji hazardu. W przypadku interpunkcji opisuje ona, jak zmienia się warunkowe prawdopodobieństwo sukcesu – czyli prawdopodobieństwo wystąpienia kolejnego znaku interpunkcyjnego – jeśli w analizowanej sekwencji żaden taki znak jeszcze się nie pojawił. Wyniki są tu jednoznaczne: językiem charakteryzującym się najmniejszą skłonnością do używania interpunkcji jest angielski, z niewiele mu ustępującym hiszpańskim; najbardziej uzależnione od interpunkcji okazały się języki słowiańskie. Krzywe funkcji hazardu dla znaków interpunkcyjnych w sześciu badanych językach okazały się mieć podobny przebieg, różniły się bowiem głównie przesunięciem w pionie.
Wyjątkiem okazał się język niemiecki. Jego funkcja hazardu jako jedyna przecina większość krzywych skonstruowanych dla pozostałych języków. Niemiecka interpunkcja zdaje się więc łączyć cechy interpunkcyjne wielu języków, co czyni z niej swoiste interpunkcyjne esperanto. Powyższa obserwacja współgra z kolejną analizą, która polegała na sprawdzeniu, czy cechy interpunkcyjne oryginalnych dzieł literackich widać w ich tłumaczeniach. Zgodnie z oczekiwaniami, językiem najwierniej odwzorowującym interpunkcję od języka oryginału do języka docelowego okazał się niemiecki.
W przekazie mówionym przerwy można uzasadniać ludzką fizjologią, między innymi koniecznością zaczerpnięcia oddechu lub wygospodarowaniem chwili na ustrukturyzowanie w myślach dalszej wypowiedzi. A w przekazie pisanym?
Tworzenie zdania poprzez dokładanie do niego kolejnych wyrazów przy jednoczesnym dbaniu, by przekaz był zrozumiały i jednoznaczny, nieco przypomina napinanie cięciwy łuku: na początku jest to łatwe, ale z każdą chwilą staje się coraz bardziej wymagające. Jeśli w tekście nie ma żadnych elementów porządkujących (a przecież taką rolę pełni interpunkcja), trudność interpretacji rośnie wraz z wydłużaniem się ciągu wyrazów. Zbyt mocno napięta cięciwa może pęknąć, a zbyt długie zdanie może stać się niezrozumiałe. Dlatego autor staje przed koniecznością „uwolnienia strzały”, czyli zamknięcia fragmentu tekstu jakimś znakiem interpunkcyjnym. Obserwacja ta dotyczy wszystkich analizowanych języków, mamy więc do czynienia z czymś, co można byłoby nazwać prawem lingwistycznym – stwierdza dr Tomasz Stanisz (IFJ PAN), pierwszy autor artykułu.
Badacze zauważają, że wynalazek interpunkcji jest stosunkowo niedawny – w najstarszych tekstach znaki przestankowe nie występowały w ogóle. Pojawienie się optymalnych wzorców interpunkcji we współczesnych językach pisanych może być więc interpretowane jako efekt ich zaawansowania ewolucyjnego. Jednak nadmierna potrzeba użycia interpunkcji niekoniecznie musi być oznaką takiego zaawansowania. Języki angielski i hiszpański, współcześnie najbardziej uniwersalne, w świetle powyższych badań okazują się być mniej rygorystyczne w kwestii częstości stosowania interpunkcji. Prawdopodobnie języki te są tak sformalizowane pod względem konstrukcji zdania, że jest w nich mniej miejsca na niejednoznaczności, które musiałyby być rozwiązywane za pomocą znaków interpunkcyjnych.
źródło: IFJ PAN