Jak udowodnić cokolwiek za pomocą „właściwych” statystyk?
Ostatnio pisałam o rosnących nierównościach w Polsce. Post został oparty na danych ze Światowej Bazy Danych o Nierównościach (WID), szanowanego źródła statystyk dotyczących pomiaru nierówności. Z ich analiz wynika, że Polska jest jednym z najbardziej nierównych krajów w Europie, w którym dolne 50% pozostaje w tyle, a różnica do górnych 10% się powiększa.
Opublikowany niedawno raport SDR przedstawia jednak odwrotną perspektywę: Polska radzi sobie bardzo dobrze. W ciągu ostatnich dwóch dekad zajęto się kwestią nierówności, które otrzymały pozytywne oceny zarówno pod względem współczynnika Giniego, jak i wskaźnika Palmy (udział wszystkich dochodów uzyskiwanych przez 10 proc. najbogatszych podzielony przez udział otrzymywany przez 40 proc. najbiedniejszych).
Jak to możliwe? Kto ma rację? Dlaczego wiadomości są tak mylące?
Postanowiłem to zbadać. Zajęło to ponad tydzień intensywnej pracy, a wyniki zasadniczo potwierdzają, że oba są poprawne – i że różnice są wytłumaczalne. Rozbieżność wynika z różnic w:
- Jak definiuje się dochód (przed opodatkowaniem i po opodatkowaniu; dochód narodowy a dochód rozporządzalny)
- Jak liczone są gospodarstwa domowe i osoby fizyczne (ekwiwalentne gospodarstwa domowe a dochód na osobę dorosłą)
- W jaki sposób uwzględniono osoby o najwyższych dochodach (niedostateczne raportowanie w badaniu a korekty dotyczące najwyższych dochodów)
Martwi mnie to, że złożoność analizy statystycznej sprawia, że bardzo łatwo jest ją błędnie zinterpretować – lub zinterpretować w dowolny sposób, który bardziej Ci się podoba. W zależności od Twojego planu, możesz użyć danych WID lub SDR, aby udowodnić prawie każdy punkt, który chcesz. Można argumentować, że program polityczny był skuteczny w oparciu o SDR lub nieudany w oparciu o WID.
Pozwólcie, że przedstawię wam najważniejsze powody i implikacje.
METODOLOGIA
SDR wykorzystuje oficjalne, oparte na badaniach ankietowych miary nierówności dochodu rozporządzalnego. Badania te mają tendencję do zaniżania najwyższych dochodów, co jest ważnym elementem rozbieżności omówionych później. SDR dostarcza danych dotyczących dochodu do dyspozycji po opodatkowaniu w ekwiwalentnym gospodarstwie domowym (co oznacza, że istnieje obliczenie przeliczające realny dochód na ekwiwalent gospodarstwa domowego, co dodatkowo komplikuje interpretację [1]).
WID stara się zrekompensować brakujące dane w oficjalnych ankietach wykorzystywanych przez SDR, dokonując korekt w celu zapewnienia, że uwzględnione zostaną niedostatecznie reprezentowane najwyższe dochody. Jako kluczowe wymiary podaje się w nim dochód narodowy przed opodatkowaniem i po opodatkowaniu (dochód narodowy różni się od dochodu rozporządzalnego, ale zostawię to tutaj, aby nie komplikować zbytnio dyskusji). WID oblicza również dochód na osobę dorosłą, bez dokonywania korekt gospodarstwa domowego, co zbliża go do rzeczywistych dochodów rynkowych. Dane przed opodatkowaniem w naturalny sposób pomijają redystrybucyjny efekt opodatkowania progresywnego, który zmniejsza nierówności. W zbiorze danych dla Polski WID posiada również dane o dochodzie rozporządzalnym, ale nie jest to łatwe do wyboru — musiałem pobrać pełny zestaw danych, aby wybrać miary oparte na podobnej definicji dochodu jak SDR.
Sprawdziłem również dane z Głównego Urzędu Statystycznego (GUS) w celu triangulacji wyników. Dostarcza dane o wynagrodzeniach w podziale na decyle co dwa lata, co pozwala na porównanie wynagrodzeń w różnych percentylach populacji. Ograniczenie polega na tym, że obejmuje on tylko wynagrodzenia i tylko osoby zatrudnione, więc nie oddaje pełnego obrazu.
Zarówno dane SDR, jak i GUS są dostępne tylko od początku lat 2000, więc nie pozwalają nam zrozumieć długoterminowych wzorców. W tym celu musimy polegać na wskaźniku WID, który pokazuje szybki wzrost nierówności na początku transformacji w latach 90., który spłaszcza się w XXI wieku.
MIARY NIERÓWNOŚCI
Przygotowałem wykres przedstawiający kluczowe miary z tych trzech źródeł dla okresu, w którym wszystkie są dostępne (od 2004 r. do najnowszych dostępnych danych z 2022 r.). Dane są znormalizowane i przedstawione jako odchylenie od tego samego punktu początkowego – 100 w 2004 r.

Współczynnik Giniego – Po skorygowaniu o definicję dochodu (użyłem danych o dochodzie rozporządzalnym, aby poprawić porównywalność), zarówno SDR, jak i WID wykazują podobny trend: nierówności znacznie się zmniejszyły, chociaż spadek jest większy w oficjalnych danych SDR. Najbardziej prawdopodobnym wytłumaczeniem jest brak najlepiej zarabiających w oficjalnych danych. WID informuje o udziale 1% najlepiej zarabiających, który wzrósł o ponad 2 punkty procentowe – więcej niż wzrost dla 10% najlepiej zarabiających ogółem. Sugeruje to, że niedostateczna reprezentacja osób najlepiej zarabiających może dość znacznie zniekształcić oficjalne dane. Indeks Giniego nadal wykazuje ten sam ogólny trend, ponieważ koncentruje się na średnich dochodach i jest raczej niewrażliwy na ogony (najwyższe i najniższe punkty danych). Być może zaskakujące jest, że ta miara jest tak popularna: sama liczba jest trudna do zinterpretowania, jest niewrażliwa na krytyczne punkty danych do pomiaru nierówności i, poza prostotą, oferuje ograniczony wgląd. Jednak nasze pragnienie uproszczenia świata sprawiło, że stała się ona kluczową statystyką w dyskusjach na temat nierówności.
WID Top 10 / Bottom 50 Ratio i SDR Palma (Top 10 / Bottom 40) - Powinny one wykazywać dość podobne wzorce, ale w rzeczywistości poruszać się w przeciwnych kierunkach. Rozbieżność ta jest napędzana przez osoby o najwyższych dochodach, które nie są uwzględnione w SDR.
GUS P90/P10 – analizę uzupełniam o dwie statystyki wyliczone na podstawie danych GUS. 90. percentyl to osoba o najniższych zarobkach w górnych 10%, podczas gdy 10. percentyl to osoba o najwyższych zarobkach w dolnych 10%. Cierpi to na takie samo odchylenie jak SDR, ponieważ 10% na obu ogonach jest wykluczonych. Pokazuje on jednak wzorzec dość podobny do bardziej wyrafinowanych środków zarówno z WID, jak i SDR.
Średnia GUS/P50 – Drugą miarą GUS jest średnie wynagrodzenie w stosunku do mediany wynagrodzeń, dostępne w ujęciu miesięcznym. Koncentruje się wyłącznie na osobach o średnich dochodach i może służyć jako wczesna wskazówka większych trendów. Korzyścią jest częsta dostępność; Wadą jest to, że jest bardzo stabilny i dlatego oferuje niewiele sygnałów.
Dyskusja
Przeprowadziłem Cię przez całą moją analizę, aby zilustrować, jak ostrożni musimy być podczas czytania raportów statystycznych. Niektóre wnioski wydają się oczywiste, ale w rzeczywistości
historia jest znacznie bardziej zniuansowana.
Polska wyraźnie stoi przed wyzwaniem związanym z nierównościami, ale wydaje się, że dotyczy ono głównie niewielkiej mniejszości najlepiej zarabiających. Wydaje się, że wśród ogółu społeczeństwa nierówności zmniejszyły się, a działania polityczne, takie jak zmiany podatkowe na dolnym końcu skali zarobków i podwyżki płacy minimalnej, przyczyniają się do bardziej równomiernego rozkładu dochodów.
Czy powinniśmy być szczęśliwi, czy zmartwieni? Z punktu widzenia równowagi sił akumulacja dochodu w rękach niewielkiej mniejszości nie jest pożądana. Jednak jeśli chodzi o wzrost sprzyjający włączeniu społecznemu i ograniczanie ubóstwa w przypadku większości, SDR może być lepszym miernikiem – podobnie jak w wielu obszarach statystyki, wartości odstające są często wykluczane, aby opowiedzieć historię dla większości.
Konkluzja
Jeden środek z pewnością nie wystarczy. Polecam:
- Porównanie Top 10 / Bottom 50 Ratio lub Palma z koncentracją bogactwa (Top 1% zarobków)
- Ostrożność w przypadku Gini: chociaż jest szeroko stosowany, może maskować ważne zmiany na krańcach spektrum dochodów
- Skupienie się na dochodzie po opodatkowaniu (czy to dochodzie narodowym, czy dochodzie rozporządzalnym, oba dostarczają cennych spostrzeżeń, ale zostawiam tę historię na inną okazję).
... A przede wszystkim, nie wyciągając pochopnych wniosków, rzeczywistość może być bardziej złożona i zniuansowana.
Paweł Pietruszewski
Źródła
Baza danych o nierównościach na świecie
Raport o Zrównoważonym Rozwoju
[1] Ekwiwalentny dochód do dyspozycji
Bukowski, P. Wsp. (2023). Nierówności dochodowe w XXI wieku w Polsce. Dokument roboczy Światowego Laboratorium ds. Nierówności 2023/31.
Litwiński, M., Iwański, R. & Tomczak, Ł. Akceptacja nierówności dochodowych w Polsce. Soc Indic Res 166, 381–412 (2023). https://doi.org/10.1007/s11205-023-03072-2
Od redakcji: Artykuł pochodzi z bloga Autora, publikujemy dzięki jego uprzejmej zgodzie. Ilustracje sygnalizują podjęcie pokrewnego tematu na Konferencji i Gali CFO Roku 2025, więcej informacji https://wydarzenia.kdfdialog.org.pl/event/cfo-roku-20255126

