Statystyczna analiza danych z wykorzystaniem programu R

JeremiaszP/ Październik 11, 2017/ Książki/ 0 comments

Okładka książki

Statystyczna analiza danych z wykorzystaniem programu R to monografia wprowadzająca czytelnika w bardziej zaawansowane algorytmy i procedury oferowane przez język R. Autorzy pod redakcją Marka Walesiaka i Eugeniusza Gatnara ukazują na przykładach zastosowania i metodykę pisania funkcji statystycznych w R. Czy książka wydana nakładem Wydawnictwa Naukowego PWN spełniła pokładane w niej nadzieje? Zapraszam do recenzji.

Wstęp muszę zacząć od pewnego zgrzytu na „dzień dobry”. Czytelnik widząc okładkę Statystyczna analiza danych z wykorzystaniem programu R może dojść do wniosku, że jest to podręcznik wprowadzający przyszłego statystyka/ analityka danych w meandry niezwykle bogatej struktury jaką oferuje R. Niestety- tytuł jest mylący, bowiem opisuje nie tyle podstawy statystyki co zaawansowane zagadnienia takie jak analizy dyskryminacyjne, czy wieloczynnikową ANOVA, drzewa klasyfikacyjno- regresyjne. Przyznaję- w pierwszej chwili sięgając po książkę Statystyczna analiza danych z wykorzystaniem programu R byłem przekonany, że znajdę tutaj przepisy na przeprowadzanie regresji liniowej, ANOVY, rozkłądów normalnych, czyli podstaw statystyki.

Rzeczony zgrzyt nie powinien jednak przesłaniać wartości książki Statystyczna analiza danych z wykorzystaniem programu R bowiem dla osób, które już wiedzą czym jest regresja i inne podstawowe metody statystyczne Statystyczna analiza danych z wykorzystaniem programu R stanie się najlepszym pomocnikiem. Każdy rozdział otwiera rodzaj krótkiego wstępu teoretycznego, gdzie za pomocą wzorów autorzy opisują stosowane metody. Metody te są następnie szczegółowo opisane w języku R wraz z zastosowaniem w konkretnych przypadkach. Dla bardziej zaawansowanych w programie R użytkowników, oraz osób znających notację dużą wartością bez wątpienia będzie dążenie przez autorów aby kod był czytelny, skompresowany, oraz bardzo często przypominający skrypt wykonywalny: oszczędza to użytkownikowi wklepywania za każdym razem funkcji, zbierania danych. Myślę, że czytelnicy znający makra w Excelu, lub LibreOffice wiedzą o co chodzi. Warto tutaj zaznaczyć, że książka może być z powodzeniem czytana przez osoby, które z R nie będą miały wiele do czynienia- same wstępy teoretyczne są na tyle wyczerpujące, że zastępują pełne opracowania statystyczne.

Wieloczynnikowa ANOVA? Ze skryptami R to nie jest problem

Czego czytelnik z Statystyczna analiza danych z wykorzystaniem programu R się dowie? Dowie się przede wszystkim w jaki sposób wykorzystać w statystyce takie zagadnienia jak:

  • Analiza wariancji ANOVA;
  • Analiza regresji wielorakiej;
  • Metody nieparametryczne regresji;
  • Analiza dyskryminacyjna;
  • Drzewa klasyfikacyjne i regresyjne;
  • Analiza czynnikowa;
  • Skalowanie wielowymiarowe.

Statystyczna analiza danych z wykorzystaniem programu R jest książką napisaną zwięźle i jednocześnie przejrzyście. Czy znalazłem jeszcze jakieś wady? Owszem- w samym kodzie nie znalazłem błędów, jednak autorzy odwołują się do swoich autorskich skryptów, które można pobrać ze strony internetowej: niestety za każdym razem strona internetowa albo nie działała, albo nie mogłem uzyskać dostępu do repozytoriów. Biblioteki dodatkowe musiałem wobec powyższego „zasysać” z repozytoriów R’a.

W książce wprawdzie nie omawia się łańcuchów Markowa, jednak czytelnik po zapoznaniu się z treścią sam stworzy tego rodzaju łańcuchy.

Statystyczna analiza danych z wykorzystaniem programu R dla kogo jest? Na pewno nie dla osób, które zaczynają przygodę z R i ze statystyką. Od razu zaznaczam: książkę należy traktować jako rodzaj monografii przeznaczonej dla analityków danych, statystyków, matematyków, data managerów, którzy znają już podstawy statystyki (nieco powyżej standardowego poziomu wykładanego na uczelniach ). Dla czytelników, którzy dysponują w/w wiedzą Statystyczna analiza danych z wykorzystaniem programu R będzie bardzo dobrym przewodnikiem ułatwiającym bardzo życie.