potrzeby w zakresie analizy obfitych zbiorów danych i wyciągania z nich poręcznych danych stale rosną. Spośród dostępnych narzędzi asygnowanych do tych zastosowań niezwykle przydatny jest PySpark - interfejs API systemu Spark dla języka Python.
Apache Spark wspaniale się nadaje do analizy sporych zbiorów danych, a PySpark wydajnie upraszcza integrację Sparka ze specjalistycznymi narzędziami PyData. Aby jednak można było w pełni skorzystać z tych możliwości, konieczne jest zrozumienie interakcji pomiędzy algorytmami, zbiorami informacji i wzorcami stosowanymi w analizie informacji.
Oto ergonomiczny przewodnik po wersji 3.0 systemu Spark, metodach statystycznych i rzeczywistych zbiorach informacji. Omówiono w nim zasady rozwiązywania problemów analitycznych przy pomocy interfejsu PySpark, z wykorzystaniem dobrych praktyk programowania w systemie Spark.
Po lekturze można bez problemu zagłębić się we wzorce analityczne oparte na modnych technikach przetwarzania danych, takich jak klasyfikacja, grupowanie, odfiltrowanie i wykrywanie anomalii, wykorzystywane w genomice, bezpieczeństwie systemów IT i finansach.
Dodatkowym plusem są opisy zastosowania przetwarzania obrazów i języka naturalnego. Zaletą jest również szereg rzeczywistych przykładów sporych zbiorów danych i ich zaawansowanej analizy. Dzięki książce poznasz: model programowania w ekosystemie Spark podstawowe metody używane w nauce o danych pełne implementacje analiz obfitych publicznych zbiorów informacji mocne przypadki użycia narzędzi uczenia maszynowego kod, któryprzypasujesz do swoich potrzeb PySpark: systemowa odpowiedź na problemy inżyniera informacji!
Tytuł innowacyjna analiza danych w PySpark Autor praca zbiorowa Wydawnictwo Helion EAN 9788383220697 ISBN 9788383220697 Kategoria Literatura, Informatyka ilość stron 192 Rok wydania 2023 Oprawa broszurowa
Opinie i recenzje użytkowników
Dodaj opinie lub recenzję dla Zaawansowana analiza danych w pyspark. Twój komentarz zostanie wyświetlony po moderacji.