Apache Spark jest oprogramowaniem open source, przeznaczonym do klastrowego przetwarzania informacji dostarczanych w rozmaitych formatach. Pozwala na uzyskanie niezrównanej wydajności, również pracę w trybie wsadowym i strumieniowym. Framework ten jest w dodatku wspaniale przygotowany do uruchamiania złożonych aplikacji, włączając w to algorytmy uczenia maszynowego czy analizy predykcyjnej. To wszystko sprawia, iż Apache Spark stanowi perfekcyjny dobór dla programistów zajmujących się big data i eksploracją i analizą danych.
To książka przeznaczona dla inżynierów danych i programistów, którzy chcą przy pomocy Sparka przeprowadzać trudne analizy danych i korzystać z algorytmów uczenia maszynowego, choćby jeśli te dane pochodzą z różnych źródeł. Wyjaśniono tu, jak dzięki Apache Spark można odczytywać i ujednolicać obfite zbiory informacji, żeby powstawały bezawaryjne jeziora danych, w jaki sposób wykonuje się interaktywne zapytania SQL i jak tworzy się potoki przy użyciu MLlib i wdraża modele przy pomocy biblioteki MLflow. Omówiono także współdziałanie aplikacji Sparka z jego rozproszonymi komponentami i tryby jej wdrażania w poszczególnych środowiskach.
W książce:
- API strukturalne dla Pythona, SQL, zespoi i Javy
- operacje Sparka i silnika SQL
- konfiguracje Sparka i interfejs Spark UI
- nawiązywanie połączeń ze źródłami informacji: JSON, Parquet, CSV, Avro, ORC, Hive, S3 i Kafka
- operacje analityczne na danych wsadowych i strumieniowanych
- niezawodne potoki informacji i potoki uczenia maszynowego
Spark: twórz skalowalne i bezawaryjne aplikacje big data!
Tytuł Spark. Błyskawiczna analiza danych w.2 Autor praca zbiorowa Wydawnictwo Helion EAN 9788328399143 ISBN 9788328399143 Kategoria Literatura, Informatyka liczba stron 360 Format 235x165 mm Rok wydania 2023 Oprawa broszurowa
Opinie i recenzje użytkowników
Dodaj opinie lub recenzję dla Spark. błyskawiczna analiza danych. wydanie ii. Twój komentarz zostanie wyświetlony po moderacji.