Przetwarzanie dużych ilości informacji daje wiedzę, która leży u podstaw wyraźnych decyzji podejmowanych przez organizację. Pozwala to na uzyskiwanie wyśmienitych efektów: techniki wyciągania wiedzy z danych stają się coraz bardziej wyrafinowane. Podstawowym warunkiem sukcesu jest uzyskanie optymalnej jakości danych. Zastosowanie niespójnych i niepełnych informacji prowadzi do podejmowania błędnych decyzji. Rezultatem mogą być straty finansowe, stwarzanie solidnych zagrożeń czy uszczerbek na wizerunku. A zatem oczyszczanie jest wyjątkowo ważną częścią analizy danych.
Ta książka jest ergonomicznym zbiorem gotowych do wykorzystania receptur, przekazanych tak, by maksymalnie ułatwić cykl przygotowania danych do analizy. Omówiono tu takie kwestie dotyczące informacji jak importowanie, ocena ich jakości, dobieranie braków, porządkowanie i agregacja, a także przekształcanie. Poza zwięzłym omówieniem tych zadań zaprezentowano najskuteczniejsze techniki ich wykonywania za pomocą różnych narzędzi: Pandas, NumPy, Matplotlib czy SciPy. W ramach każdej receptury wyjaśniono skutki podjętych działań. Cennym uzupełnieniem jest zestaw funkcji i klas zdefiniowanych przez użytkownika, które służą do automatyzacji oczyszczania informacji. Umożliwiają one również dostrojenie procesu do solidnych potrzeb.
W książce znajdziesz receptury, dzięki którym:
- wczytasz i przeanalizujesz dane z różnych źródeł
- uporządkujesz informacje, poprawisz ich błędy i uzupełnisz braki
- skutecznie skorzystasz z bibliotek Pythona
- zastosujesz wizualizacje do analizy danych
- napiszesz własne funkcje i klasy do automatyzacji procesu oczyszczania informacji
Prawdziwą wartość posiadają tylko oczyszczone i spójne informacje!
Opinie i recenzje użytkowników
Dodaj opinie lub recenzję dla Czyszczenie danych w pythonie. Twój komentarz zostanie wyświetlony po moderacji.