W data science ważne są dane, dane są wszędzie na wyciągniecie ręki. Dane są dostępne w różnej formie, np.
- Plików Excel do ściągnięcia, jak Ludność w gminach
- Gotowych stron generujących wykresy na podstawie danych, jak na stronie FAO
- Całych baz danych, jak tej dotyczącej stackoverflow.com
Czasem zdarza się, że dane, które chcemy pozyskać i przeanalizować, znajdują się tylko w postaci stron internetowych. Jest to najgorsze miejsce, bo pozyskanie takich danych jest najbardziej czasochłonne. Pobieranie danych ze stron internetowych nazywa się web scrapingiem. Do web scrapingu Python nadaje się wręcz doskonale i zaprzęgniemy go, by pozyskiwanie danych zrobił za nas.
Dane pozyskane ze stron Internetowych warto zapisać w jakimś przyjaznym dla analizy danych formacie. Zapiszemy takie dane nie tylko do .csv czy plików Excel, ale też wprost do bazy SQL. Zobaczysz, że Python z bazami lubi się tak samo mocno jak z web scrapingiem.
W tym kursie nauczysz się:
- Czym są typy danych w Pythonie
- Czym są funkcje, argumenty i zmienne
- Podstaw języka HTML
- Działania instrukcji for i if
- Operacji na listach
- Pisania swoich własnych funkcji
- Eksportu danych do formatu .csv i .xlsx
- Używania operatorów logicznych
- Używania wyjątków i obsługi błędów
- Wykorzystania biblioteki Pandas i dataframe do obsługi danych.