Każda strona wyświetlana w Twojej przeglądarce składa się z kilku podstawowych elementów. Niektóre z nich są wyświetlane, inne zawierają informacje, których nie widzisz. W zależności…
W data science ważne są dane, dane są wszędzie na wyciągniecie ręki. Dane są dostępne w różnej formie, np. Plików Excel do ściągnięcia, jak Ludność…
Jak do tej pory udało nam się przedstawić na wykresie powtarzające się 3-gramy dla jednego autora – Janusza Korczaka. Dodajmy do tego drugiego autora Tadeusza…
Naszym celem jest umieszczenie na wykresie wszystkich najczęściej powtarzających się 3-gramów dla danego autora. Spójrzmy na dwa Dataframe z pomocą takiego programu: Nic trudnego w…
Mamy już nasze dane przygotowane w przyjaznej formie i formacie (pickle). Ostatnim krokiem jest przedstawienie ich na wykresie. Do tworzenia wykresów użyjemy pyplot będącego częścią…
W tej części zajmiemy się oszczędnością czasu i procesora, spróbujemy zapisać Dataframe jako plik, by nie musieć za każdym razem sięgać do treści książek. Pewnie…
W poprzedniej części udało nam się policzyć 3-gramy i zapisać je do plików tekstowych. Przy odrobinie samozaparcia można tak zmienić formę i format plików, by…
Wróćmy do naszego programu zaopatrzeni w umiejętności z części 12. Usunięcie z naszego tekstu ciągu znaków „przypisek t d m” nie sprawi nam kłopotu, użyjemy…
W poprzedniej części stanęliśmy przed zadaniem usunięcia niepotrzebnych fragmentów z książek. W książce „Kiwony” chcemy się pozbyć pojawiających się 3-gramów 'przypisek t d’ i 't…
W tej części zrobimy mniej więcej to, co w poprzedniej, ale na większą skalę. Nasz program robi się na tyle duży, że jeśli zajrzysz do…