Web Data Mining z użyciem języka Python
ODKRYWAJ I WYODRĘBNIAJ INFORMACJE ZE STRON INTERNETOWYCH ZA POMOCĄ JĘZYKA PYTHON
Danologia to najszybciej rozwijająca się dziedzina na świecie. Przewiduje się, że do roku 2026 stworzy 11,5 mln nowych miejsc pracy, tak więc osoby poszukujące pracy i posiadające ten zestaw umiejętności mają tu wiele moż-liwości. Jednym z najbardziej pożądanych obszarów w dziedzinie danologii jest wydobywanie informacji ze stron internetowych. Jeśli jesteś początkującym danologiem, który chce się nauczyć różnych technik eksplorowania stron sieci Web, ta książka jest właśnie dla Ciebie.
Na początku tej książki omawiane są kluczowe koncepcje związane z eksploracją danych w sieci Web i jej taksono-mią. Następnie omawiane są podstawy dotyczące procesu ekstrakcji danych ze stron, jego zastosowania i komponenty, a także inne tematy, jak choćby aspekty prawne związane z procesem ekstrakcji, wyodrębnianiem i wstępnym przetwarzaniem danych, ekstrakcją danych z dynamicznych stron internetowych czy zabezpieczeniem CAPTCHA. Przedstawia również koncepcję eksploracji opinii oraz struktury stron internetowych. Ponadto omawia ona eksplorację grafów, wyodrębnianie informacji ze stron internetowych, wyszukiwanie na stronach i hiperłącza, wyszukiwanie algorytmem Hyperlink Induced Topic Search (HITS) oraz algorytmy partycjonowania, które używane są przy eksploracji danych w sieci Web. Na końcu książki prezentowane są różne techniki eksploracji ułatwiające odkrywanie interesujących wzorców użycia z danych na stronach internetowych.
KLUCZOWE ELEMENTY
Pełny przegląd podstawowych i zaawansowanych koncepcji dotyczących eksploracji danych w sieci Web.
Pracuj z łatwymi w użyciu bibliotekami open source języka Python do eksplorowania danych.
Zapoznaj się z różnymi korzystnymi obszarami i zastosowaniami dla eksploracji danych w sieci Web.
CZEGO SIĘ NAUCZYSZ?
Dokonywać ekstrakcji danych z dowolnej witryny internetowej z użyciem języka Python.
Zapoznasz się z koncepcjami dotyczącymi eksploracji opinii i analizy nastrojów.
Użyjesz eksploracji struktury do odkrywania informacji o strukturze danej strony.
Nauczysz się zbierać i analizować dane z mediów społecznościowych z użyciem języka Python.
Użyjesz eksploracji korzystania ze strony do przewidywania zachowań internautów podczas przeglądania stron.
DLA KOGO JEST TA KSIĄŻKA
Ta książka jest przeznaczona dla każdego, kto chce się nauczyć eksplorować dane na stronach sieci Web. Będzie najbardziej pomocna dla początkujących danologów, inżynierów danych i analityków danych, którzy chcą opanować techniki eksplorowania danych na stronach internetowych.
- Kategorie:
- Język wydania: polski
- ISBN: 9788375415315
- ISBN druku: 9788375415308
- Liczba stron: 348
-
Sposób dostarczenia produktu elektronicznegoProdukty elektroniczne takie jak Ebooki czy Audiobooki są udostępniane online po opłaceniu zamówienia kartą lub przelewem na stronie Twoje konto > Biblioteka.Pliki można pobrać zazwyczaj w ciągu kilku-kilkunastu minut po uzyskaniu poprawnej autoryzacji płatności, choć w przypadku niektórych publikacji elektronicznych czas oczekiwania może być nieco dłuższy.Sprzedaż terytorialna towarów elektronicznych jest regulowana wyłącznie ograniczeniami terytorialnymi licencji konkretnych produktów.
-
Ważne informacje techniczneMinimalne wymagania sprzętowe:procesor: architektura x86 1GHz lub odpowiedniki w pozostałych architekturachPamięć operacyjna: 512MBMonitor i karta graficzna: zgodny ze standardem XGA, minimalna rozdzielczość 1024x768 16bitDysk twardy: dowolny obsługujący system operacyjny z minimalnie 100MB wolnego miejscaMysz lub inny manipulator + klawiaturaKarta sieciowa/modem: umożliwiająca dostęp do sieci Internet z prędkością 512kb/sMinimalne wymagania oprogramowania:System Operacyjny: System MS Windows 95 i wyżej, Linux z X.ORG, MacOS 9 lub wyżej, najnowsze systemy mobilne: Android, iPhone, SymbianOS, Windows MobilePrzeglądarka internetowa: Internet Explorer 7 lub wyżej, Opera 9 i wyżej, FireFox 2 i wyżej, Chrome 1.0 i wyżej, Safari 5Przeglądarka z obsługą ciasteczek i włączoną obsługą JavaScriptZalecany plugin Flash Player w wersji 10.0 lub wyżej.Informacja o formatach plików:
- PDF - format polecany do czytania na laptopach oraz komputerach stacjonarnych.
- EPUB - format pliku, który umożliwia czytanie książek elektronicznych na urządzeniach z mniejszymi ekranami (np. e-czytnik lub smartfon), dając możliwość dopasowania tekstu do wielkości urządzenia i preferencji użytkownika.
- MOBI - format zapisu firmy Mobipocket, który można pobrać na dowolne urządzenie elektroniczne (np.e-czytnik Kindle) z zainstalowanym programem (np. MobiPocket Reader) pozwalającym czytać pliki MOBI.
- Audiobooki w formacie MP3 - format pliku, przeznaczony do odsłuchu nagrań audio.
Rodzaje zabezpieczeń plików:- Watermark - (znak wodny) to zaszyfrowana informacja o użytkowniku, który zakupił produkt. Dzięki temu łatwo jest zidentyfikować użytkownika, który rozpowszechnił produkt w sposób niezgodny z prawem. Ten rodzaj zabezpieczenia jest zdecydowanie bardziej przyjazny dla użytkownika, ponieważ aby otworzyć książkę zabezpieczoną Watermarkiem nie jest potrzebne konto Adobe ID oraz autoryzacja urządzenia.
- Brak zabezpieczenia - część oferowanych w naszym sklepie plików nie posiada zabezpieczeń. Zazwyczaj tego typu pliki można pobierać ograniczoną ilość razy, określaną przez dostawcę publikacji elektronicznych. W przypadku zbyt dużej ilości pobrań plików na stronie WWW pojawia się stosowny komunikat.