Informacja o cookies
Strona ksiegarnia.pwn.pl korzysta z plików cookies w celu dostarczenia Ci oferty jak najlepiej dopasowanej do Twoich oczekiwań i preferencji, jak również w celach marketingowych i analitycznych. Nasi partnerzy również mogą używać ciasteczek do profilowania i dopasowywania do Ciebie pokazywanych treści na naszych stronach oraz w reklamach. Poprzez kontynuowanie wizyty na naszej stronie wyrażasz zgodę na użycie tych ciasteczek. Więcej informacji, w tym o możliwości zmiany ustawień cookies, znajdziesz w naszej Polityce Prywatności.
MENU

Data Science i uczenie maszynowe(eBook)

3.80  [ 13 ocen ]
 Sprawdź recenzje
Rozwiń szczegóły »
  • Wydanie: Warszawa, 1, 2017

  • Autor: Marcin Szeliga

  • Wydawca: Wydawnictwo Naukowe PWN

  • Formaty:
    Mobi
    Epub
    (Watermark)
    Watermark
    Znak wodny czyli Watermark to zaszyfrowana informacja o użytkowniku, który zakupił produkt. Dzięki temu łatwo jest zidentyfikować użytkownika, który rozpowszechnił produkt w sposób niezgodny z prawem. Ten rodzaj zabezpieczenia jest zdecydowanie najbardziej przyjazny dla użytkownika, ponieważ aby otworzyć książkę zabezpieczoną Watermarkiem nie jest potrzebne konto Adobe ID oraz autoryzacja urządzenia.

Cena detaliczna: 89,00 zł
62,30
Cena zawiera podatek VAT.
Oszczędzasz 26,70 zł
Dodaj do schowka
Wysyłka: online

Data Science i uczenie maszynowe

Książka przedstawia uczenie maszynowe w ujęciu praktycznym. Przeprowadzając opisane w niej eksperymenty data science poznamy zastosowanie reguł statystycznych i algorytmów uczenia maszynowego do rozwiązywania konkretnych problemów. Takie podejście oznacza, że studenci informatyki oraz specjaliści — analitycy, informatycy i bazodanowcy — zdobędą nie tylko teoretyczną wiedzę, ale również umiejętność jej praktycznego wykorzystania w codziennej pracy.

  • Sposób dostarczenia produktu elektronicznego
    Produkty elektroniczne takie jak Ebooki czy Audiobooki są udostępniane online po opłaceniu zamówienia kartą lub przelewem na stronie Twoje konto > Biblioteka.
    Pliki można pobrać zazwyczaj w ciągu kilku-kilkunastu minut po uzyskaniu poprawnej autoryzacji płatności, choć w przypadku niektórych publikacji elektronicznych czas oczekiwania może być nieco dłuższy.
    Sprzedaż terytorialna towarów elektronicznych jest regulowana wyłącznie ograniczeniami terytorialnymi licencji konkretnych produktów.
  • Ważne informacje techniczne
    Minimalne wymagania sprzętowe:
    procesor: architektura x86 1GHz lub odpowiedniki w pozostałych architekturach
    Pamięć operacyjna: 512MB
    Monitor i karta graficzna: zgodny ze standardem XGA, minimalna rozdzielczość 1024x768 16bit
    Dysk twardy: dowolny obsługujący system operacyjny z minimalnie 100MB wolnego miejsca
    Mysz lub inny manipulator + klawiatura
    Karta sieciowa/modem: umożliwiająca dostęp do sieci Internet z prędkością 512kb/s
    Minimalne wymagania oprogramowania:
    System Operacyjny: System MS Windows 95 i wyżej, Linux z X.ORG, MacOS 9 lub wyżej, najnowsze systemy mobilne: Android, iPhone, SymbianOS, Windows Mobile
    Przeglądarka internetowa: Internet Explorer 7 lub wyżej, Opera 9 i wyżej, FireFox 2 i wyżej, Chrome 1.0 i wyżej, Safari 5
    Przeglądarka z obsługą ciasteczek i włączoną obsługą JavaScript
    Zalecany plugin Flash Player w wersji 10.0 lub wyżej.
    Informacja o formatach plików:
    • PDF - format polecany do czytania na laptopach oraz komputerach stacjonarnych.
    • EPUB - format pliku, który umożliwia czytanie książek elektronicznych na urządzeniach z mniejszymi ekranami (np. e-czytnik lub smartfon), dając możliwość dopasowania tekstu do wielkości urządzenia i preferencji użytkownika.
    • MOBI - format zapisu firmy Mobipocket, który można pobrać na dowolne urządzenie elektroniczne (np.e-czytnik Kindle) z zainstalowanym programem (np. MobiPocket Reader) pozwalającym czytać pliki MOBI.
    • Audiobooki w formacie MP3 - format pliku, przeznaczony do odsłuchu nagrań audio.
    Rodzaje zabezpieczeń plików:
    • Watermark - (znak wodny) to zaszyfrowana informacja o użytkowniku, który zakupił produkt. Dzięki temu łatwo jest zidentyfikować użytkownika, który rozpowszechnił produkt w sposób niezgodny z prawem. Ten rodzaj zabezpieczenia jest zdecydowanie bardziej przyjazny dla użytkownika, ponieważ aby otworzyć książkę zabezpieczoną Watermarkiem nie jest potrzebne konto Adobe ID oraz autoryzacja urządzenia.
    • Brak zabezpieczenia - część oferowanych w naszym sklepie plików nie posiada zabezpieczeń. Zazwyczaj tego typu pliki można pobierać ograniczoną ilość razy, określaną przez dostawcę publikacji elektronicznych. W przypadku zbyt dużej ilości pobrań plików na stronie WWW pojawia się stosowny komunikat.
Wstęp  XVII
	O czym jest ta książka? XVII
	Data science 	 XVIII
	Uczenie maszynowe 	XX
	Dla kogo jest ta książka? XXI
	Narzędzia  XXII
	Usługa Azure ML XXIII
	Język R 	XXIV
	Microsoft R Open XXV
	Przykładowe dane 	XXVI
	Konwencje i oznaczenia XXVI
1. Uczenie maszynowe jako element eksperymentów data science  1
	1.1. Eksploracja danych jako technika wspomagania decyzji 	 2
	1.2. Modelowanie 4
	1.3. Wiedza i proces uczenia  6
	1.4. Hipotezy 	 9
	1.5. Założenia eksperymentu data science  10
	1.6. Dwa typy analiz 12
	1.7. Data science jako metoda naukowa  12
	1.8. Przykładowy eksperyment – optymalizacja kampanii marketingowej 	 14
		1.8.1. Zrozumienie problemu i określenie celów eksperymentu  15
		1.8.2. Zrozumienie danych  16
		1.8.3. Wstępne przetwarzanie danych  17
		1.8.4. Modelowanie 18
		1.8.5. Ocena 18
		1.8.6. Wdrożenie 	20
	Podsumowanie 	 23
2. Ocena przydatności danych  25
	2.1. Dane źródłowe		26
	2.2. Zmienne  27
		2.2.1. Rozkład częstości zmiennych  30
		2.2.2. Graficzna prezentacja danych	 42
		2.2.3. Korelacje (związki między zmiennymi)  44
	2.3. Reprezentatywność danych  50
	2.4. Duplikaty 	54
	2.5. Szeregi czasowe 56
	Podsumowanie 	63
3. Wstępne przetwarzanie danych 	 65
	3.1. Uzupełnianie brakujących danych  66
	3.2. Poprawianie błędnych danych  71
	3.3. Zmienne numeryczne 	 71
		3.3.1. Instalowanie dodatkowych bibliotek R w Azure ML  72
		3.3.2. Wartości nietypowe (odstające)  73
		3.3.3. Normalizacja 	 75
		3.3.4. Dyskretyzacja  77
	3.4. Zmienne kategoryczne  78
		3.4.1. Problem jakości danych tekstowych  79
		3.4.2. Uogólnienie (generalizacja)  80
		3.4.3. Numerowanie stanów 	81
		3.4.4. Zmienne porządkowe 	83
	3.5. Szeregi czasowe 83
	3.6. Wyrażenia języka naturalnego  89
	3.7. Redukcja wymiarów 	 94
		3.7.1. Usuwanie zmiennych na podstawie ich zdolności predykcyjnych  95
		3.7.2. Analiza głównych składowych (PCA) 	 97
	Podsumowanie 	99
4. Wzbogacanie danych 101
	4.1. Równoważenie danych  102
		4.1.1. Usunięcie części przykładów większościowych 	103
		4.1.2. Nadpróbkowanie  104
	4.2. Zmienne wyliczeniowe  106
	4.3. Zastąpienie zmiennych wspólnym rozkładem prawdopodobieństwa  108
	4.4. Wydzielenie danych testowych 	111
		4.4.1. Szeregi czasowe  115
		4.4.2. Modele rekomendujące	 116
		4.4.3. Modele wykrywania oszustw  116
	4.5. Wzorzec eksperymentu data science 	 116
	Podsumowanie 	117
5. Klasyfikacja 	 119
	5.1. Klasyfikacja poprzez indukcję drzew decyzyjnych  121
		5.1.1. Drzewa decyzyjne – definicja 	 121
		5.1.2. Pojedyncze drzewa decyzyjne  124
		5.1.3. Kombinacje drzew decyzyjnych  126
	5.2. Klasyfikacja z użyciem maszyny wektorów nośnych	141
		5.2.1. Przetwarzanie języka naturalnego przy użyciu maszyny wektorów nośnych 	 143
		5.2.2. Modele maszyny wektorów nośnych i lokalnie głębokiej maszyny wektorów nośnych 	 152
	5.3. Klasyfikacja probabilistyczna  153
		5.3.1. Sieć Bayesa 	157
		5.3.2. Maszyna punktów Bayesa  159
	5.4. Inne klasyfikatory dostępne w Studiu Azure ML 	 161
		5.4.1. Inne klasyfikatory – omówienie  161
		5.4.2. Modele eksploracji danych w języku R 	 163
	5.5. Klasyfikatory binarne a klasyfikacja wieloklasowa  164
	5.6. Wykrywanie oszustw jako przykład klasyfikacji binarnej  167
		5.6.1. Oznaczenie obserwacji  167
		5.6.2. Zrównoważenie danych i wydzielenie danych testowych 	 169
		5.6.3. Wzbogacenie danych 	 169
	Podsumowanie 	172
6. Regresja 	173
	6.1. Model regresji wielorakiej 	 179
		6.1.1 Wieloraka regresja liniowa  181
		6.1.2. Estymacja bayesowska modelu regresji liniowej 	 183
	6.2. Zmienne kategoryczne w modelach regresji 	 185
		6.2.1. Regresja Poissona  186
		6.2.2. Regresja porządkowa  188
	6.3. Regresja kwantylowa  188
	6.4. Regresja poprzez indukcję drzew decyzyjnych  191
	6.5. Sztuczne sieci neuronowe 	 193
		6.5.1. Perceptron 198
		6.5.2. Sieci neuronowe a regresja  200
		6.5.3. Metody minimalizacji błędu	202
		6.5.4. Wsteczna propagacja błędów 	203
		6.5.5. Regresja z użyciem sieci neuronowej 	205
		6.5.6. Głębokie sieci neuronowe 	 209
	Podsumowanie 	218
7. Grupowanie (analiza skupień)  221
	7.1. Na czym polega grupowanie 	 221
	7.2. Algorytmy grupowania 	 225
		7.2.1. Grupowanie hierarchiczne  226
		7.2.2. Grupowanie iteracyjno-optymalizacyjne 	231
	7.3. Grupowanie w celu znajdowania podobnych obiektów  236
	7.4. Grupowanie w celu kompresji  239
	7.5. Wykrywanie anomalii 	 240
	Podsumowanie 	244
8. Rekomendowanie 	245
	8.1. Systemy rekomendujące 		245
	8.2. Odkrywanie asocjacji 	250
	8.3. Model Matchbox Recommender  258
		8.3.1. Rekomendowanie przez filtrowanie kolektywne  258
		8.3.2. Rekomendowanie przez filtrowanie cech przedmiotów i użytkowników (hybrydowe) 	 267
	Podsumowanie 	269
9. Prognozowanie 	271
	9.1. Szeregi czasowe 272
	9.2. Naiwne metody prognozowania 	 274
	9.3. Modele średniej ważonej 	 274
	9.4. Modele ARIMA 283
	9.5. Modele nieliniowe 	288
	9.6. Prognozowanie w Studiu Azure ML	 290
	Podsumowanie 	292
10. Ocena i poprawa jakości modeli  293
	10.1. Reguła powrotu do średniej 	 293
	10.2. Kryteria oceny modeli eksploracji danych  295
		10.2.1. Łatwość interpretacji 	296
		10.2.2. Trafność 296
		10.2.3. Wiarygodność  297
		10.2.4. Wydajność i skalowalność 	297
		10.2.5. Przydatność 	 297
	10.3. Ocena jakości modeli klasyfikacyjnych 	298
		10.3.1. Moduł Evaluate Model  298
		10.3.2. Macierz pomyłek 	299
		10.3.3. Krzywa ROC 	302
		10.3.4. Wykres precyzja w funkcji czułości i wykres zysku  304
		10.3.5. Trafność klasyfikacji  305
		10.3.6. Klasyfikatory wieloklasowe 	307
	10.4. Ocena jakości modeli regresyjnych  308
		10.4.1. Miary oceny modeli 	 308
		10.4.2. Walidacja krzyżowa  310
	10.5. Ocena jakości modeli grupujących  313
	10.6. Ocena jakości modeli rekomendujących 	 315
	10.7. Ocena jakości modeli prognozujących  317
	10.8. Porównanie jakości modeli  322
	10.9. Poprawa jakości modeli  326
		10.9.1. Automatyczna poprawa jakości modeli uczenia nadzorowanego  326
		10.9.2. Znalezienie optymalnej liczby klastrów 	 330
		10.10. Cykl życia eksperymentu data science 	 333
	Podsumowanie 	334
11. Publikacja modeli eksploracji danych jako usług WWW 	 339
	11.1. Wzorcowy eksperyment data science  340
	11.2. Predykcyjne usługi WWW  345
		11.2.1. Zapytania predykcyjne ad-hoc  348
		11.2.2. Wsadowe zapytania predykcyjne  349
Podsumowanie 	352
Bibliografia 	353
Dodatek A  361
Dodatek B  367
NAZWA I FORMAT
OPIS
ROZMIAR

Inni Klienci oglądali również

29,90 zł

Jak być uczonym

Najbardziej odczuwalną przyjemnością związaną z uprawianiem nauki nie jest stan posiadania wiedzy, lecz proces jej zdobywania. Przygoda pioniera, odkrywcy... Wysiłek i ryzyko... I droga, którą się pokonuje. Ale czy przyjemność byłaby aż tak wiel...
9,90 zł

Uczone białogłowy

W „Uczonych białogłowach” Molier wyśmiewa snobowanie się na intelektualizm, zwłaszcza w wydaniu kobiecym. Jak odbierany jest człowiek, który dużo czyta, ale mało rozumie? Molier ujawnia salonowe gierki i powierzchowność obycia oblicz...
99,90 zł

Between Philosophy and Science

A collection of essays which tackles the philosophical issues at play in cosmology, physics, mathematics and neuroscience. Considering topics such as the presence of ontological problems in cosmological theories and physics, it also weighs up the philo...
39,90 zł

300 uczonych prywatnie i na wesoło. Tom 2

Biogramy wybitnych uczonych w encyklopediach najczęściej ograniczają się do suchego zestawienia najważniejszych faktów. Tymczasem uczeni są przede wszystkim ludźmi, wybitnymi indywidualnościami, i mają – jak każdy – przywary, dziwact...
39,90 zł

300 uczonych prywatnie i na wesoło

Biogramy wybitnych uczonych w encyklopediach najczęściej ograniczają się do suchego zestawienia najważniejszych faktów. Tymczasem uczeni są przede wszystkim ludźmi, wybitnymi indywidualnościami, i mają – jak każdy – przywary, dziwact...
33,60 zł

Uczone siostry

Maria Skłodowska zostałaby guwernantką, gdyby nie jej starsza siostra Bronia. Nie pojechałaby do Paryża, nie studiowała na Sorbonie, nie poślubiła Piotra Curie. Nie odkryłaby radioaktywności i nie otrzymała dwukrotnie Nagrody Nobla. Bronia Dłuska zaś b...
49,00 zł

Dlaczego tylko nielicznym udaje się zarabiać w Internecie prawdziwe pieniądze

Dlaczego warto przeczytać tą książkę? Odkryj tajemnice SEO, e-biznesu i marketingu internetowego. Spraw aby pozycjonowanie, optymalizacja konwersji i CTR stały się Twoimi sprzymierzeńcami. Naucz się znajdować naprawdę skuteczne słowa kluczowe i generow...
24,90 zł

Miecz Herobrine'a

Wkrocz w świat Minecrafta i ocal Overworld Piętnastoletni Artur nie cierpi Minecrafta i swojej młodszej siostry Mallu. Kiedy jednak dziewczyna zostaje wciągnięta do Overworldu, brat rusza jej na pomoc. Aby wrócić do domu, rodzeństwo musi stoczyć...
39,90 zł

Niewidzialny w sieci

"Każdy twój ruch w sieci jest monitorowany i zapisywany, a twoja prywatność nieustannie zagrożona. Potężne korporacje, rządy oraz cyberprzestępcy chcą wiedzieć, co robisz, i odpowiednio to wykorzystać. Kontrolują cię, by sprzedawać twoje da...

Recenzje

Nikt nie dodał jeszcze recenzji. Bądź pierwszy!