Informacja o cookies
Strona ksiegarnia.pwn.pl korzysta z plików cookies w celu dostarczenia Ci oferty jak najlepiej dopasowanej do Twoich oczekiwań i preferencji, jak również w celach marketingowych i analitycznych. Nasi partnerzy również mogą używać ciasteczek do profilowania i dopasowywania do Ciebie pokazywanych treści na naszych stronach oraz w reklamach. Poprzez kontynuowanie wizyty na naszej stronie wyrazasz zgode na uzycie tych ciasteczek. Wiecej informacji, w tym o mozliwosci zmiany ustawien cookies, znajdziesz w naszej Polityce Prywatnosci.
MENU
Podręczniki na studia

Praktyczne uczenie maszynowe(eBook)

4.20  [ 5 ocen ]
 Sprawdź recenzje
Rozwiń szczegóły »
  • Wydanie: Warszawa, 1, 2019

  • Autor: Marcin Szeliga

  • Wydawca: Wydawnictwo Naukowe PWN

  • Formaty:
    mobi
    ePub
    (Watermark)
    Watermark
    Znak wodny czyli Watermark to zaszyfrowana informacja o użytkowniku, który zakupił produkt. Dzięki temu łatwo jest zidentyfikować użytkownika, który rozpowszechnił produkt w sposób niezgodny z prawem. Ten rodzaj zabezpieczenia jest zdecydowanie najbardziej przyjazny dla użytkownika, ponieważ aby otworzyć książkę zabezpieczoną Watermarkiem nie jest potrzebne konto Adobe ID oraz autoryzacja urządzenia.

Dostępne formaty i edycje
Rok wydania
Cena
Cena detaliczna: 89,00 zł
62,30
Cena zawiera podatek VAT.
Oszczędzasz 26,70 zł
Dodaj do schowka
Wysyłka: online

Praktyczne uczenie maszynowe

Nagroda główna w Konkursie PTI - Najlepsza Polska Książka Informatyczna 2020 roku

Ostatnia dekada to czas bezprecedensowego rozwoju sztucznej inteligencji – nie tylko przełomowych badań nad algorytmami uczenia maszynowego, ale również coraz powszechniejszego stosowania inteligentnych maszyn w najróżniejszych dziedzinach naszego życia. Rozwój ten ogranicza niewystarczająca liczba specjalistów, łączących znajomość modelowania danych (przygotowania danych i zasad działania algorytmów uczenia maszynowego) ze znajomością języków analizy danych, takich jak SQL, R czy Python. Inżynieria danych (ang. data science) to interdyscyplinarna wiedza, której opanowanie wymaga znajomości algebry, geometrii, statystyki, rachunku prawdopodobieństwa i algorytmiki, uzupełnionej o praktyczną umiejętność programowania. Co więcej, sztuczna inteligencja jest przedmiotem intensywnych badań naukowych i samo śledzenie postępów w tej dziedzinie wiąże się z regularnym (codziennym) dokształcaniem.

Niniejsza książka łączy w sobie teorię z praktyką. Opisuje rozwiązania kilkunastu typowych problemów, takich jak prognozowanie zysków, optymalizacja kampanii marketingowej, proaktywna konserwacja sprzętu czy oceny ryzyka kredytowego. Ich układ jest celowy – każdy przykład jest okazją do wyjaśnienia określonych zagadnień, zaczynając od narzędzi, przez podstawy uczenia maszynowego, sposoby oceny jakości danych i ich przygotowania do dalszej analizy, zasady tworzenia modeli uczenia maszynowego i ich optymalizacji, po wskazówki dotyczące wdrożenia gotowych modeli do produkcji.

Książka jest adresowana do wszystkich, którzy chcieliby poznać lub udoskonalić:

  • praktyczną znajomość statystki i umiejętność wizualizacji danych niezbędnej do oceny jakości danych;
  • praktyczną znajomość języka SQL, R lub Python niezbędnej do uporządkowania,
  • wstępnego przygotowania i wzbogacenia danych;
  • zasady działania poszczególnych algorytmów uczenia maszynowego koniecznych do ich wyboru i optymalizacji;
  • korzystanie z języka R lub Python do stworzenia, oceny, zoptymalizowania i wdrożenia do produkcji modeli eksploracji danych.

Zarówno studenci kierunków informatycznych, jak również analitycy, programiści, administratorzy baz danych oraz statystycy znajdą w książce informacje, które pozwolą im opanować praktyczne umiejętności potrzebne do samodzielnego tworzenia systemów uczenia maszynowego.

Nagroda główna w Konkursie Polskiego Towarzystwa Informatycznego na Najlepszą Polską Książkę Informatyczną 2020 roku, w kategorii podręczniki i książki popularnonaukowe.

  • Sposób dostarczenia produktu elektronicznego
    Produkty elektroniczne takie jak Ebooki czy Audiobooki są udostępniane online po opłaceniu zamówienia kartą lub przelewem na stronie Twoje konto > Biblioteka.
    Pliki można pobrać zazwyczaj w ciągu kilku-kilkunastu minut po uzyskaniu poprawnej autoryzacji płatności, choć w przypadku niektórych publikacji elektronicznych czas oczekiwania może być nieco dłuższy.
    Sprzedaż terytorialna towarów elektronicznych jest regulowana wyłącznie ograniczeniami terytorialnymi licencji konkretnych produktów.
  • Ważne informacje techniczne
    Minimalne wymagania sprzętowe:
    procesor: architektura x86 1GHz lub odpowiedniki w pozostałych architekturach
    Pamięć operacyjna: 512MB
    Monitor i karta graficzna: zgodny ze standardem XGA, minimalna rozdzielczość 1024x768 16bit
    Dysk twardy: dowolny obsługujący system operacyjny z minimalnie 100MB wolnego miejsca
    Mysz lub inny manipulator + klawiatura
    Karta sieciowa/modem: umożliwiająca dostęp do sieci Internet z prędkością 512kb/s
    Minimalne wymagania oprogramowania:
    System Operacyjny: System MS Windows 95 i wyżej, Linux z X.ORG, MacOS 9 lub wyżej, najnowsze systemy mobilne: Android, iPhone, SymbianOS, Windows Mobile
    Przeglądarka internetowa: Internet Explorer 7 lub wyżej, Opera 9 i wyżej, FireFox 2 i wyżej, Chrome 1.0 i wyżej, Safari 5
    Przeglądarka z obsługą ciasteczek i włączoną obsługą JavaScript
    Zalecany plugin Flash Player w wersji 10.0 lub wyżej.
    Informacja o formatach plików:
    • PDF - format polecany do czytania na laptopach oraz komputerach stacjonarnych.
    • EPUB - format pliku, który umożliwia czytanie książek elektronicznych na urządzeniach z mniejszymi ekranami (np. e-czytnik lub smartfon), dając możliwość dopasowania tekstu do wielkości urządzenia i preferencji użytkownika.
    • MOBI - format zapisu firmy Mobipocket, który można pobrać na dowolne urządzenie elektroniczne (np.e-czytnik Kindle) z zainstalowanym programem (np. MobiPocket Reader) pozwalającym czytać pliki MOBI.
    • Audiobooki w formacie MP3 - format pliku, przeznaczony do odsłuchu nagrań audio.
    Rodzaje zabezpieczeń plików:
    • Watermark - (znak wodny) to zaszyfrowana informacja o użytkowniku, który zakupił produkt. Dzięki temu łatwo jest zidentyfikować użytkownika, który rozpowszechnił produkt w sposób niezgodny z prawem. Ten rodzaj zabezpieczenia jest zdecydowanie bardziej przyjazny dla użytkownika, ponieważ aby otworzyć książkę zabezpieczoną Watermarkiem nie jest potrzebne konto Adobe ID oraz autoryzacja urządzenia.
    • Brak zabezpieczenia - część oferowanych w naszym sklepie plików nie posiada zabezpieczeń. Zazwyczaj tego typu pliki można pobierać ograniczoną ilość razy, określaną przez dostawcę publikacji elektronicznych. W przypadku zbyt dużej ilości pobrań plików na stronie WWW pojawia się stosowny komunikat.
Od autora IX
	Sztuczna inteligencja 1
O książce 7
	Dla kogo jest ta 7
	Narzędzia 8
	Przykłady 9
	Bibliografia 10
	Konwencje i oznaczenia 10
1. Narzędzia 11
	1.1. Język Python 12
	1.2. Język R 12
		1.2.1. Microsoft R Open (MRO) 14
		1.2.2. Microsoft R Client (MRC) 14
		1.2.3. Microsoft Machine Learning Server (MLS) 15
	1.3. SQL Server 2019 15
		1.3.1. Instalacja 16
		1.3.2. Microsoft SQL Server Machine Learning Services 20
		1.3.3. Bezpieczeństwo 29
		1.3.4. Wydajność 32
	1.4. PyCharm Community Edition 39
	1.5. RStudio Desktop 40
	1.6. Instalacja dodatkowych pakietów 42
	1.7. Power BI Desktop 46
2. Praca z SQL Server Machine Learning Services 47
	2.1. Wykrywanie oszustw 47
	2.2. Klasyfikacja przejazdów 56
	2.3. Dodatkowe funkcjonalności serwera SQL Server i usługi SQL Machine Learning Services 67
		2.3.1. Zapytania predykcyjne czasu rzeczywistego 67
		2.3.2. Natywne zapytania predykcyjne 69
		2.3.3. Tworzenie modeli dla partycji danych 70
3. Wstęp do uczenia maszynowego 75
	3.1. Rodzaje uczenia maszynowego 76
	3.2. Proces uczenia 78
	3.3. Modele regresji 84
	3.4. Modele partycjonujące 98
	3.5. Metodyka CRISP-DM 115
	3.6. Metodyka TDSP 117
4. Zrozumienie danych 119
	4.1. Poznanie danych wymaga zrozumienia postawionego problemu 120
	4.2. Statystyki opisowe 121
		4.2.1. Zmienne numeryczne 123
		4.2.2. Zmienne kategoryczne 133
	4.3. Brakujące dane 134
	4.4. Entropia 135
	4.5. Ocena zmiennych za pomocą programu Power BI 136
	4.6. Ocena zmiennych przy użyciu języka SQL 138
		4.6.1. Automatyczny opis zmiennych 143
	4.7. Wizualizacja zmiennych 147
	4.8. Reprezentatywność danych 151
	4.9. Korelacje między zmiennymi 153
		4.9.1. Klątwa wymiarowości 154
		4.9.2. Ocena przydatności zmiennych 157
		4.9.3. Dwie zmienne numeryczne 158
		4.9.4. Dwie zmienne kategoryczne 160
		4.9.5. Dwie zmienne porządkowe 161
		4.9.6. Zmienna kategoryczna i numeryczna 162
		4.9.7. Korelacja oznacza współwystępowanie, a nie związek przyczynowo-skutkowy 163
	4.10. Ocena korelacji za pomocą programu Power BI 164
	4.11. Ocena korelacji przy użyciu języka SQL 166
5. Przygotowanie danych 169
	5.1. Uporządkowanie danych 171
	5.2. Wzbogacanie danych 176
		5.2.1. Data i czas 182
	5.3. Wyczyszczenie danych 183
		5.3.1. Usuwanie brakujących wartości 183
		5.3.2. Usuwanie duplikatów 186
		5.3.3. Usuwanie błędnych danych 187
		5.3.4. Usuwanie wartości odstających 188
	5.4. Przekształcenie danych 190
		5.4.1. Kodowanie 190
		5.4.2. Generalizacja 193
		5.4.3. Zaokrąglanie 195
		5.4.4. Dyskretyzacja 195
		5.4.5. Skalowanie 198
		5.4.6. Wygładzanie 201
	5.5. Redukcja danych 208
		5.5.1. Selekcja zmiennych 208
		5.5.2. Analiza składowych głównych 210
		5.5.3. Wybór zmiennych przydatnych dla modelu 214
	5.6. Podział danych 215
		5.6.1. Podział warstwowy 216
		5.6.2. Równoważenie danych 217
		5.6.3. k-krotna walidacja krzyżowa 219
	5.7. Danych walidacyjnych używa się do optymalizacji, a nie do oceny modeli 222
	5.8. Kto miał szansę przeżyć katastrofę Titanica? 223
6. Analiza skupień 235
	6.1. Grupowanie w celu zmniejszenia liczby przykładów 236
	6.2. Algorytmy iteracyjno-optymalizacyjne 238
	6.3. Segmentacja 245
7. Regresja 255
	7.1. Zrozumienie problemu 255
	7.2. Zrozumienie danych 257
	7.3. Opisanie danych 263
	7.4. Ocena przydatności danych 266
	7.5. Wzbogacenie danych 267
	7.6. Ocena zmiennych 268
	7.7. Przekształcenie i wybór danych 269
	7.8. Modelowanie 272
		7.8.1. Uczenie na błędach 273
		7.8.2. Regresja liniowa 280
		7.8.3. Ogólny model liniowy GLM 285
		7.8.4. Sztuczne sieci neuronowe 288
		7.8.5. Drzewa regresyjne 305
		7.8.6. Kombinacje modeli 309
	7.9. Porównanie modeli 310
	7.10. Wdrożenie modeli po stronie serwera SQL 314
8. Klasyfikacja 319
	8.1. Klasyfikacja binarna 320
		8.1.1. Przygotowanie danych 321
		8.1.2. Regresja logistyczna 323
		8.1.3. Sztuczne sieci neuronowe 329
		8.1.4. Klasyfikacja przez indukcję drzew decyzyjnych 334
		8.1.5. Kombinacje modeli 346
		8.1.6. Porównanie modeli 350
		8.1.7. Wdrożenie modeli po stronie serwera SQL 354
	8.2. Klasyfikacja wieloklasowa 358
		8.2.1. Przygotowanie danych 361
		8.2.2. Regresja logistyczna 363
		8.2.3. Sztuczne sieci neuronowe 366
		8.2.4. Klasyfikacja przez indukcję drzew decyzyjnych 369
		8.2.5. Porównanie modeli 375
		8.2.6. Wdrożenie modeli po stronie serwera SQL 377
9. Ocena modeli 383
	9.1. Nie ma darmowego lunchu 384
	9.2. Błędy modeli predykcyjnych 385
		9.2.1. Błąd systematyczny i błąd aproksymacji 387
	9.3. Kryteria oceny modeli regresji 390
		9.3.1. Średni błąd bezwzględny 391
		9.3.2. Pierwiastek błędu średniokwadratowego 391
		9.3.3. Znormalizowany błąd bezwzględny 392
		9.3.4. Znormalizowany błąd kwadratowy 392
		9.3.5. Współczynnik determinacji R2 393
		9.3.6. Ocena modelu prognozującego pozostały czas bezawaryjnej pracy urządzeń 393
	9.4. Kryteria oceny modeli klasyfikacji binarnej 398
		9.4.1. Macierz błędów 399
		9.4.2. Trafność 400
		9.4.3. Precyzja 401
		9.4.4. Czułość 401
		9.4.5. F-miara 402
		9.4.6. Współczynnik Kappa Cohena 402
		9.4.7. Krzywa ROC i obszar pod krzywą 403
		9.4.8. Ocena modelu klasyfikującego urządzenia jako wymagające lub niewymagające przeglądu 404
	9.5. Kryteria oceny modeli klasyfikacji wieloklasowej 413
		9.5.1. Macierz błędów 413
		9.5.2. Metryki klasy większościowej 414
		9.5.3. Metryki poszczególnych klas 414
		9.5.4. Średnie makro 415
		9.5.5. Średnie mikro 416
	9.6. Ocena modelu klasyfikującego urządzenia do przeglądu 417
	9.7. Interpretacja predykcji 423
10. Optymalizacja i wdrożenie modeli 427
	10.1. Zrozumienie problemu 427
	10.2. Zrozumienie i przygotowanie danych 428
		10.2.1. Import danych 429
		10.2.2. Ocena danych 434
	10.3. Modelowanie 442
	10.4. Optymalizacja 446
	10.5. Wdrożenie 452
		10.5.1. Analiza typu Co by było, gdyby? 456
Posłowie 461
Bibliografia 463
NAZWA I FORMAT
OPIS
ROZMIAR

Przeczytaj fragment

NAZWA I FORMAT
OPIS
ROZMIAR
(epub)
Brak informacji
(mobi)
Brak informacji

4,99 zł

Uczone fantazye

Dzieło Wojciecha Dzieduszyckiego. Wojciech Dzieduszycki, to hrabia, polski aktor, śpiewak, dyrygent, dziennikarz, autor tekstów kabaretowych, działacz kulturalny, recenzent muzyczny i teatralny oraz inżynier.
4,99 zł

W tle

Witkiewicz Stanisław (1851-1915), ojciec S.I. Witkiewicza, prozaik, malarz, krytyk. Dzieciństwo spędził wraz z rodziną na Syberii, dokąd został zesłany jego ojciec za udział w powstaniu styczniowym. 1868-1871 studiował w Akademii Sztuk Pięknych w Peter...
4,99 zł

Księstwo Warszawskie

"Księstwo Warszawskie: wspomnienia i obrazy" autorstwa Artura Oppmana. Artur Oppman to poeta polski okresu Młodej Polski pisujący pod pseudonimem Or-Ot. Młodzieńcze utwory poety były drukowane w Kurierze Warszawskim, Wędrowcu i Kurierze Codzi...
4,99 zł

Gorzałka t. 2

Dzieło Adolfa Dygasińskiego. Adolf Dygasiński, to polski powieściopisarz, publicysta, pedagog, jeden z głównych przedstawicieli naturalizmu w literaturze polskiej.
4,99 zł

Dyzma Bończa Tomaszewski

Dzieło Antoniego Józefa Rolle. Antoni Józef Apolinary Rolle (1830-1894) to polski lekarz, historyk amator, autor wielu opracowań medycznych oraz historycznych poświęconych kresom multańskim. Absolwent Uniwersytetu Kijowskiego, przez więks...
4,99 zł

Ostatnia szarża

Zbiór wierszy z 1907 roku autorstwa polskiego poety i prozaika Kazimierza Laskowskiego (ur. 1851 r.). Laskowski był autorem wielu piosnek, najczęściej nawiązujących do wydarzeń bieżących. Jego utwory ukazywały się w Kurierze Warszawskim, Gazecie...
4,99 zł

Mąż od biedy

Mąż od biedy to krótkie opowiadanie o pewnej mieszczańskiej rodzinie. Bałucki trafnie, z wielką lekkością pióra wytyka swoim bohaterom szereg wad, krytykuje styl życia.
4,99 zł

Uciekła mi przepióreczka

Żeromski Stefan, pseudonimy Maurycy Zych, Józef Katerla (1864-1925), prozaik, dramatopisarz, publicysta. Pochodził ze zubożałej rodziny szlacheckiej. Studia w Instytucie Weterynaryjnym w Warszawie przerwał 1888 z braku środków do życia. N...
4,99 zł

Poradnik dla dłużników

Poradnik dla dłużników to poemat z 1901 roku autorstwa polskiego poety i prozaika Kazimierza Laskowskiego (ur. 1851 r.). Laskowski był autorem wielu piosnek, najczęściej nawiązujących do wydarzeń bieżących. Jego utwory ukazywały się w Kurierze W...

Recenzje

Nikt nie dodał jeszcze recenzji. Bądź pierwszy!