OSTATNIO DODANE

« Kontynuuj
zakupy

Przejdź
do koszyka »

Processing sets of frequent itemset queries

(eBook)

0.00 [ 0 ocen ]

Dodaj recenzję

Rozwiń szczegóły »

Druk: Poznań, 2013
Autor: Marek Wojciechowski
Wydawca: Wydawnictwo Politechniki Poznańskiej
Formaty:

PDF
(Watermark)

Watermark

Znak wodny czyli Watermark to zaszyfrowana informacja o użytkowniku, który zakupił produkt. Dzięki temu łatwo jest zidentyfikować użytkownika, który rozpowszechnił produkt w sposób niezgodny z prawem. Ten rodzaj zabezpieczenia jest zdecydowanie najbardziej przyjazny dla użytkownika, ponieważ aby otworzyć książkę zabezpieczoną Watermarkiem nie jest potrzebne konto Adobe ID oraz autoryzacja urządzenia.

Dostępne formaty i edycje

Rok wydania

Cena

eBook (PDF)

2013

29,00 zł 26,10 zł

Wypożycz w IBUK.pl

Urządzenia i oprogramowanie do czytania »

Cena katalogowa: 29,00 zł

26,10

zł

Dodaj do schowka

Dostępność: online po opłaceniu

Produkt elektroniczny Plik do pobrania po realizacji zamówienia

Processing sets of frequent itemset queries

This dissertation is devoted to frequent itemset mining regarded as advanced database querying where users specify the source dataset, the minimum frequency threshold, and optionally pattern constraints narrowing the results, and it is up to the data mining system to execute the mining task as efficiently as possible. Building upon existing solutions optimizing the execution of individual queries or sequences of queries, we bring frequent itemset query optimization to another level and consider the problem of efficient processing of sets of frequent itemset queries, analogous to multi-query optimization in database systems. Our solutions target mainly batch processing mode but can be applied to multi-user interactive environments as well.
In this dissertation we formulate the problem of processing sets of frequent itemset queries in the context of a simple, general model of frequent itemset queries independent of particular languages and interfaces, and provide several solutions addressing the problem. The majority of the developed techniques are defined in terms of a data sharing model based on the concept of elementary data selection predicates which represent parts of the dataset shared among the queries. The developed methods of processing sets of frequent itemset queries can be broadly classified into two categories: methods independent of a particular frequent itemset mining algorithm, and the ones designed with a specific algorithm in mind. The explicitly addressed frequent itemset mining algorithms are: Apriori, FP-growth, and Partition, which we claim belong to the most influential ones, and in addition are important from the point of view of possible practical applications. All the proposed techniques are initially formulated and experimentally verified under the assumption that data partitions corresponding to elementary data selection predicates can be selectively retrieved from the database. Afterwards, theoretical and experimental analysis of the influence of available access paths to data on the proposed techniques is conducted.
An important contribution of the dissertation is related to the identified optimization problem occurring in one of the techniques for the Apriori algorithm. The problem concerns handling large batches of queries by dividing the set of queries into subsets executed independently. For the problem formulated as a particular case of hypergraph partitioning, its NP-hardness is proved and several heuristic solutions are provided.

Rozprawa jest poświęcona problemowi odkrywania zbiorów częstych poprzez tzw. zapytania eksploracyjne stanowiące specyfikację zbioru danych źródłowych, wymaganej minimalnej częstości występowania oraz opcjonalnie ograniczeń nakładanych na odkrywane wzorce. Opierając się na istniejących rozwiązaniach w zakresie optymalizacji wykonania pojedynczych zapytań eksploracyjnych oraz sekwencji takich zapytań,
w rozprawie przeniesiono optymalizację zapytań eksploracyjnych dotyczących problemu odkrywania zbiorów częstych na nowy poziom, koncentrując się na optymalizacji wykonania zbiorów zapytań eksploracyjnych, stanowiącej koncepcyjne nawiązanie do optymalizacji zbiorów zapytań w systemach baz danych. Proponowane rozwiązania odnoszą się głównie do systemów eksploracji danych przetwarzających zadania w trybie wsadowym, ale mogą znaleźć zastosowanie również w systemach wielodostępnych, obsługujących wiele współbieżnych sesji interaktywnych.
W rozprawie sformułowano problem przetwarzania zbiorów zapytań eksploracyjnych w kontekście prostego, ogólnego modelu zapytań dotyczącego problemu odkrywania zbiorów częstych, niezależnego od konkretnych języków oraz interfejsów wykorzystywanych w eksploracji danych, i zaproponowano szereg rozwiązań postawionego problemu. Większość opracowanych technik odnosi się do zaproponowanego modelu współdzielenia danych przez zapytania eksploracyjne, opartego na rozłącznych formułach selekcji reprezentujących podzbiory zbioru danych współdzielone przez zapytania. Przedstawione w rozprawie metody przetwarzania zbiorów zapytań eksploracyjnych dotyczących problemu odkrywania zbiorów częstych można ogólnie podzielić na dwie kategorie: metody niezależne od konkretnego algorytmu odkrywania zbiorów częstych oraz te zaprojektowane z myślą o konkretnym algorytmie. Specyficzne metody wykonania zbiorów zapytań zostały opracowane dla algorytmów Apriori, FP-growth i Partition, które należą do najbardziej znaczących algorytmów odkrywania zbiorów częstych i jednocześnie są istotne z punktu widzenia potencjalnych zastosowań. Wszystkie zaproponowane techniki zostały najpierw sformułowane i eksperymentalnie zweryfikowane przy założeniu, że partycje danych odpowiadające rozłącznym formułom selekcji mogą być selektywnie odczytane z bazy danych. Następnie przeprowadzono teoretyczną i eksperymentalną analizę wpływu ścieżek dostępu do danych na ich wydajność.
Ważnym elementem rozprawy jest zidentyfikowany problem optymalizacyjny, występujący w jednej z technik zaproponowanych dla algorytmu Apriori. Problem ten dotyczy obsługi dużych zbiorów zapytań eksploracyjnych poprzez ich podział na niezależnie wykonywane podzbiory. Problem został sformułowany jako szczególny przypadek partycjonowania hipergrafu, udowodniono jego NP-trudność, a także opracowano dla niego kilka heurystyk.

Kategorie:
Język wydania: angielski
ISBN: 978-83-7775-265-4
ISBN druku: 978-83-7775-265-4
Liczba stron: 240

Sposób dostarczenia produktu elektronicznego

Produkty elektroniczne takie jak Ebooki czy Audiobooki są udostępniane online po opłaceniu zamówienia kartą lub przelewem na stronie Twoje konto > Biblioteka.

Pliki można pobrać zazwyczaj w ciągu kilku-kilkunastu minut po uzyskaniu poprawnej autoryzacji płatności, choć w przypadku niektórych publikacji elektronicznych czas oczekiwania może być nieco dłuższy.

Sprzedaż terytorialna towarów elektronicznych jest regulowana wyłącznie ograniczeniami terytorialnymi licencji konkretnych produktów.
Ważne informacje techniczne
Minimalne wymagania sprzętowe:

procesor: architektura x86 1GHz lub odpowiedniki w pozostałych architekturach

Pamięć operacyjna: 512MB

Monitor i karta graficzna: zgodny ze standardem XGA, minimalna rozdzielczość 1024x768 16bit

Dysk twardy: dowolny obsługujący system operacyjny z minimalnie 100MB wolnego miejsca

Mysz lub inny manipulator + klawiatura

Karta sieciowa/modem: umożliwiająca dostęp do sieci Internet z prędkością 512kb/s

Minimalne wymagania oprogramowania:

System Operacyjny: System MS Windows 95 i wyżej, Linux z X.ORG, MacOS 9 lub wyżej, najnowsze systemy mobilne: Android, iPhone, SymbianOS, Windows Mobile

Przeglądarka internetowa: Internet Explorer 7 lub wyżej, Opera 9 i wyżej, FireFox 2 i wyżej, Chrome 1.0 i wyżej, Safari 5

Przeglądarka z obsługą ciasteczek i włączoną obsługą JavaScript

Zalecany plugin Flash Player w wersji 10.0 lub wyżej.

Informacja o formatach plików:
- PDF - format polecany do czytania na laptopach oraz komputerach stacjonarnych.
- EPUB - format pliku, który umożliwia czytanie książek elektronicznych na urządzeniach z mniejszymi ekranami (np. e-czytnik lub smartfon), dając możliwość dopasowania tekstu do wielkości urządzenia i preferencji użytkownika.
- MOBI - format zapisu firmy Mobipocket, który można pobrać na dowolne urządzenie elektroniczne (np.e-czytnik Kindle) z zainstalowanym programem (np. MobiPocket Reader) pozwalającym czytać pliki MOBI.
- Audiobooki w formacie MP3 - format pliku, przeznaczony do odsłuchu nagrań audio.
Rodzaje zabezpieczeń plików:
- Watermark - (znak wodny) to zaszyfrowana informacja o użytkowniku, który zakupił produkt. Dzięki temu łatwo jest zidentyfikować użytkownika, który rozpowszechnił produkt w sposób niezgodny z prawem. Ten rodzaj zabezpieczenia jest zdecydowanie bardziej przyjazny dla użytkownika, ponieważ aby otworzyć książkę zabezpieczoną Watermarkiem nie jest potrzebne konto Adobe ID oraz autoryzacja urządzenia.
- Brak zabezpieczenia - część oferowanych w naszym sklepie plików nie posiada zabezpieczeń. Zazwyczaj tego typu pliki można pobierać ograniczoną ilość razy, określaną przez dostawcę publikacji elektronicznych. W przypadku zbyt dużej ilości pobrań plików na stronie WWW pojawia się stosowny komunikat.
Więcej informacji o publikacjach elektronicznych

Abstract 6

1. Introduction 7

1.1. Data Mining from a Database Perspective 7
1.2. Aim and Scope of the Dissertation 11

2. Frequent Itemset Mining 14

2.1. Overview, Genesis, Applications, and Importance of the Problem 14
2.2. Formulation of the Frequent Itemset Mining Problem 16
2.3. Computational Complexity of the Problem 18
2.4. Overview of Approaches to Frequent Itemset Mining 19
2.4.1. Introduction 19
2.4.2. Search Space Traversal Strategies 20
2.4.3. Database Layout 23
2.4.4. Using Memory to Store Mined Data 26
2.4.5. Itemset Support Counting 27
2.5. Representative Frequent Itemset Mining Algorithms 28
2.5.1. Introduction 28
2.5.2. Apriori 30
2.5.3. FP-growth 36
2.5.4. Partition 39
2.6. Research Trends in Frequent Itemset Mining 41
2.6.1. Introduction 41
2.6.2. Taking Advantage of DBMS Functionality in Frequent Itemset Mining 42
2.6.3. Sampling for Frequent Itemset Mining 44
2.6.4. Concise Representations of Frequent Itemsets 46
2.6.5. Parallel and Distributed Frequent Itemset Mining 49
2.6.6. Frequent Itemset Mining over Data Streams 52
2.6.7. Privacy Preserving Frequent Itemset Mining 54

3. Data Mining as Advanced Querying 57

3.1. Motivation 57
3.2. Prototype Data Mining Query Languages 57
3.3. Data Mining Standards 60
3.4. Data Mining Queries in Contemporary Database Management Systems 67
3.5. Data Mining Queries: Summary of the Current State of the Art and Implications 71

4. Frequent Itemset Query Processing 73

4.1. Constraint-based Frequent Itemset Mining 73
4.2. Reusing Results of Frequent Itemset Queries 76
4.3. Reusing Results vs. Pushing Constraints into the Mining Process 80

5. Processing Batches of Frequent Itemset Queries 82

5.1. Motivation 82
5.2. General Model of Frequent Itemset Queries 83
5.3. Batches of Frequent Itemset Queries and Problem Formulation 85
5.4. Model of Query Data Sharing 87
5.5. Related Work 90

6. Methods Independent of the Mining Algorithm 92

6.1. Sequential Processing with Result Caching and Reusing 92
6.2. Result Filtering and Incremental Mining 93
6.3. Query Scheduling 97
6.4. Query Scheduling with Intermediate Queries 100
6.5. Mine Merge 106
6.6. Experimental Results 111
6.7. Summary and Discussion 116

7. Methods for the Apriori Algorithm 118

7.1. Common Counting 118
7.2. Common Counting with Query Partitioning 120
7.2.1. Motivation 120
7.2.2. Key Issues 121
7.2.3. Query Partitioning as a Case of Hypergraph Partitioning 124
7.2.4. Computational Complexity of the Problem 128
7.2.5. Algorithm CCRecursive 131
7.2.6. Algorithm CCFull 133
7.2.7. Algorithm CCCoarsening 136
7.2.8. Algorithm CCAgglomerative 139
7.2.9. Algorithm CCAgglomerativeNoise 140
7.2.10. Algorithm CCGreedy 142
7.2.11. Algorithm CCSemiGreedy 144
7.3. Common Candidate Tree 145
7.4. Experimental Results 148
7.4.1. Query Partitioning for Common Counting 148
7.4.2. Common Counting vs. Common Candidate Tree 159
7.5. Summary and Discussion 169

8. Methods for the FP-growth Algorithm 171

8.1. Common Building 171
8.2. Common FP-tree 173
8.3. Experimental Results 176
8.4. Summary and Discussion 182

9. Methods for the Partition Algorithm 186

9.1. Integration of Dataset Scans for Partition 186
9.2. Partition Mine Merge Improved 187
9.3. Experimental Results 191
9.4. Summary and Discussion 195

10. Data Access Methods in Processing Sets of Frequent Itemset Queries 197

10.1. Comparison of Proposed Techniques in Terms of Data Access Schemes 197
10.2. Data Organization and Access Methods in Contemporary DBMSs 199
10.3. Techniques of Processing Sets of Frequent Itemset Queries with Full Table Scans 202
10.4. Theoretical Cost Analysis 204
10.5. Experimental Results 207
10.6. Summary and Discussion 214

11. Conclusions and Future Work 216

Bibliography 221
Streszczenie 238

Przeczytaj fragment

Słowa kluczowe: zbiory częste zapytania eksploracyjne

Inne autora

- 14 %

Koszt władzy w polskim samorządzie...

Marek Wojciechowski

eBook (pdf)

30,96 zł

36,00 zł

do koszyka

- 14 %

Samorząd terytorialny w Polsce, Us...

Marek Wojciechowski

eBook (pdf)

18,45 zł

21,45 zł

do koszyka

Inne z kategorii

- 40 %

Balistyka dla snajperów, Praktyczn...

Jerzy Ejsmont

eBook (mobi, epub)

59,40 zł

99,00 zł

do koszyka

- 20 %

Kompetencje przyszłości - wyzwania...

Emilia Żuchowska - Kotlarz, Małgorzata Kozłowska, Martyna Mostowska

eBook (pdf)

47,20 zł

59,00 zł

do koszyka

- 14 %

Nowoczesne metody immobilizacji su...

Sabina Wilkanowicz

eBook (pdf)

31,82 zł

37,00 zł

do koszyka

Podstawy teoretyczne i praktyczne ...

Paweł Knast, Ryszard Maciejewski

eBook (pdf)

49,50 zł

55,00 zł

do koszyka

- 14 %

Technologia produktów naftowych

Marcin Przedlacki, Aneta Lorek, Maciej Paczuski

eBook (pdf)

32,68 zł

38,00 zł

do koszyka

- 14 %

Wpływ oczyszczonych ścieków komuna...

Katarzyna Affek

eBook (pdf)

25,80 zł

30,00 zł

do koszyka

- 40 %

1001 drobiazgów z teorii obwodów, ...

Edward Śliwa, Marek Nałęcz

eBook (mobi, epub)

35,40 zł

59,00 zł

do koszyka

50 origami dla dzieci

Marcelina Grabowska-Piątek

eBook (pdf)

13,49 zł

14,99 zł

do koszyka

- 14 %

Administrowanie i zarządzanie jako...

Agnieszka Tomczak, Małgorzata Duczkowska-Piasecka

eBook (pdf)

26,66 zł

31,00 zł

do koszyka

Advances in mechanical engineering

Olaf Ciszak

eBook (pdf)

54,00 zł

60,00 zł

do koszyka

Aktualne problemy badawcze 1. Obsz...

Uniwesytet Warmińsko- Mazurski

eBook (pdf)

31,50 zł

35,00 zł

do koszyka

Aktualne problemy badawcze 3. Księ...

Uniwersytet Warmińsko- Mazurski

eBook (pdf)

36,00 zł

40,00 zł

do koszyka

AKTUALNE PROBLEMY BADAWCZE NAUKI B...

Dobrochna Ossowska-Salamonowicz, Monika Giżyńska

eBook (pdf)

36,00 zł

40,00 zł

do koszyka

Aktualne problemy badawcze. Nauki ...

Magdalena Golińska- Konecko

eBook (pdf)

54,00 zł

60,00 zł

do koszyka

Aktualne problemy budownictwa. Arc...

Robert Ast

eBook (pdf)

18,90 zł

21,00 zł

do koszyka

Zobacz wszystkie »

Inne wydawcy

Absolwent uczelni - pracownik wied...

Agnieszka Krugiełka, Grażyna Bartkowiak

eBook (pdf)

18,00 zł

20,00 zł

do koszyka

Advances in mechanical engineering

Olaf Ciszak

eBook (pdf)

54,00 zł

60,00 zł

do koszyka

Algorytmy i metody optymalizacji p...

Andrzej Frąckowiak

eBook (pdf)

13,50 zł

15,00 zł

do koszyka

Analityczno-pomiarowa metoda wyzna...

Paweł Michnikowski

eBook (pdf)

22,50 zł

25,00 zł

do koszyka

Analiza procesu rozpylania cieczy ...

Marek Ochowiak

eBook (pdf)

16,20 zł

18,00 zł

do koszyka

Analiza stanów pracy i synteza tra...

Wiesław Łyskawiński

eBook (pdf)

23,40 zł

26,00 zł

do koszyka

Analiza sytuacji Wielkopolski w k...

Magdalena K. Wyrwicka

eBook (pdf)

15,30 zł

17,00 zł

do koszyka

Analiza wybranych zjawisk sprzężon...

Paweł Idziak

eBook (pdf)

18,00 zł

20,00 zł

do koszyka

Analiza zagadnień odwrotnych przew...

Henryk Kamiński

eBook (pdf)

18,90 zł

21,00 zł

do koszyka

Architekci i ich miasta

Piotr Marciniak, Joanna Paradowska

eBook (pdf)

55,80 zł

62,00 zł

do koszyka

Architektura i urbanistyka Poznani...

Piotr Marciniak

eBook (pdf)

36,00 zł

40,00 zł

do koszyka

Architektura i Urbanistyka Zeszyt ...

Praca zbiorowa

ePrasa (pdf)

2,09 zł

2,20 zł

do koszyka

Architektura i Urbanistyka Zeszyt ...

Praca zbiorowa

ePrasa (pdf)

1,90 zł

2,00 zł

do koszyka

Architektura i Urbanistyka Zeszyt ...

Praca zbiorowa

ePrasa (pdf)

6,84 zł

7,20 zł

do koszyka

Architektura i Urbanistyka Zeszyt ...

Praca zbiorowa

ePrasa (pdf)

2,57 zł

2,70 zł

do koszyka

Zobacz wszystkie »

Inni Klienci oglądali również

116,10 zł

129,00 zł

Internet. Przetwarzanie danych osobowych. Processing of personal data

Przetwarzanie danych osobowych jest od półwiecza przedmiotem regulacji prawnych, zmieniających się w miarę rozwoju społeczeństwa informacyjnego, skupionego na zmniejszaniu niepewności. W kształtowaniu standardów ochrony godności osó...

- 14 %

12,90 zł

15,00 zł

Optical Information Processing

This elaboration describes the exemplary material needed for Optical Information Processing laboratory exercises – the course at the Faculty of Physics at Warsaw University of Technology. The topics were chosen as complementary for a better under...

- 14 %

11,18 zł

13,00 zł

Modeling of complex data sets and risk analysis

This monograph is the result of research conducted by employees and doctoral students at the Department of Demography and Economics Statistics. The subject of research, according to the title, focuses on modeling of complex data sets and risk analysis....

44,10 zł

49,00 zł

Ekologiczne techniki grafiki warsztatowej

WstępKsiążka jest poświęcona zagadnieniom zastosowanianietoksycznych metod w graficewarsztatowej. Od lat 90. XX w. zauważalne jestduże zainteresowanie ekologicznym aspektemtechnologii graficznych, głównie w USA, Kan...

- 40 %

59,40 zł

99,00 zł

Instalacje fotowoltaiczne w systemie elektroenergetycznym

Niniejsza unikatowa publikacja dotyczy bardzo ważnej kwestii rozwoju OZE w Polsce, a w szczególności poświęcona jest kwestiom technicznym oraz organizacyjnym instalacji fotowoltaicznych wraz z możliwościami ich wykorzystania i włączenia do systemu elek...

- 40 %

71,40 zł

119,00 zł

Metrologia geometryczna powierzchni technologicznych

Przedstawiamy wyjątkową publikację – kompendium poświęcone tematyce metrologii i analizie powierzchni. Publikacja powstała dzięki kilkudziesięcioletniemu doświadczeniu w przemyśle oraz dokonaniom badawczym i naukowym jej Autora – profesora ...

- 14 %

12,90 zł

15,00 zł

Wybrane zagadnienia modelowa i optymalizacji skraplaczy energetycznych i wymienników regeneracyjnych

Celem niniejszej pracy jest synteza i podsumowanie prowadzonych przez autora badań na temat modelowania cieplno-przepływowego maszyn i urządzeń służącychgłównie poprawie efektywności bloków energetycznych. Poprawa efektywności bloku...

26,10 zł

29,00 zł

Estymacja punktu pracy w celu optymalizacji geometrii elementów palisady sprężarkowej

W rozprawie przedstawiono koncepcję modelu hierarchicznego dotyczącego projektowania lotniczych silników turbinowych, przy uwzględnieniu projektowania funkcjonalnego, konstrukcyjnego i technologicznego. Podano wyniki obliczeń parametrów j...

- 40 %

38,40 zł

64,00 zł

Drgania i hałas w inżynierii maszyn

Publikacja ta, napisana przez profesora Politechniki Wrocławskiej – Wydział Mechaniczny, odnosi się do istotnych inżynierskich zagadnień dotyczących drgań maszyn oraz redukcji hałasu.W książce „Drgania i hałas w inżynierii maszyn&rdqu...

Nikt nie dodał jeszcze recenzji. Bądź pierwszy!

Processing sets of frequent itemset queries

Druk: Poznań, 2013

Autor: Marek Wojciechowski

Wydawca: Wydawnictwo Politechniki Poznańskiej

Opis

Dane szczegółowe

Spis treści

Processing sets of frequent itemset queries

Przeczytaj fragment

Koszt władzy w polskim samorządzie...

Samorząd terytorialny w Polsce, Us...

Balistyka dla snajperów, Praktyczn...

Kompetencje przyszłości - wyzwania...

Nowoczesne metody immobilizacji su...

Podstawy teoretyczne i praktyczne ...

Technologia produktów naftowych

Wpływ oczyszczonych ścieków komuna...

1001 drobiazgów z teorii obwodów, ...

50 origami dla dzieci

Administrowanie i zarządzanie jako...

Advances in mechanical engineering

Aktualne problemy badawcze 1. Obsz...

Aktualne problemy badawcze 3. Księ...

AKTUALNE PROBLEMY BADAWCZE NAUKI B...

Aktualne problemy badawcze. Nauki ...

Aktualne problemy budownictwa. Arc...

Absolwent uczelni - pracownik wied...

Advances in mechanical engineering

Algorytmy i metody optymalizacji p...

Analityczno-pomiarowa metoda wyzna...

Analiza procesu rozpylania cieczy ...

Analiza stanów pracy i synteza tra...

Analiza sytuacji Wielkopolski w k...

Analiza wybranych zjawisk sprzężon...

Analiza zagadnień odwrotnych przew...

Architekci i ich miasta

Architektura i urbanistyka Poznani...

Architektura i Urbanistyka Zeszyt ...

Architektura i Urbanistyka Zeszyt ...

Architektura i Urbanistyka Zeszyt ...

Architektura i Urbanistyka Zeszyt ...

Inni Klienci oglądali również

Internet. Przetwarzanie danych osobowych. Processing of personal data

Optical Information Processing

Modeling of complex data sets and risk analysis

Ekologiczne techniki grafiki warsztatowej

Instalacje fotowoltaiczne w systemie elektroenergetycznym

Metrologia geometryczna powierzchni technologicznych

Wybrane zagadnienia modelowa i optymalizacji skraplaczy energetycznych i wymienników regeneracyjnych

Estymacja punktu pracy w celu optymalizacji geometrii elementów palisady sprężarkowej

Drgania i hałas w inżynierii maszyn

Recenzje