Návrh aplikace pro analýzu velkých dat s využitím algoritmů strojového učení
Show simple item record
dc.contributor.advisor |
Kovářík, Martin
|
|
dc.contributor.author |
Burdík, Martin
|
|
dc.date.accessioned |
2017-07-03T09:14:44Z |
|
dc.date.available |
2017-07-03T09:14:44Z |
|
dc.date.issued |
2016-12-15 |
|
dc.identifier |
Elektronický archiv Knihovny UTB |
|
dc.identifier.uri |
http://hdl.handle.net/10563/40691
|
|
dc.description.abstract |
Velká data jsou data, které není možné analyzovat konvenčním přístupem na jednom zařízení. Jednou z možností je využít distribuovaného zpracování pro rozložení zátěže mezi více zařízení a data zpracovat s využitím strojového učení. Tímto přístupem je možné z velkého množství nestrukturovaných dat získat cenné znalosti. Tyto přístupy jsou popsány v teoretické částí práce. Mimo jiné se ukázalo, že distribuované zpracování má kromě výhod také určité nevýhody. Tyto nevýhody popisuje CAP teorém a je na ně potřeba myslet při návrhu aplikací. V praktické části je navržena aplikace, která na základě analýzy dat doporučuje uživateli produkty. Ukázalo se také, že programovací jazyk Python je díky svým knihovnám kvalitní nástroj, snadno použitelný pro datové analýzy. |
|
dc.format |
70 |
|
dc.language.iso |
cs |
|
dc.publisher |
Univerzita Tomáše Bati ve Zlíně |
|
dc.rights |
Bez omezení |
|
dc.subject |
Velká data
|
cs |
dc.subject |
distribuované zpracování
|
cs |
dc.subject |
strojové učení
|
cs |
dc.subject |
analýza dat
|
cs |
dc.subject |
systém pro doporučová-ní
|
cs |
dc.subject |
Big data
|
en |
dc.subject |
distributed computing
|
en |
dc.subject |
machine learning
|
en |
dc.subject |
data analysis
|
en |
dc.subject |
recommendation system
|
en |
dc.title |
Návrh aplikace pro analýzu velkých dat s využitím algoritmů strojového učení |
|
dc.title.alternative |
Design of Application for Big Data Analysis Based on Machine Learning |
|
dc.type |
diplomová práce |
cs |
dc.contributor.referee |
Pivnička, Michal |
|
dc.date.accepted |
2017-05-23 |
|
dc.description.abstract-translated |
Big data are data, which can´t be analyzed by convention methods on a single device. One of possible solutions is to use distributed processing to divide workload across multiple devices and to process data using machine learning. With this approach it is possible to gain valuable knowledge from a large number of unstructured data. These approaches are described in the theoretical part of the thesis. Among other things, it was shown that the distributed processing has advantages as well as certain disadvantages. These disadvantages are described by CAP theorem, and it is needed to think about them while designing applications. In the practical part of this thesis, the application is designed for product recommendation based on the data analysis. It was also shown that the programming language Python is a quality tool that showed a good performance and is easy to use for data analysis. |
|
dc.description.department |
Ústav průmyslového inženýrství a informačních systémů |
|
dc.thesis.degree-discipline |
Průmyslové inženýrství |
cs |
dc.thesis.degree-discipline |
Industrial Engineering |
en |
dc.thesis.degree-grantor |
Univerzita Tomáše Bati ve Zlíně. Fakulta managementu a ekonomiky |
cs |
dc.thesis.degree-grantor |
Tomas Bata University in Zlín. Faculty of Management and Economics |
en |
dc.thesis.degree-name |
Ing. |
|
dc.thesis.degree-program |
Systémové inženýrství a informatika |
cs |
dc.thesis.degree-program |
System Engineering and Informatics |
en |
dc.identifier.stag |
46530
|
|
utb.result.grade |
E |
|
dc.date.submitted |
2017-04-13 |
|
Files in this item
This item appears in the following Collection(s)
Show simple item record
Search DSpace
Browse
-
All of DSpace
-
This Collection
My Account