Návrh aplikace pro analýzu velkých dat s využitím algoritmů strojového učení

DSpace Repository

Language: English čeština 

Návrh aplikace pro analýzu velkých dat s využitím algoritmů strojového učení

Show simple item record

dc.contributor.advisor Kovářík, Martin
dc.contributor.author Burdík, Martin
dc.date.accessioned 2017-07-03T09:14:44Z
dc.date.available 2017-07-03T09:14:44Z
dc.date.issued 2016-12-15
dc.identifier Elektronický archiv Knihovny UTB
dc.identifier.uri http://hdl.handle.net/10563/40691
dc.description.abstract Velká data jsou data, které není možné analyzovat konvenčním přístupem na jednom zařízení. Jednou z možností je využít distribuovaného zpracování pro rozložení zátěže mezi více zařízení a data zpracovat s využitím strojového učení. Tímto přístupem je možné z velkého množství nestrukturovaných dat získat cenné znalosti. Tyto přístupy jsou popsány v teoretické částí práce. Mimo jiné se ukázalo, že distribuované zpracování má kromě výhod také určité nevýhody. Tyto nevýhody popisuje CAP teorém a je na ně potřeba myslet při návrhu aplikací. V praktické části je navržena aplikace, která na základě analýzy dat doporučuje uživateli produkty. Ukázalo se také, že programovací jazyk Python je díky svým knihovnám kvalitní nástroj, snadno použitelný pro datové analýzy.
dc.format 70
dc.language.iso cs
dc.publisher Univerzita Tomáše Bati ve Zlíně
dc.rights Bez omezení
dc.subject Velká data cs
dc.subject distribuované zpracování cs
dc.subject strojové učení cs
dc.subject analýza dat cs
dc.subject systém pro doporučová-ní cs
dc.subject Big data en
dc.subject distributed computing en
dc.subject machine learning en
dc.subject data analysis en
dc.subject recommendation system en
dc.title Návrh aplikace pro analýzu velkých dat s využitím algoritmů strojového učení
dc.title.alternative Design of Application for Big Data Analysis Based on Machine Learning
dc.type diplomová práce cs
dc.contributor.referee Pivnička, Michal
dc.date.accepted 2017-05-23
dc.description.abstract-translated Big data are data, which can´t be analyzed by convention methods on a single device. One of possible solutions is to use distributed processing to divide workload across multiple devices and to process data using machine learning. With this approach it is possible to gain valuable knowledge from a large number of unstructured data. These approaches are described in the theoretical part of the thesis. Among other things, it was shown that the distributed processing has advantages as well as certain disadvantages. These disadvantages are described by CAP theorem, and it is needed to think about them while designing applications. In the practical part of this thesis, the application is designed for product recommendation based on the data analysis. It was also shown that the programming language Python is a quality tool that showed a good performance and is easy to use for data analysis.
dc.description.department Ústav průmyslového inženýrství a informačních systémů
dc.thesis.degree-discipline Průmyslové inženýrství cs
dc.thesis.degree-discipline Industrial Engineering en
dc.thesis.degree-grantor Univerzita Tomáše Bati ve Zlíně. Fakulta managementu a ekonomiky cs
dc.thesis.degree-grantor Tomas Bata University in Zlín. Faculty of Management and Economics en
dc.thesis.degree-name Ing.
dc.thesis.degree-program Systémové inženýrství a informatika cs
dc.thesis.degree-program System Engineering and Informatics en
dc.identifier.stag 46530
utb.result.grade E
dc.date.submitted 2017-04-13


Files in this item

Files Size Format View Description
burdík_2017_dp.pdf 2.827Mb PDF View/Open None
burdík_2017_op.docx 26.10Kb Unknown View/Open None
burdík_2017_vp.pdf 71.62Kb PDF View/Open None

This item appears in the following Collection(s)

Show simple item record

Find fulltext

Search DSpace


Browse

My Account