dc.contributor.advisor |
Komínková Oplatková, Zuzana
|
|
dc.contributor.author |
Abdigali, Beibarys
|
|
dc.date.accessioned |
2024-07-23T13:16:44Z |
|
dc.date.available |
2024-07-23T13:16:44Z |
|
dc.date.issued |
2023-11-05 |
|
dc.identifier |
Elektronický archiv Knihovny UTB |
|
dc.identifier.uri |
http://hdl.handle.net/10563/56269
|
|
dc.description.abstract |
V této práci je ukázáno zaměření na využití klasifikačních algoritmů na prediktivní modelování a odlišit je od regrese jako různá plemena podobného rodu se stříd možnosti. Zde se studie zabývá důležitými algoritmy včetně K-Nearest Neighbors (KNN), Rozhodovací stromy, náhodné lesy SVM, logistická regrese a naivní zátoky. Disciplína je zabývající se historickými aspekty, fyzikou a matematickými vzorci K-nejbližšího souseda, rozhodovací strom a náhodné modely lesa. Pokračuje ve vysvětlování toho, jak se vyhnout nadměrnému vybavení rozhodovací stromy a souborový přístup používaný v náhodných lesích. Algoritmy budou hodnoceny na základě jejich výkonu ve srovnání s datovými soubory, jako jsou Digits, Wine a Diabetes. Kromě toho, že zde máte na starosti, tato práce zahrnuje úkoly, jako je výběr dat, zpracování, rozdělení a škálování. Pro tuto případovou studii bude mix dobře známých parametrů i těch méně známých slouží ke komplexnímu průzkumu schopností a omezení studovaných modelů. Tento kousek se zde zastaví, aby diskutoval o rozdílech mezi klasifikátory a regresory s cílem vybrat nejlepší modeluje na cestě pomocí charakteristik dat a samotných detailů výzkumného problému. Závěr obsahuje několik pozoruhodných bodů souvisejících s reálnou aplikací algoritmů a také poukazuje na potenciálně výzkumné oblasti, které mohou vyžadovat další studium. Proto je cílem této práce je jmenovitě shromažďovat data pro výzkumné pracovníky a odborníky v oblasti datové vědy a prediktivní analytika. |
|
dc.format |
73 s., 139 006 znaků |
|
dc.language.iso |
en |
|
dc.publisher |
Univerzita Tomáše Bati ve Zlíně |
|
dc.rights |
Bez omezení |
|
dc.subject |
KNN
|
cs |
dc.subject |
SVM
|
cs |
dc.subject |
logistická regrese
|
cs |
dc.subject |
náhodný les
|
cs |
dc.subject |
rozhodovací strom
|
cs |
dc.subject |
číslice
|
cs |
dc.subject |
víno
|
cs |
dc.subject |
Diabetes
|
cs |
dc.subject |
KNN
|
en |
dc.subject |
SVM
|
en |
dc.subject |
Logistic Regression
|
en |
dc.subject |
Random Forest
|
en |
dc.subject |
Decision Tree
|
en |
dc.subject |
Digits
|
en |
dc.subject |
Wine
|
en |
dc.subject |
Diabetes
|
en |
dc.title |
[NEOBHÁJENO] Analýza klasifikačních metod pro testovací datasety |
|
dc.title.alternative |
[NEOBHÁJENO] Classification Methods Analysis for Benchmarking Datasets |
|
dc.type |
bakalářská práce |
cs |
dc.contributor.referee |
Viktorin, Adam |
|
dc.date.accepted |
2024-06-04 |
|
dc.description.abstract-translated |
In this thesis, shown focus on the classification algorithms utilization on the predictive modeling and distinguish them from regression as different breeds of the similar genus with alternate options. Here, the study dwells on important algorithms including K-Nearest Neighbors(KNN), Decision Trees, Random Forests SVM, Logistic Regression and Naive Bayes. The discipline is concerned with the historical aspects, physics, and math formulas of the K-nearest neighbor, decision tree, and random forest models. It continues to explain the avoidance of overfitting in decision trees and the ensemble approach used in random forests. The algorithms are going to be evaluated based on their performance compared to datasets like Digits, Wine, and Diabetes. Besides being in charge here, the job involves tasks like selection of data, processing, splitting and scaling. For this case study a mix of well-known parameters as well as lesser known ones will be used to comprehensively survey the capabilities and limitations of the models studied. This piece stops here to discuss the disparities between classifiers and regressors, with aim of choosing best models along the way by means of characteristics of data and the very detail of research problem. The conclusion has several noteworthy points related to real-life application of algorithms and also points potentially research areas that may require more study. Therefore, the purpose of this thesis is namely to pool together the data for the researchers and professionals in data science and predictive analytics. |
|
dc.description.department |
Ústav informatiky a umělé inteligence |
|
dc.description.result |
neobhájeno |
|
dc.thesis.degree-discipline |
Software Engineering |
cs |
dc.thesis.degree-discipline |
Software Engineering |
en |
dc.thesis.degree-grantor |
Univerzita Tomáše Bati ve Zlíně. Fakulta aplikované informatiky |
cs |
dc.thesis.degree-grantor |
Tomas Bata University in Zlín. Faculty of Applied Informatics |
en |
dc.thesis.degree-name |
Bc. |
|
dc.thesis.degree-program |
Software Engineering |
cs |
dc.thesis.degree-program |
Software Engineering |
en |
dc.identifier.stag |
66807
|
|
dc.date.submitted |
2024-05-13 |
|