[NEOBHÁJENO] Analýza klasifikačních metod pro testovací datasety

Abdigali, Beibarys

[NEOBHÁJENO] Analýza klasifikačních metod pro testovací datasety

DSpace Repository

Language: English čeština

[NEOBHÁJENO] Analýza klasifikačních metod pro testovací datasety

dc.contributor.advisor	Komínková Oplatková, Zuzana
dc.contributor.author	Abdigali, Beibarys
dc.date.accessioned	2024-07-23T13:16:44Z
dc.date.available	2024-07-23T13:16:44Z
dc.date.issued	2023-11-05
dc.identifier	Elektronický archiv Knihovny UTB
dc.identifier.uri	http://hdl.handle.net/10563/56269
dc.description.abstract	V této práci je ukázáno zaměření na využití klasifikačních algoritmů na prediktivní modelování a odlišit je od regrese jako různá plemena podobného rodu se stříd možnosti. Zde se studie zabývá důležitými algoritmy včetně K-Nearest Neighbors (KNN), Rozhodovací stromy, náhodné lesy SVM, logistická regrese a naivní zátoky. Disciplína je zabývající se historickými aspekty, fyzikou a matematickými vzorci K-nejbližšího souseda, rozhodovací strom a náhodné modely lesa. Pokračuje ve vysvětlování toho, jak se vyhnout nadměrnému vybavení rozhodovací stromy a souborový přístup používaný v náhodných lesích. Algoritmy budou hodnoceny na základě jejich výkonu ve srovnání s datovými soubory, jako jsou Digits, Wine a Diabetes. Kromě toho, že zde máte na starosti, tato práce zahrnuje úkoly, jako je výběr dat, zpracování, rozdělení a škálování. Pro tuto případovou studii bude mix dobře známých parametrů i těch méně známých slouží ke komplexnímu průzkumu schopností a omezení studovaných modelů. Tento kousek se zde zastaví, aby diskutoval o rozdílech mezi klasifikátory a regresory s cílem vybrat nejlepší modeluje na cestě pomocí charakteristik dat a samotných detailů výzkumného problému. Závěr obsahuje několik pozoruhodných bodů souvisejících s reálnou aplikací algoritmů a také poukazuje na potenciálně výzkumné oblasti, které mohou vyžadovat další studium. Proto je cílem této práce je jmenovitě shromažďovat data pro výzkumné pracovníky a odborníky v oblasti datové vědy a prediktivní analytika.
dc.format	73 s., 139 006 znaků
dc.language.iso	en
dc.publisher	Univerzita Tomáše Bati ve Zlíně
dc.rights	Bez omezení
dc.subject	KNN	cs
dc.subject	SVM	cs
dc.subject	logistická regrese	cs
dc.subject	náhodný les	cs
dc.subject	rozhodovací strom	cs
dc.subject	číslice	cs
dc.subject	víno	cs
dc.subject	Diabetes	cs
dc.subject	KNN	en
dc.subject	SVM	en
dc.subject	Logistic Regression	en
dc.subject	Random Forest	en
dc.subject	Decision Tree	en
dc.subject	Digits	en
dc.subject	Wine	en
dc.subject	Diabetes	en
dc.title	[NEOBHÁJENO] Analýza klasifikačních metod pro testovací datasety
dc.title.alternative	[NEOBHÁJENO] Classification Methods Analysis for Benchmarking Datasets
dc.type	bakalářská práce	cs
dc.contributor.referee	Viktorin, Adam
dc.date.accepted	2024-06-04
dc.description.abstract-translated	In this thesis, shown focus on the classification algorithms utilization on the predictive modeling and distinguish them from regression as different breeds of the similar genus with alternate options. Here, the study dwells on important algorithms including K-Nearest Neighbors(KNN), Decision Trees, Random Forests SVM, Logistic Regression and Naive Bayes. The discipline is concerned with the historical aspects, physics, and math formulas of the K-nearest neighbor, decision tree, and random forest models. It continues to explain the avoidance of overfitting in decision trees and the ensemble approach used in random forests. The algorithms are going to be evaluated based on their performance compared to datasets like Digits, Wine, and Diabetes. Besides being in charge here, the job involves tasks like selection of data, processing, splitting and scaling. For this case study a mix of well-known parameters as well as lesser known ones will be used to comprehensively survey the capabilities and limitations of the models studied. This piece stops here to discuss the disparities between classifiers and regressors, with aim of choosing best models along the way by means of characteristics of data and the very detail of research problem. The conclusion has several noteworthy points related to real-life application of algorithms and also points potentially research areas that may require more study. Therefore, the purpose of this thesis is namely to pool together the data for the researchers and professionals in data science and predictive analytics.
dc.description.department	Ústav informatiky a umělé inteligence
dc.description.result	neobhájeno
dc.thesis.degree-discipline	Software Engineering	cs
dc.thesis.degree-discipline	Software Engineering	en
dc.thesis.degree-grantor	Univerzita Tomáše Bati ve Zlíně. Fakulta aplikované informatiky	cs
dc.thesis.degree-grantor	Tomas Bata University in Zlín. Faculty of Applied Informatics	en
dc.thesis.degree-name	Bc.
dc.thesis.degree-program	Software Engineering	cs
dc.thesis.degree-program	Software Engineering	en
dc.identifier.stag	66807
dc.date.submitted	2024-05-13