[NEOBHÁJENO] Analýza klasifikačních metod pro testovací datasety

DSpace Repository

Language: English čeština 

[NEOBHÁJENO] Analýza klasifikačních metod pro testovací datasety

Show simple item record

dc.contributor.advisor Komínková Oplatková, Zuzana
dc.contributor.author Abdigali, Beibarys
dc.date.accessioned 2024-07-23T13:16:44Z
dc.date.available 2024-07-23T13:16:44Z
dc.date.issued 2023-11-05
dc.identifier Elektronický archiv Knihovny UTB
dc.identifier.uri http://hdl.handle.net/10563/56269
dc.description.abstract V této práci je ukázáno zaměření na využití klasifikačních algoritmů na prediktivní modelování a odlišit je od regrese jako různá plemena podobného rodu se stříd možnosti. Zde se studie zabývá důležitými algoritmy včetně K-Nearest Neighbors (KNN), Rozhodovací stromy, náhodné lesy SVM, logistická regrese a naivní zátoky. Disciplína je zabývající se historickými aspekty, fyzikou a matematickými vzorci K-nejbližšího souseda, rozhodovací strom a náhodné modely lesa. Pokračuje ve vysvětlování toho, jak se vyhnout nadměrnému vybavení rozhodovací stromy a souborový přístup používaný v náhodných lesích. Algoritmy budou hodnoceny na základě jejich výkonu ve srovnání s datovými soubory, jako jsou Digits, Wine a Diabetes. Kromě toho, že zde máte na starosti, tato práce zahrnuje úkoly, jako je výběr dat, zpracování, rozdělení a škálování. Pro tuto případovou studii bude mix dobře známých parametrů i těch méně známých slouží ke komplexnímu průzkumu schopností a omezení studovaných modelů. Tento kousek se zde zastaví, aby diskutoval o rozdílech mezi klasifikátory a regresory s cílem vybrat nejlepší modeluje na cestě pomocí charakteristik dat a samotných detailů výzkumného problému. Závěr obsahuje několik pozoruhodných bodů souvisejících s reálnou aplikací algoritmů a také poukazuje na potenciálně výzkumné oblasti, které mohou vyžadovat další studium. Proto je cílem této práce je jmenovitě shromažďovat data pro výzkumné pracovníky a odborníky v oblasti datové vědy a prediktivní analytika.
dc.format 73 s., 139 006 znaků
dc.language.iso en
dc.publisher Univerzita Tomáše Bati ve Zlíně
dc.rights Bez omezení
dc.subject KNN cs
dc.subject SVM cs
dc.subject logistická regrese cs
dc.subject náhodný les cs
dc.subject rozhodovací strom cs
dc.subject číslice cs
dc.subject víno cs
dc.subject Diabetes cs
dc.subject KNN en
dc.subject SVM en
dc.subject Logistic Regression en
dc.subject Random Forest en
dc.subject Decision Tree en
dc.subject Digits en
dc.subject Wine en
dc.subject Diabetes en
dc.title [NEOBHÁJENO] Analýza klasifikačních metod pro testovací datasety
dc.title.alternative [NEOBHÁJENO] Classification Methods Analysis for Benchmarking Datasets
dc.type bakalářská práce cs
dc.contributor.referee Viktorin, Adam
dc.date.accepted 2024-06-04
dc.description.abstract-translated In this thesis, shown focus on the classification algorithms utilization on the predictive modeling and distinguish them from regression as different breeds of the similar genus with alternate options. Here, the study dwells on important algorithms including K-Nearest Neighbors(KNN), Decision Trees, Random Forests SVM, Logistic Regression and Naive Bayes. The discipline is concerned with the historical aspects, physics, and math formulas of the K-nearest neighbor, decision tree, and random forest models. It continues to explain the avoidance of overfitting in decision trees and the ensemble approach used in random forests. The algorithms are going to be evaluated based on their performance compared to datasets like Digits, Wine, and Diabetes. Besides being in charge here, the job involves tasks like selection of data, processing, splitting and scaling. For this case study a mix of well-known parameters as well as lesser known ones will be used to comprehensively survey the capabilities and limitations of the models studied. This piece stops here to discuss the disparities between classifiers and regressors, with aim of choosing best models along the way by means of characteristics of data and the very detail of research problem. The conclusion has several noteworthy points related to real-life application of algorithms and also points potentially research areas that may require more study. Therefore, the purpose of this thesis is namely to pool together the data for the researchers and professionals in data science and predictive analytics.
dc.description.department Ústav informatiky a umělé inteligence
dc.description.result neobhájeno
dc.thesis.degree-discipline Software Engineering cs
dc.thesis.degree-discipline Software Engineering en
dc.thesis.degree-grantor Univerzita Tomáše Bati ve Zlíně. Fakulta aplikované informatiky cs
dc.thesis.degree-grantor Tomas Bata University in Zlín. Faculty of Applied Informatics en
dc.thesis.degree-name Bc.
dc.thesis.degree-program Software Engineering cs
dc.thesis.degree-program Software Engineering en
dc.identifier.stag 66807
dc.date.submitted 2024-05-13


Files in this item

Files Size Format View Description
abdigali_2024_dp.pdf 1.874Mb PDF View/Open None
abdigali_2024_op.pdf 136.5Kb PDF View/Open None
abdigali_2024_vp.pdf 158.3Kb PDF View/Open None

This item appears in the following Collection(s)

Show simple item record

Find fulltext

Search DSpace


Browse

My Account