WEKA

Da aprendis
Ir para: navegação, pesquisa

O WEKA é uma poderosa e simples plataforma de data mining que permite criar classificadores utilizando por exemplo para um dataset com muitas variáveis numéricas as Support Vector Machines, ou para datastes com maior predominância de variáveis categóricas uma árvore de decisão.

Tutorial SVM

O WEKA pode ser obtido apartir do site http://www.cs.waikato.ac.nz/ml/weka/index.html . Deve ser utilizada a versão Developer para obter as mais recentes actualizações, nomeadamente a possibilidade de fazer o downloads dos packages através do package manager que se encontra no menu tools, note-se que é necessário o package LibSVM para poder utilizar SVMs no WEKA. O dataset utilizado para este tutorial pode ser obtido no seguinte link https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data ou https://en.wikipedia.org/wiki/Iris_flower_data_set e guardado como um ficheiro .csv . O primeiro passo para começar a utilizar o WEKA é aceder ao menu explorer, onde podemos importar a partir de Open file diferente tipos de datasets neste caso importamos o nosso sobre as espécies da flor Iris. Podemos então agora varias informações sobre cada uma das variáveis bastando para isso seleccionar uma das variáveis na lista que apareceu. Podemos então agora mudar para a tab de classify onde podemos escolher qual o classificador que o WEKA deve utilizar, neste caso escolhemos o que se encontra em Choose->functions->LibSVM seleccionamos cross-validation Folds 4 para garantir que todo o dataset é utilizado tanto como treino como teste. Seleccionamos também qual a variável que pretendemos classificar e carregamos em start. Os resultados obtidos pela svm são logo mostrados no Classifier output e temos assim um classificador SVM para as espécies da flor Iris.