Support Vector Machines

Da aprendis
Revisão das 13h50min de 14 de março de 2016 por Up201107661 (Discussão | contribs)

(dif) ← Revisão anterior | Revisão atual (dif) | Revisão seguinte → (dif)
Ir para: navegação, pesquisa

As Support Vector Machines (SVM) é uma das técnicas mais utilizadas em Data Mining quando é necessário construir um classificador para dados constituídos maioritariamente por variáveis numéricas continuas/discretas. A estratégia que a SVM implementa para construir um classificador é bastante simples: Se tivermos x bolas de duas cores Bolas1.png podemos simplesmente colocar uma linha de forma a que se separem Bolas2.png, isto permite-nos saber a partir desta informação que bolas acima da linha são azuis e bolas abaixo são vermelhas, o problema é que a linha pode estar em muitas posições diferentes e aparentemente esta não é a melhor Bolas3.png e por isso recolocamos a linha Bolas4.png de forma a que o classificador seja preciso Bolas5.png. No entanto a realidade é que casos assim não existem, na verdade todos os casos que uma SVM classifica são sempre uma mistura de bolas azuis e vermelhas Bolas6.png e por isso não existe nenhum linha que separe estes casos Bolas7.png mas de certeza que existe um plano! É por isso aumentamos uma (geralmente varias dimensões diferentes) dimensão para assim encontrar o plano que divide as bolas.Bolas8.png Este passo é o mais complicado de entender pois sabemos que em duas dimensões o que é uma recta e e m 3 dimensões um plano mas e em 4 ou em 6,7,20,50,1000 dimensões? É por isso que chamamos de hiperplano ao que separa as bolas vermelhas das azuis.