在機器學習中,支持向量機(SVM)常被用于數據分類和回歸分析,是由分離超平面的判別算法模型。換句話說,給定標記的訓練數據,該算法輸出一個對新示例進行分類的最佳超平面。
支持向量機(SVM)算法模型是將示例表示為空間中的點,經過映射后,不同類別的示例被盡可能劃分。除了執行線性分類外,支持向量機(SVM)還可以有效地執行非線性分類,將其輸入隱式映射到高維特征空間。
支持向量機做什么?
給定一組訓練示例,并根據2個類別給每個訓練示例都各自標記上類別,再通過支持向量機(SVM)訓練算法構建一個模型,將新示例分配給這2個類別,使其成為非概率二元線性分類器。
Python實現支持向量機(SVM)分類
先決條件:Numpy、Pandas、matplot-lib、scikit-learn
首先,創建數據集
from sklearn.datasets.samples_generator import make_blobs X,Y=make_blobs(n_samples=500,centers=2, random_state=0,cluster_std=0.40) import matplotlib.pyplot as plt plt.scatter(X[:,0],X[:,1],c=Y,s=50,cmap='spring'); plt.show()
登錄后復制
分類
xfit=np.linspace(-1,3.5) plt.scatter(X[:,0],X[:,1],c=Y,s=50,cmap='spring') for m,b,d in[(1,0.65,0.33),(0.5,1.6,0.55),(-0.2,2.9,0.2)]: yfit=m*xfit+b plt.plot(xfit,yfit,'-k') plt.fill_between(xfit,yfit-d,yfit+d,edgecolor='none', color='#AAAAAA',alpha=0.4) plt.xlim(-1,3.5); plt.show()
登錄后復制