日日操夜夜添-日日操影院-日日草夜夜操-日日干干-精品一区二区三区波多野结衣-精品一区二区三区高清免费不卡

公告:魔扣目錄網(wǎng)為廣大站長提供免費(fèi)收錄網(wǎng)站服務(wù),提交前請做好本站友鏈:【 網(wǎng)站目錄:http://www.ylptlb.cn 】, 免友鏈快審服務(wù)(50元/站),

點(diǎn)擊這里在線咨詢客服
新站提交
  • 網(wǎng)站:51998
  • 待審:31
  • 小程序:12
  • 文章:1030137
  • 會員:747

T分布隨機(jī)鄰域嵌入(t-SNE),是一種用于可視化的無監(jiān)督機(jī)器學(xué)習(xí)算法,使用非線性降維技術(shù),根據(jù)數(shù)據(jù)點(diǎn)與特征的相似性,試圖最小化高維和低維空間中這些條件概率(或相似性)之間的差異,以在低維空間中完美表示數(shù)據(jù)點(diǎn)。

因此,t-SNE擅長在二維或三維的低維空間中嵌入高維數(shù)據(jù)以進(jìn)行可視化。需要注意的是,t-SNE使用重尾分布來計(jì)算低維空間中兩點(diǎn)之間的相似度,而不是高斯分布,這有助于解決擁擠和優(yōu)化問題。而且離群值不影響t-SNE。

t-SNE算法步驟

1.找出高維空間中相鄰點(diǎn)之間的成對相似性。

2.根據(jù)高維空間中點(diǎn)的成對相似性,將高維空間中的每個(gè)點(diǎn)映射到低維映射。

3.使用基于Kullback-Leibler散度(KL散度)的梯度下降找到最小化條件概率分布之間的不匹配的低維數(shù)據(jù)表示。

4.使用Student-t分布計(jì)算低維空間中兩點(diǎn)之間的相似度。

MNIST數(shù)據(jù)集上實(shí)現(xiàn)t-SNE的Python代碼

導(dǎo)入模塊

# Importing Necessary Modules.
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.manifold import TSNE
from sklearn.preprocessing import StandardScaler

登錄后復(fù)制

讀取數(shù)據(jù)

# Reading the data using pandas
df = pd.read_csv('mnist_train.csv')

# print first five rows of df
print(df.head(4))

# save the labels into a variable l.
l = df['label']

# Drop the label feature and store the pixel data in d.
d = df.drop("label", axis = 1)

登錄后復(fù)制

數(shù)據(jù)預(yù)處理

# Data-preprocessing: Standardizing the data
from sklearn.preprocessing import StandardScaler

standardized_data = StandardScaler().fit_transform(data)
print(standardized_data.shape)

登錄后復(fù)制

輸出

# TSNE
# Picking the top 1000 points as TSNE
# takes a lot of time for 15K points
data_1000 = standardized_data[0:1000, :]
labels_1000 = labels[0:1000]

model = TSNE(n_components = 2, random_state = 0)
# configuring the parameters
# the number of components = 2
# default perplexity = 30
# default learning rate = 200
# default Maximum number of iterations
# for the optimization = 1000

tsne_data = model.fit_transform(data_1000)

# creating a new data frame which
# help us in plotting the result data
tsne_data = np.vstack((tsne_data.T, labels_1000)).T
tsne_df = pd.DataFrame(data = tsne_data,
columns =("Dim_1", "Dim_2", "label"))

# Plotting the result of tsne
sn.FacetGrid(tsne_df, hue ="label", size = 6).map(
plt.scatter, 'Dim_1', 'Dim_2').add_legend()

plt.show()

登錄后復(fù)制

分享到:
標(biāo)簽:算法的概念
用戶無頭像

網(wǎng)友整理

注冊時(shí)間:

網(wǎng)站:5 個(gè)   小程序:0 個(gè)  文章:12 篇

  • 51998

    網(wǎng)站

  • 12

    小程序

  • 1030137

    文章

  • 747

    會員

趕快注冊賬號,推廣您的網(wǎng)站吧!
最新入駐小程序

數(shù)獨(dú)大挑戰(zhàn)2018-06-03

數(shù)獨(dú)一種數(shù)學(xué)游戲,玩家需要根據(jù)9

答題星2018-06-03

您可以通過答題星輕松地創(chuàng)建試卷

全階人生考試2018-06-03

各種考試題,題庫,初中,高中,大學(xué)四六

運(yùn)動步數(shù)有氧達(dá)人2018-06-03

記錄運(yùn)動步數(shù),積累氧氣值。還可偷

每日養(yǎng)生app2018-06-03

每日養(yǎng)生,天天健康

體育訓(xùn)練成績評定2018-06-03

通用課目體育訓(xùn)練成績評定