千鋒教育-做有情懷、有良心、有品質(zhì)的職業(yè)教育機(jī)構(gòu)

手機(jī)站
千鋒教育

千鋒學(xué)習(xí)站 | 隨時(shí)隨地免費(fèi)學(xué)

千鋒教育

掃一掃進(jìn)入千鋒手機(jī)站

領(lǐng)取全套視頻
千鋒教育

關(guān)注千鋒學(xué)習(xí)站小程序
隨時(shí)隨地免費(fèi)學(xué)習(xí)課程

當(dāng)前位置:首頁(yè)  >  技術(shù)干貨  > python 數(shù)據(jù)標(biāo)準(zhǔn)化

python 數(shù)據(jù)標(biāo)準(zhǔn)化

來(lái)源:千鋒教育
發(fā)布人:xqq
時(shí)間: 2023-11-08 01:08:48 1699376928

標(biāo)準(zhǔn)化:在機(jī)器學(xué)習(xí)中,我們可能要處理不同種類(lèi)的資料,例如,音訊和圖片上的像素值,這些資料可能是高緯度的,資料標(biāo)準(zhǔn)化后會(huì)使得每個(gè)特征中的數(shù)值平均變?yōu)?(將每個(gè)特征的值都減掉原始資料中該特征的平均),標(biāo)準(zhǔn)差變?yōu)?,這個(gè)方法被廣泛的使用在許多機(jī)器學(xué)習(xí)算法中(例如:支持向量機(jī),邏輯回歸和類(lèi)神經(jīng)網(wǎng)絡(luò))。

StandardScaler計(jì)算訓(xùn)練集的平均值和標(biāo)準(zhǔn)差,以便測(cè)試數(shù)據(jù)及使用相同的變換。

變換后各維特征有0均值,單位方差,也叫z-score規(guī)范化(零均值規(guī)范化),計(jì)算方式是將特征值減去均值,除以標(biāo)準(zhǔn)差。

fit

用于計(jì)算訓(xùn)練數(shù)據(jù)的均值和方差,后面就會(huì)用均值和方差來(lái)轉(zhuǎn)換訓(xùn)練數(shù)據(jù)

fit_transform

不僅計(jì)算訓(xùn)練數(shù)據(jù)的均值和方差,還會(huì)基于計(jì)算出來(lái)的均值和方差來(lái)轉(zhuǎn)換訓(xùn)練數(shù)據(jù),從而把數(shù)據(jù)轉(zhuǎn)化成標(biāo)準(zhǔn)的正態(tài)分布。

transform

很顯然,它只是進(jìn)行轉(zhuǎn)換,只是把訓(xùn)練數(shù)據(jù)轉(zhuǎn)換成標(biāo)準(zhǔn)的正態(tài)分布。(一般會(huì)把train和test集放在一起做標(biāo)準(zhǔn)化,或者在train集上做標(biāo)準(zhǔn)化后,用同樣的標(biāo)準(zhǔn)化器去標(biāo)準(zhǔn)化test集,此時(shí)可以使用scaler)。

data=[[0,0],[0,0],[1,1],[1,1]]

#1.基于mean和std的標(biāo)準(zhǔn)化

scaler=preprocessing.StandardScaler().fit(train_data)

scaler.transform(train_data)

scaler.transform(test_data)

一般來(lái)說(shuō)先使用fit:

1scaler=preocessing.StandardScaler().fit(X)

這一步可以計(jì)算得到scaler,scaler里面存的有計(jì)算出來(lái)的均值和方差。

再使用transform

1scaler.transform(X)

這一步再用scaler中的均值和方差來(lái)轉(zhuǎn)換X,使X標(biāo)準(zhǔn)化。

最后,在預(yù)測(cè)的時(shí)候,也要對(duì)數(shù)據(jù)做同樣的標(biāo)準(zhǔn)化處理,即也要用上面的scaler中的均值和方差來(lái)對(duì)預(yù)測(cè)時(shí)候的特征進(jìn)行標(biāo)準(zhǔn)化。

注意:測(cè)試數(shù)據(jù)和預(yù)測(cè)數(shù)據(jù)的標(biāo)準(zhǔn)化的方式要和訓(xùn)練數(shù)據(jù)標(biāo)準(zhǔn)化的方式一樣,必須使用同一個(gè)scaler來(lái)進(jìn)行transform

以上內(nèi)容為大家介紹了python數(shù)據(jù)標(biāo)準(zhǔn)化,希望對(duì)大家有所幫助,如果想要了解更多Python相關(guān)知識(shí),請(qǐng)關(guān)注IT培訓(xùn)機(jī)構(gòu):千鋒教育。

聲明:本站稿件版權(quán)均屬千鋒教育所有,未經(jīng)許可不得擅自轉(zhuǎn)載。
10年以上業(yè)內(nèi)強(qiáng)師集結(jié),手把手帶你蛻變精英
請(qǐng)您保持通訊暢通,專(zhuān)屬學(xué)習(xí)老師24小時(shí)內(nèi)將與您1V1溝通
免費(fèi)領(lǐng)取
今日已有369人領(lǐng)取成功
劉同學(xué) 138****2860 剛剛成功領(lǐng)取
王同學(xué) 131****2015 剛剛成功領(lǐng)取
張同學(xué) 133****4652 剛剛成功領(lǐng)取
李同學(xué) 135****8607 剛剛成功領(lǐng)取
楊同學(xué) 132****5667 剛剛成功領(lǐng)取
岳同學(xué) 134****6652 剛剛成功領(lǐng)取
梁同學(xué) 157****2950 剛剛成功領(lǐng)取
劉同學(xué) 189****1015 剛剛成功領(lǐng)取
張同學(xué) 155****4678 剛剛成功領(lǐng)取
鄒同學(xué) 139****2907 剛剛成功領(lǐng)取
董同學(xué) 138****2867 剛剛成功領(lǐng)取
周同學(xué) 136****3602 剛剛成功領(lǐng)取
相關(guān)推薦HOT
python 列表元素的刪除

使用del命令刪除列表中的指定位置上的元素。>>>a_list=[3,5,7,9,11]>>>dela_list[1]>>>a_list[3,7,9,11]使用列表的pop()方法刪除并返回指定位置...詳情>>

2023-11-08 03:58:01
python 插入排序

原理插入排序(InsertionSort)是一種簡(jiǎn)單直觀的排序算法。它的工作原理是通過(guò)構(gòu)建有序序列,對(duì)于未排序數(shù)據(jù),在已排序序列中從后向前掃描,找到...詳情>>

2023-11-08 02:56:48
python 的面試題

問(wèn)題1到底什么是Python?你可以在回答中與其他技術(shù)進(jìn)行對(duì)比(也鼓勵(lì)這樣做)。答案下面是一些關(guān)鍵點(diǎn):Python是一種解釋型語(yǔ)言。這就是說(shuō),與C語(yǔ)言...詳情>>

2023-11-08 02:17:12
python的keras訓(xùn)練

Keras模型在輸入數(shù)據(jù)和標(biāo)簽的Numpy矩陣上進(jìn)行訓(xùn)練。為了訓(xùn)練一個(gè)模型,你通常會(huì)使用fit函數(shù)。文檔詳見(jiàn)此處。fit(self,x,y,batch_size=32,epochs...詳情>>

2023-11-08 01:59:12
Python 類(lèi)和實(shí)例的屬性

類(lèi)屬性.類(lèi)屬性是可以直接通過(guò)“類(lèi)名.屬性名”來(lái)訪(fǎng)問(wèn)和修改。.類(lèi)屬性是這個(gè)類(lèi)的所有實(shí)例對(duì)象所共有的屬性,任意一個(gè)實(shí)例對(duì)象都可以訪(fǎng)問(wèn)并修改這...詳情>>

2023-11-08 01:44:48
久久亚洲中文字幕精品一区四,亚洲日本另类欧美一区二区,久久久久久久这里只有免费费精品,高清国产激情视频在线观看
亚洲真实片中文字幕 | 亚洲中文字幕aV女同在线 | 日本一区二区三区免费在线观看 | 色婷婷精品大全在线视频 | 亚洲高潮痉挛中文字幕 | 视频一区网友自拍第二页 |