可以将其定义为规范化技术,该技术以以下方式修改数据集值:在每一行中,平方和总等于1。这也称为最小平方。
在此示例中,无涯教程使用L2归一化技术对之前使用的Pima Indians Diabetes数据集的数据进行归一化。首先,将加载CSV数据(如前几章所述),然后在 Normalizer 类的帮助下将其标准化。
以下脚本的前几行与在上一章中编写CSV数据时写的相同。
from pandas import read_csv from numpy import set_printoptions from sklearn.preprocessing import Normalizer path=r'C:\pima-indians-diabetes.csv' names=['preg', 'plas', 'pres', 'skin', 'test', 'mass', 'pedi', 'age', 'class'] dataframe=read_csv (path, names=names) array=dataframe.values
现在,可以对L1使用Normalizer类来对数据进行归一化。
Data_normalizer=Normalizer(norm='l2').fit(array) Data_normalized=Data_normalizer.transform(array)
无涯教程还可以根据选择汇总输出数据。在这里将精度设置为2,并在输出中显示前3行。
来源:LearnFk无涯教程网
set_printoptions(precision=2) print ("\nNormalized data:\n", Data_normalized [0:3])
运行上面代码输出
Normalized data: [[0.03 0.83 0.4 0.2 0. 0.19 0. 0.28 0.01] [0.01 0.72 0.56 0.24 0. 0.22 0. 0.26 0. ] [0.04 0.92 0.32 0. 0. 0.12 0. 0.16 0.01]]
祝学习愉快!(内容编辑有误?请选中要编辑内容 -> 右键 -> 修改 -> 提交!)