可以将其定义为以某种方式修改数据集值的归一化技术,使得每一行中绝对值的总和始终为1。这也称为最小绝对偏差。
在此示例中,无涯教程使用L1归一化技术对之前使用的Pima Indians Diabetes数据集的数据进行归一化。首先,将加载CSV数据,然后在 Normalizer 类的帮助下将其标准化。
以下脚本的前几行与在上一章中编写CSV数据时写的相同。
来源:LearnFk无涯教程网
from pandas import read_csv from numpy import set_printoptions from sklearn.preprocessing import Normalizer path=r'C:\pima-indians-diabetes.csv' names=['preg', 'plas', 'pres', 'skin', 'test', 'mass', 'pedi', 'age', 'class'] dataframe=read_csv (path, names=names) array=dataframe.values
现在,可以对L1使用Normalizer类来对数据进行归一化。
Data_normalizer=Normalizer(norm='l1').fit(array) Data_normalized=Data_normalizer.transform(array)
无涯教程还可以根据选择汇总输出数据。在这里,将精度设置为2,并在输出中显示前3行。
set_printoptions(precision=2) print ("\nNormalized data:\n", Data_normalized [0:3])
运行上面代码输出
Normalized data: [[0.02 0.43 0.21 0.1 0. 0.1 0. 0.14 0. ] [0. 0.36 0.28 0.12 0. 0.11 0. 0.13 0. ] [0.03 0.59 0.21 0. 0. 0.07 0. 0.1 0. ]]
祝学习愉快!(内容编辑有误?请选中要编辑内容 -> 右键 -> 修改 -> 提交!)