机器学习 中的 L1归一化函数

首页 / 机器学习入门教程 / 机器学习 中的 L1归一化函数

可以将其定义为以某种方式修改数据集值的归一化技术,使得每一行中绝对值的总和始终为1。这也称为最小绝对偏差。

在此示例中,无涯教程使用L1归一化技术对之前使用的Pima Indians Diabetes数据集的数据进行归一化。首先,将加载CSV数据,然后在 Normalizer 类的帮助下将其标准化。

以下脚本的前几行与在上一章中编写CSV数据时写的相同。

from pandas import read_csv
from numpy import set_printoptions
from sklearn.preprocessing import Normalizer
path=r'C:\pima-indians-diabetes.csv'
names=['preg', 'plas', 'pres', 'skin', 'test', 'mass', 'pedi', 'age', 'class']
dataframe=read_csv (path, names=names)
array=dataframe.values

现在,可以对L1使用Normalizer类来对数据进行归一化。

Data_normalizer=Normalizer(norm='l1').fit(array)
Data_normalized=Data_normalizer.transform(array)

无涯教程还可以根据选择汇总输出数据。在这里,将精度设置为2,并在输出中显示前3行。

set_printoptions(precision=2)
print ("\nNormalized data:\n", Data_normalized [0:3])

运行上面代码输出

Normalized data:
[[0.02 0.43 0.21 0.1  0. 0.1  0. 0.14 0. ]
[0.    0.36 0.28 0.12 0. 0.11 0. 0.13 0. ]
[0.03  0.59 0.21 0.   0. 0.07 0. 0.1  0. ]]

祝学习愉快!(内容编辑有误?请选中要编辑内容 -> 右键 -> 修改 -> 提交!)

技术教程推荐

AI技术内参 -〔洪亮劼〕

深入浅出区块链 -〔陈浩〕

硅谷产品实战36讲 -〔曲晓音〕

MySQL实战45讲 -〔林晓斌〕

Kafka核心源码解读 -〔胡夕〕

视觉笔记入门课 -〔高伟〕

TensorFlow 2项目进阶实战 -〔彭靖田〕

手把手带你写一个Web框架 -〔叶剑峰〕

手把手带你写一个MiniSpring -〔郭屹〕

好记忆不如烂笔头。留下您的足迹吧 :)