Python 如何在 tensorflow_datasets 数据集上进行训练

发布于07月27日

我在玩tensorflow，以更加熟悉整个工作流.为了做到这一点，我认为应该从为众所周知的Iris数据集创建一个简单的分类器开始.

我使用以下方式加载数据集:

ds = tfds.load('iris', split='train', shuffle_files=True, as_supervised=True)

我使用以下分类器:

model = keras.Sequential([
    keras.layers.Dense(10,activation="relu"),
    keras.layers.Dense(10,activation="relu"),
    keras.layers.Dense(3, activation="softmax")
])

model.compile(
    optimizer=tf.keras.optimizers.Adam(0.001),
    loss=tf.keras.losses.SparseCategoricalCrossentropy(),
    metrics=[tf.keras.metrics.SparseCategoricalAccuracy()],
)

然后，我try 使用以下方法拟合模型:

model.fit(ds,batch_size=50, epochs=100)

这会产生以下错误:

Input 0 of layer "dense" is incompatible with the layer: expected min_ndim=2, found ndim=1. Full shape received: (4,)

    Call arguments received by layer "sequential" (type Sequential):
      • inputs=tf.Tensor(shape=(4,), dtype=float32)
      • training=True
      • mask=None

我还try 使用函数API定义模型(因为这是我最初学习的目标)

inputs = keras.Input(shape=(4,), name='features')

first_hidden = keras.layers.Dense(10, activation='relu')(inputs)
second_hidden = keras.layers.Dense(10, activation="relu")(first_hidden)

outputs = keras.layers.Dense(3, activation='softmax')(second_hidden)

model = keras.Model(inputs=inputs, outputs=outputs, name="test_iris_classification")

我现在得到了与之前相同的错误，但这次有一个警告:

WARNING:tensorflow:Model was constructed with shape (None, 4) for input KerasTensor(type_spec=TensorSpec(shape=(None, 4), dtype=tf.float32, name='features'), name='features', description="created by layer 'features'"), but it was called on an input with incompatible shape (4,).

我怀疑这是一个很基本的问题，我还没有理解，但我一直没有弄明白，尽管我在谷歌上搜索了几个小时.

PS:

我是这样读的:

ds = pd.read_csv("iris.data", header=None)
labels = []
for name in ds[4]:
    if name == "Iris-setosa":
        labels.append(0)
    elif name == "Iris-versicolor":
        labels.append(1)
    elif name == "Iris-virginica":
        labels.append(2)
    else:
        raise ValueError(f"Name wrong name: {name}")
labels = np.array(labels)
features = np.array(ds[[0,1,2,3]])

并按如下方式安装:

model.fit(features, labels,batch_size=50, epochs=100)

我能够将模型与这个数据集相匹配，而不会对序列API和函数API产生任何问题.这让我怀疑我的误解与tensorflow_数据集的工作方式有关.

import tensorflow_datasets as tfds import tensorflow as tf ds = tfds.load('iris', split='train', shuffle_files=True, as_supervised=True, batch_size=10) model = tf.keras.Sequential([ tf.keras.layers.Dense(10,activation="relu"), tf.keras.layers.Dense(10,activation="relu"), tf.keras.layers.Dense(3, activation="softmax") ]) model.compile( optimizer=tf.keras.optimizers.Adam(0.001), loss=tf.keras.losses.SparseCategoricalCrossentropy(), metrics=[tf.keras.metrics.SparseCategoricalAccuracy()], ) model.fit(ds, epochs=100)

Python 如何在 tensorflow_datasets 数据集上进行训练

推荐答案

Python相关问答推荐

更改Seaborn条形图中的x轴日期时间限制

计算相同形状的两个张量的SSE损失

通过优化空间在Python中的饼图中添加标签

Pandas 第二小值有条件

从webhook中的短代码(而不是电话号码)接收Twilio消息

log 1 p numpy的意外行为

如何将Docker内部运行的mariadb与主机上Docker外部运行的Python脚本连接起来

将输入聚合到统一词典中

连接一个rabrame和另一个1d rabrame不是问题，但当使用[...]'运算符会产生不同的结果

Django RawSQL注释字段

如何保持服务器发送的事件连接活动？

Python列表不会在条件while循环中正确随机化'

重置PD帧中的值

Numpyro AR(1)均值切换模型抽样不一致性

统计numpy. ndarray中的项目列表出现次数的最快方法

从嵌套极轴列的列表中删除元素

按条件添加小计列

ModuleNotFoundError：Python中没有名为google的模块''

如何获得满足掩码条件的第一行的索引？

大型稀疏CSR二进制矩阵乘法结果中的错误