所以我试图生成包含3列的虚拟数据:价格,价格,价格.对于前两个,这是纯粹的数字,这是好的.我在Electron 表格上有50,000行数据.但是,当我添加Borough并从列表中指定随机值时,我会收到以下输出:
Sq. feet Price Borough
0 112 345382 5
1 310 901500 5
2 215 661033 5
3 147 1038431 5
4 212 296497 5
我还没有使用过像np.random.randint这样与数字生成相关的程序包
相反,我用了"Borough" : random.randrange(len(word))
我哪里错了?
下面是我的代码
import random
import pandas as pd
import numpy as np
WORDS = ["Chelsea", "Kensington", "Westminster", "Pimlico", "Bank", "Holborn", "Camden", "Islington", "Angel", "Battersea", "Knightsbridge", "Bermondsey", "Newham"]
word = random.choice(WORDS)
np.random.seed(1)
data3 = pd.DataFrame({"Sq. feet" : np.random.randint(low=75, high=325, size=50000),
"Price" : np.random.randint(low=200000, high=1250000, size=50000),
"Borough" : random.randrange(len(word))
})
df = pd.DataFrame(data3)
df.to_csv("/Users/thomasmcnally/PycharmProjects/real_estate_dummy_date/realestate.csv", index=False)
print(df)
我希望从单词[]中随机得到一行字值,而返回值只是数字5.仅为基于文本的数据创建另一个模块并将它们打印在不同的文件中显然是没有意义的.