[英] How do I create test and train samples from one dataframe with pandas?
我有一个数据框形式的相当大的数据集,我想知道如何将数据框分成两个随机样本(80%和20%),用于训练和测试.
谢谢
我有一个数据框形式的相当大的数据集,我想知道如何将数据框分成两个随机样本(80%和20%),用于训练和测试.
谢谢
我会用numpy的randn
:
In [11]: df = pd.DataFrame(np.random.randn(100, 2))
In [12]: msk = np.random.rand(len(df)) < 0.8
In [13]: train = df[msk]
In [14]: test = df[~msk]
只要看看这招奏效了就知道了:
In [15]: len(test)
Out[15]: 21
In [16]: len(train)
Out[16]: 79
我通过postman 获得状态代码 200,但通过 request.get 我获得状态代码 500
是否有更好的正则表达式来计算中文字母的数量并同时排除一些字符?
将 Python 字典键入为 Dict[key[T], value[K]] 其中 T 和 K 受到限制
如何将过滤的分组聚合的结果分配为原始 Pandas DataFrame 中的新列
使用 Python OpenCV cv2.VideoCapture() 直接以灰度读取视频帧
函数的许多递归调用之一找到了正确的结果,但它不能“告诉”其他函数.有比这种丑陋的解决方法更好的解决方法吗?