我已经训练了一名模特.现在我想导出它的类型(Str)的输出.如何将其输出结果保存为数据帧或任何其他形式,以供将来使用.

gf = df['findings'].astype(str) 
preprocess_text = gf.str.strip().replace("\n","") 
t5_prepared_Text = "summarize: "+preprocess_text print ("original text preprocessed: \n", preprocess_text) 
tokenized_text = tokenizer.encode(str(t5_prepared_Text, return_tensors="pt").to(device) 
# summmarize 
summary_ids = model.generate(tokenized_text, num_beams=4, no_repeat_ngram_size=2, min_length=30, max_length=100, early_stopping=True) 
output = tokenizer.decode(summary_ids[0], skip_special_tokens=True) print ("\n\nSummarized text: \n"

模型的输出

0     summarize: There is XXXX increased opacity wit...
1     summarize: There is XXXX increased opacity wit...
2     summarize: There is XXXX increased opacity wit...
3     summarize: Interstitial markings are diffusely...
4     summarize: Interstitial markings are diffusely...
5                                        summarize: nan
6                                        summarize: nan
Name: findings, dtype: object:

到目前为止,我试过这样做

prediction = pd.DataFrame([text]).to_csv('prediction.csv')

但它只将所有这些行保存在CSV的一个单元格(第一个单元格)中,所有这些行都保存在下面的一半形式中.

0     summarize: There is XXXX increased opacity wit...
1     summarize: There is XXXX increased opacity wit...
2     summarize: There is XXXX increased opacity wit...
3     summarize: Interstitial markings are diffusely...
4     summarize: Interstitial markings are diffusely...
5                                        summarize: nan
6                                        summarize: nan
Name: findings, dtype: object:

推荐答案

把这个换掉就行了

prediction = pd.DataFrame([text]).to_csv('prediction.csv')

有了这个

prediction = pd.DataFrame([text]).to_csv('prediction.csv', sep=";")

Python相关问答推荐

如何在BeautifulSoup/CSS Select 器中处理regex?

python中csv. Dictreader. fieldname的类型是什么?'

如何在两列上groupBy,并使用pyspark计算每个分组列的平均总价值

如何在GEKKO中使用复共轭物

我什么时候应该使用帆布和标签?

Python:从目录内的文件导入目录

Stats.ttest_ind:提取df值

如何在基于时间的数据帧中添加计算值

关于数字S种子序列内部工作原理的困惑

运行从Airflow包导入的python文件,需要airflow实例?

判断字典键、值对是否满足用户定义的搜索条件

将标量值作为输入并输出矩阵的函数的积分

有没有更快的方法来快速修改、更新和排序列表或词典?

拆分字符串,保留引用的子字符串

根据来自数据帧的特定迭代数合并数据帧

Python拟合线到高维点并在它们之间采样

如何在子窗口中正确设置和获取tkinter旋转框的值?

在matplotlib中将标题的一部分设置为粗体和正常

匹配+字符串的Python RegEx,直到找到下一个匹配项

为什么一些地块有网格线,而另一些地块没有网格线?