对于我拥有的数据,如下所示(示例):

import pandas as pd

MyDict = {'text' : ['\nbla bla text \n\n bla bla another text \n # bla text \n\n\n bla bla another text', 
                    '\nbla bla bla text2 \n\n\ bla bla bla another text it is \n\n  # bla bla bla text \n bla bla it is another text']}

df = pd.DataFrame(MyDict)

我想计算列text中每个单元格中不为空("\n")的行总数,以便能够获得如下所示的数据帧:

text                                                                  total_lines
'bla bla text \n\n bla bla another text \n # bla text \n\n\n...'      4
'bla bla bla text2 \n\n\ bla bla bla another text it is \n\n...'      4

text列第1单元格中有4条非空行,第2单元格中有4条非空行,依此类推...

我试图搜索stackoverflow,但找不到任何相关建议.有人能帮我一下吗?

推荐答案

您可以try 以下方式:

df['total_lines'] = df['text'].str.split('\n').apply(lambda x: len(x) - x.count(''))

输出:

                                                 text   total_lines
0   \nbla bla text \n\n bla bla another text \n # ...             4
1   \nbla bla bla text2 \n\n\ bla bla bla another ...             4

每个字符串被分成几行,我们从列表中所有元素的数量中减go 空值.它为我们提供了许多非空值.

Python相关问答推荐

剪切间隔以添加特定日期

获取PANDA GROUP BY转换中的组的名称

如何在验证文本列表时使正则表达式无序?

需要帮助使用Python中的Google的People API更新联系人的多个字段'

如何使用大量常量优化代码?

Pythonquests.get(Url)返回Colab中的空内容

用0填充没有覆盖范围的垃圾箱

在任何要保留的字段中添加引号的文件,就像在Pandas 中一样

具有不匹配列的2D到3D广播

如何在微调Whisper模型时更改数据集?

Parsel无法访问嵌套元素

使用BeautifulSoap库从Web获取表格时没有响应

将COLUMN BY GROUP中的值连接为列表,并将其赋值给PANAS数据框中的变量

django中没有预期的输出

使用Numpy进行重写For循环矢量化

如果任务100%占用CPU,为什么这个多线程代码比顺序代码快?--Python3.10

如何使用数据帧的一列和最后一行对数据帧进行分组?

FASK集合变量未更新(HTML)中的值

安装句子转换器时出错

有没有一种有效的方法来格式化小数?