我正在努力从文件中提取文本.文本格式如下,[]表示分隔符.
文件文本:
[Dataset 1] "text" [Filename 1] "text" [Filename 2] "text" [Key Data Delimiter] !key data! [Key Data Delimiter] "text" [Filename 3] "text" [Dataset 2] "text" [Filename 1] [Key Data Delimiter] key data [Key Data Delimeter] "text" [Filename 2] [Dataset 3]...
期望输出:
[Dataset 1], [Filename 2], !key data!.
[Dataset 2], [Filename 1], !key data!.
文件名位于该文件名之后,键分隔符出现在另一个数据集之前.每个数据集只有一个包含关键数据的文件.
f = open('file.txt', 'r')
TextBetween_KeyDataDelimeter = re.findall('KeyDataDelimeter(.+?)KeyDataDelimiter',f.read(), re.DOTALL)
我正在考虑使用if/else语句嵌套for循环,但这似乎相当混乱.谁能给我指一下我应该读的文件来帮我解决问题吗.