我在python list_a
和list_b
中有两个列表.list_a
有一些图片链接,list_b
也有.99%的项目是相同的,但我必须知道这1%.所有剩余项目都在list_a
中,这意味着list_b
中的所有项目都在list_a
中.我最初的 idea 是减go 所有项目:
list_a = []
list_b = []
list_c = []
arq_b = open('list_b.txt','r')
for b in arq_b:
list_b.append(b)
arq_a = open('list_a.txt','r')
for a in arq_a:
if a not in arq_b:
list_c.append(a)
arq_c = open('list_c.txt','w')
for c in list_c:
arq_c.write(c)
我认为逻辑是正确的,如果我有一些项目,代码运行得很快.但我没有10件,或78.514.022
0件,甚至10万件.我的list_b.txt
表中有100项,list_a.txt
表中有102项.我不知道这个表达的代价:if a not in arq_b
.但如果我执行这段代码,我想今年不会完成.
我的电脑有8GB,我分配15gb用于交换,以避免内存爆炸.
我的问题是,还有另一种方法可以让这个操作更高效(更快)?
-
list_a
是纵坐标,但list_b
不是. - 每件商品都有这个尺寸:
images/00000cd9fc6ae2fe9ec4bbdb2bf27318f2babc00.png
- 订单无关紧要,我想知道剩余的数量.