我目前正在使用BeautifulSoup来解析网页的Html代码.
要从元素中获取文本,我使用".text"属性:
soup.find('p', {'class': 'example'}).text
但问题是,有时我的结果是"\xa0"
分:
"some text «\xa0text\xa0»"
我试着使用"替换"功能:
soup = BeautifulSoup(driver.page_source.replace('\xa0', ' '), "lxml")
注意:我不想对解析的每个字符串都使用一个函数,我希望从一开始就把这些字符从汤中清除掉.