我环顾了四周,只找到了Python2.6和更早版本的解决方案,没有任何关于如何在Python3中实现这一点的内容.X.(我只能访问Win7 box.)

我必须能够在3.1中做到这一点,最好没有外部库.目前,我已经安装了httplib2,并可以访问命令提示符curl(这就是我获取页面源代码的方式).不幸的是,curl不解码html实体,据我所知,我在文档中找不到解码它的命令.

是的,我试过让 beautifulsoup 发挥作用,很多次都没有成功.X.如果您能提供有关如何在MS Windows环境下使用python 3的明确说明,我将不胜感激.

所以,为了清楚起见,我需要把这样的字符串:Suzy & John变成这样的字符串:"Suzy&John".

推荐答案

您可以使用功能html.unescape:

Python3.4+年后(感谢J.F.塞巴斯蒂安的更新):

import html
html.unescape('Suzy & John')
# 'Suzy & John'

html.unescape('"')
# '"'

Python3.3岁或以上:

import html.parser    
html.parser.HTMLParser().unescape('Suzy & John')

Python2年:

import HTMLParser
HTMLParser.HTMLParser().unescape('Suzy & John')

Python-3.x相关问答推荐

Python网页抓取:代码输出:汤未定义

我在创建Pandas DataFrame时感到困惑

确定字符串的长度并提取前15或14个字符

为什么我的Selenium脚本在密码元素上失败?

将两列的乘积连续添加到一列的累积和中

以不规则频率识别数据框日期时间列上缺失的日期,并用关联值填充它们

Pandas matplotlib:条形图占总数的百分比

位对的距离

numpy是如何添加@运算符的?

如何准确测定cv2的结果.在BW/黑白图像中查找对象?

对齐文本文件中的列

django rest框架中的save()、create()和update()有什么区别?

Python - For 循环数百万行

Python 3.10 模式匹配 (PEP 634) - 字符串中的通配符

Python3 mysqlclient-1.3.6(又名 PyMySQL)的用法?

我们如何获得 __repr__() 的默认行为?

混合全局/参数和名为top的函数的奇怪python行为

没有名为urlparse的模块,但我没有使用 urlparse

在 macbook pro M1 上安装 Tensorflow 时出现zsh:非法硬件指令 python

如何使用 Celery 和 Django 将任务路由到不同的队列