已解决430363个问题，去搜搜看，总会有你想问的

bs4：搜索特殊字符，例如“ä”

首页猿问 bs4：搜索特殊字符，例如&ldq...

bs4：搜索特殊字符，例如“ä”

Python

慕尼黑的夜晚无繁华 2021-03-20 19:15:02

我正在尝试在网页中搜索带有“ä”这样的字符的文本bs4无法正确编码这些字符，因此无法正确搜索该站点。例如 <td> <a href="/gy/area/name/1208.html">täkäen</a>soup.findAll(text='täkäen') - does not work我也尝试搜索.html字符串（如下），但这似乎也不起作用。soup.findAll(text='/gy/area/name/1208.html') 当我阅读网页时，有人会知道如何正确编码网页吗？或者只是在上面的代码中搜索“ /gy/area/name/1208.html”

查看完整描述

2 回答

慕雪6442864

TA贡献1812条经验获得超5个赞

您需要查找unicode值：

soup.findAll(text=u'täkäen')

演示：

>>> from bs4 import BeautifulSoup

>>> soup = BeautifulSoup('''\

... <td>

... <a href="/gy/area/name/1208.html">täkäen</a>

... ''')

>>> soup

<a href="/gy/area/name/1208.html">täkäen</a></td></body></html>

>>> soup.findAll(text=u'täkäen')

[u't\xe4k\xe4en']

您需要确保正确设置源代码编码，或使用unicode转义码。

反对回复 2021-03-31

2 回答
0 关注
334 浏览

关注

添加回答

0/150

提交

取消

微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号

热搜

最近搜索清空

bs4：搜索特殊字符，例如“ä”

bs4：搜索特殊字符，例如“ä”

2 回答

添加回答