为了账号安全,请及时绑定邮箱和手机立即绑定

BeautifulSoup 在每个开始和结束标记之前和之后添加额外的空格

BeautifulSoup 在每个开始和结束标记之前和之后添加额外的空格

森栏 2021-08-24 15:30:38
这是示例程序:from bs4 import BeautifulSoupimport HTMLParsersoup = BeautifulSoup('', 'html.parser')html = soup.new_tag('html')head = soup.new_tag('head')body = soup.new_tag('body')html.insert(0, head)html.insert(1, body)soup.insert(0, html)blockquote = soup.new_tag('blockquote')sourceStr = "This is <i>My Website Title</i>, just for example."blockquote.insert(0, BeautifulSoup(HTMLParser.HTMLParser().unescape(sourceStr), 'html.parser'))soup.body.insert(1, blockquote)print soup.prettify()它生成以下输出:<html>   <head>   </head>   <body>      <blockquote>         This is         <i>         My Website Title         </i>         , just for example.      </blockquote>   </body></html>它实际上显示在浏览器中,例如:这是我的网站标题,例如。在“我的网站标题”和以下逗号之间添加了额外的空格。如何避免通过 BeautifulSoup 添加额外的空格?如果不使用任何字符串操作,有没有办法使用 BeautifulSoup 方法来处理这个问题?
查看完整描述

1 回答

  • 1 回答
  • 0 关注
  • 189 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信