为了账号安全,请及时绑定邮箱和手机立即绑定

Python中BeautifulSoup怎么把下面这段HTML的内容提取出来

Python中BeautifulSoup怎么把下面这段HTML的内容提取出来

慕粉3187486 2016-06-21 11:34:47
         <li id="SalesRank">          <b>           Amazon Best Sellers Rank:          </b>          #3,857 in Pet Supplies (          <a href="https://www.amazon.com/gp/bestsellers/pet-supplies">           See Top 100 in Pet Supplies          </a>          )如上:我只是需要“#3,857 in Pet Supplies”这一段,BeautifulSoup代码应该怎么写
查看完整描述

3 回答

?
秋名山车神

TA贡献54条经验 获得超303个赞

需要获取连接还是里面的文字?

查看完整回答
反对 回复 2016-06-21
  • 慕粉3187486
    慕粉3187486
    就只想获取这一段文字:‘#3,857 in Pet Supplies' 我用这段代码实现的,你看下这样可行不: c=soup.find(string=re.compile(r'in Pet Supplies')) c=c.strip()
  • 秋名山车神
    秋名山车神
    这样只能选出来 包含 in Pet Supplies 的一行文本而已 没有边界匹配
  • 慕粉3187486
    慕粉3187486 回复 秋名山车神
    恩是的 不过也已经足够用了。还有一个小问题,怎么设定定时从这个url里面提取这段文字,读取的函数已经定义好了。 def getsalesrank(url): a=urllib2.urlopen(url) b=a.read() soup=BeautifulSoup(b,'html.parser') c=soup.find(string=re.compile(r'in Pet Supplies')) c=c.strip() return c 然后怎么定时运行这个函数,例如每隔一小时运行一次这样
  • 3 回答
  • 1 关注
  • 2728 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信