已解决430363个问题，去搜搜看，总会有你想问的

Python中BeautifulSoup怎么把下面这段HTML的内容提取出来

首页猿问 Python中BeautifulS...

Python中BeautifulSoup怎么把下面这段HTML的内容提取出来

Python

慕粉3187486 2016-06-21 11:34:47

<li id="SalesRank"> <b> Amazon Best Sellers Rank: </b> #3,857 in Pet Supplies ( <a href="https://www.amazon.com/gp/bestsellers/pet-supplies"> See Top 100 in Pet Supplies </a> )如上：我只是需要“#3,857 in Pet Supplies”这一段，BeautifulSoup代码应该怎么写

查看完整描述

3 回答

秋名山车神

TA贡献54条经验获得超303个赞

需要获取连接还是里面的文字？

反对回复 2016-06-21

慕粉3187486
就只想获取这一段文字：‘#3,857 in Pet Supplies' 我用这段代码实现的，你看下这样可行不： c=soup.find(string=re.compile(r'in Pet Supplies')) c=c.strip()

回复 2016-06-21
秋名山车神
这样只能选出来包含 in Pet Supplies 的一行文本而已没有边界匹配

回复 2016-06-21
慕粉3187486 回复秋名山车神
恩是的不过也已经足够用了。还有一个小问题，怎么设定定时从这个url里面提取这段文字，读取的函数已经定义好了。 def getsalesrank(url): a=urllib2.urlopen(url) b=a.read() soup=BeautifulSoup(b,'html.parser') c=soup.find(string=re.compile(r'in Pet Supplies')) c=c.strip() return c 然后怎么定时运行这个函数，例如每隔一小时运行一次这样

回复 2016-06-21