我试图抓取的网站如下所示:<div align="center" class="movietable"> <span style="width:45px;height:47px;vertical-align:middle;display:table-cell;"> <a href="browse.php?cat=19"><img border="0" src="styles/images/cat/hd.png" alt="HdO"></a> </span></div><div align="left" class="movietable"> <span style="padding:0px 5px;width:455px;height:47px;vertical-align:middle;display:table-cell;"> <a data-toggle="tooltip" data-placement="bottom" data-html="true" title="" href="details.php?id=578197" data-original-title="<img src='https://trasd.tmdb.org//tqistSlQGQVlvDZHweD.jpg'>"> <b>GET THIS TEXT</b></a><br><font class="small">[Action, Horror, Sci-Fi]</font> </span> </div>我怎样才能提取:<b>标签中的文本- 在这种情况下GET THIS TEXTfont_class = 'small' 的内容 - 在这种情况下,这将是Action, Horror, Sci-Fi.movietable b 效果很好!!img_scr 链接 - 在这种情况下它将是 https://trasd.tmdb.org//tqistSlQGQVlvDZHweD.jpg我不知道如何做到这一点
3 回答

慕婉清6462132
TA贡献1804条经验 获得超2个赞
以下是您可以使用的CSS选择器:
driver.find_element_by_css_selector('div[align=left] b')
driver.find_element_by_css_selector('div[align=left] .small')
driver.find_element_by_css_selector('a[title]').get_attribute('data-original-title')

有只小跳蛙
TA贡献1824条经验 获得超8个赞
您可以使用 xpath 访问所有这些:
1) [parents before this div]/div[2]/span/a/b
2) [parents before this div]/div[2]/span/font
3) [parents before this div]/div[1]/span/a/img
[parents before this div] should be /html/body/...
添加回答
举报
0/150
提交
取消