为了账号安全,请及时绑定邮箱和手机立即绑定

用BeautifulSoup(re.text, lxml),关于beautifulsoup 与 lxml 的问题

import requests
from bs4 import BeautifulSoup
import re

sum = 0
r = requests.get('https://book.douban.com/subject/5299764/comments/')
soup = BeautifulSoup(r.text, 'lxml')
pattern = soup.find_all('p','comment-content')
for item in pattern:
    print(item.string)
pattern_s = re.compile('<span class="user-stars allstar(.*?) rating"')
p = re.findall(pattern_s, r.text)
for star in p:
    sum += int(star)
print(sum)

在运行时,出错,与lxml有关

http://img1.sycdn.imooc.com//59fd627800018d9b12530266.jpg

http://img1.sycdn.imooc.com//59fd639c0001456108520577.jpg

求大神,帮忙 

正在回答

1 回答

看起来像是lxml没装好,重装一下试试:pip3 install lxml

0 回复 有任何疑惑可以回复我~

举报

0/150
提交
取消
Python开发简单爬虫
  • 参与学习       227670    人
  • 解答问题       1219    个

本教程带您解开python爬虫这门神奇技术的面纱

进入课程

用BeautifulSoup(re.text, lxml),关于beautifulsoup 与 lxml 的问题

我要回答 关注问题
意见反馈 帮助中心 APP下载
官方微信