为了账号安全,请及时绑定邮箱和手机立即绑定

无法解码或读取网站URL来计数字符串

无法解码或读取网站URL来计数字符串

梵蒂冈之花 2021-03-30 12:11:55
我正在尝试使用以下代码对网站中的数据进行搜索和计数,您可以看到我在代码中添加了一些额外的打印信息以进行调试,目前结果始终为“ 0”,这对我来说是一个读取某种文件时出错。如果我打印名为html的变量,则可以清楚地看到正在搜索的所有三个字符串都包含在html中,但是如前所述,我的所有打印内容都不打印任何内容,并且最终打印计数仅返回“ 0”。如您所见,我尝试了三种不同的方法,每次都遇到相同的问题。import urllib2import urllibimport reimport jsonimport mechanizepost_url = "url_of_fishermans_finds"browser = mechanize.Browser()browser.set_handle_robots(False)browser.addheaders = [('User-agent', 'Firefox')]html = browser.open(post_url).read().decode('UTF-8')# Attempted method 1print html.count("SEA BASS")# Attempted method 2count = 0enabled = Falsefor line in html:  if 'MAIN FISHERMAN' in line:    print "found main fisherman"    enabled = True  elif 'SEA BASS' in line:    print "found fish"    count += 1  elif 'SECONDARY FISHERMAN' in line:    print "found secondary fisherman"    enabled = Falseprint count# Attempted method 3relevant = re.search(r"MAIN FISHERMAN(.*)SECONDARY FISHERMAN", html)[1]found = relevant.count("SEA BASS")print found这可能真的很简单,任何评论或帮助将不胜感激。亲切的问候AEA
查看完整描述

2 回答

  • 2 回答
  • 0 关注
  • 260 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信