我在下面有这个代码:def check_proxy(input_queue): while 1: prx = input_queue.get() try: proxy_handler = urllib2.ProxyHandler({'http': prx}) opener = urllib2.build_opener(proxy_handler) opener.addheaders = [('User-agent', 'Mozilla/5.0')] urllib2.install_opener(opener) req = urllib2.Request("http://www.google.com") sock = urllib2.urlopen(req, timeout=7) rs = sock.read(1000) if '<title>Google</title>' in rs: print '[OK]', prx input_queue.task_done()我已将检查 Google.com 更改为 instagram.com我把标题改成了 Instagram但由于某种原因它不起作用。我已经检查了 Instagram 的“打印 rs”。并得到了这个标题: <title>Instagram</title>只是想知道如何检查https://www.instagram.com而不是 google.com谢谢
1 回答
翻阅古今
TA贡献1780条经验 获得超5个赞
与 Instagram 的 HTML 中的标题匹配的字符串应该是'<title>\nInstagram\n<title>
. Google 的 HTML 中没有换行符,但 Instagram 有。
添加回答
举报
0/150
提交
取消