为了账号安全,请及时绑定邮箱和手机立即绑定

如何在python搜寻器中访问具有多个页面的表单的发布数据

如何在python搜寻器中访问具有多个页面的表单的发布数据

茅侃侃 2021-03-03 14:10:00
我正在尝试抓取python发布的文章,并获取引用该文章的所有论文的发布ID。例如这篇文章(ID:11825149) http://www.ncbi.nlm.nih.gov/pubmed/11825149 具有页面链接到引用它的所有文章: http://www.ncbi.nlm.nih.gov / pubmed?linkname = pubmed_pubmed_citedin&from_uid = 11825149 问题是它具有200多个链接,但每页仅显示20个。网址无法访问“下一页”链接。有没有办法打开“发送到”选项或使用python查看下一页上的内容?我目前如何打开已发布页面:def start(seed):    webpage = urlopen(seed).read()    print webpage    citedByPage = urlopen('http://www.ncbi.nlm.nih.gov/pubmedlinkname=pubmed_pubmed_citedin&from_uid=' + pageid).read()    print citedByPage从中我可以提取第一页上所有被引用的链接,但是如何从所有页面中提取它们呢?谢谢。
查看完整描述

2 回答

  • 2 回答
  • 0 关注
  • 169 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信