为了账号安全,请及时绑定邮箱和手机立即绑定

使用python pandas和beautifulSoup刮分页网页表

使用python pandas和beautifulSoup刮分页网页表

当年话下 2021-04-07 08:21:31
我是python熊猫的初学者,我正在尝试使用漂亮的汤包刮掉分页的表,数据被刮掉,但是每个单元格的内容都在一行中,我无法获得一个连贯的csv文件这是我的代码:import urllibimport urllib.requestfrom bs4 import BeautifulSoupimport osfile=open(os.path.expanduser("sites_commerciaux.csv"), "wb")def make_soup(url):    thepage=urllib.request.urlopen(url)    soupdata=BeautifulSoup(thepage,"html.parser")    return soupdataheaders="Nom_commercial_du_Site,Ville,Etat,Surface_GLA,Nombre_de_boutique,Contact"file.write(bytes(headers,encoding='ascii',errors='ignore'))save=""for num in range(0,22):     soup=make_soup("http://www.ceetrus.com/fr/implantations-sites-commerciaux?page="+str(num))    for rec in soup.findAll('tr'):        saverec=""        for data in rec.findAll('td'):            saverec=saverec+","+data.text            if len(saverec)!=0:             save=save+"\n"+saverec[1:]file.write(bytes(save,encoding='ascii',errors='ignore'))谁能帮我解决这个问题
查看完整描述

1 回答

  • 1 回答
  • 0 关注
  • 155 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信