为了账号安全,请及时绑定邮箱和手机立即绑定

如何阻止 Excel 工作表被覆盖,我希望它在一张工作表中

如何阻止 Excel 工作表被覆盖,我希望它在一张工作表中

Cats萌萌 2023-06-27 16:25:18
当数据被写入(for循环)在一个Excel工作表中时,它会覆盖Excel工作表,而且为了阻止它覆盖,我需要将收集到的新数据分离到工作表中。(熊猫)那么我该怎么做呢?代码如下:ih = input('pages: ')def test():        for page in range(1, int(ih)):        req = requests.get(url + str(page))        soup = BeautifulSoup(req.content, 'html.parser')        g_data = soup1.find_all('span', {"class": "b-card b-card-mod-h vehicle"})        g_price = soup.find_all('div', {"class": "b-card--el-vehicle-price"})        g_mile = soup.find_all('p', {"class": "b-card--el-brief-details"})        g_name = soup.find_all('p', {"class": "b-card--el-description"})        g_user = soup.find_all('a', {"class": "b-card--el-agency-title"})        g_link = soup.find_all('div', {"class": "b-card--el-inner-wrapper"})        m_price = [item.text for item in g_price]        m_mile = [item.text for item in g_mile]        m_user = [item.text for item in g_user]        m_name = [item.text for item in g_name]        m_link = [item.a["href"] for item in g_link]        m_extensions = [('') for item in g_link]        l1 = m_name        l2 = m_mile        l3 = m_price        l4 = m_user        l5 = m_link        l6 = m_extensions        s1 = pd.Series(l1, name='Vehicle Name')        s2 = pd.Series(l2, name='Mileage')        s3 = pd.Series(l3, name='Price')        s4 = pd.Series(l4, name='User')        s5 = pd.Series(l5, name='Link')        s6 = pd.Series(l6, name='Site')        df = pd.concat([s1,s2,s3,s4,s6+s5], axis=1)        if(os.path.isfile('hello_world.xlsx')):            sheet.write(df)            workbook.close()        else:            sheet.write('hello_world.xlsx', index= False)            workbook.close()        print(f'[+]Writing Data from page ' + str(page))        ctypes.windll.kernel32.SetConsoleTitleW('[+]Writing Data from page ' + str(page))    print('[=]Written Data')# Write the data.test()如果有人可以帮忙,谢谢!
查看完整描述

1 回答

?
繁花如伊

TA贡献2012条经验 获得超12个赞

您可以使用 openpyxl 获取工作表的最后一行,然后使用 dataframeto_excel方法将数据写入特定行。请注意,您必须设置writer.sheets为防止在保存之前清除工作簿。


将此方法添加到您的代码中:


def AppendExcel(df, filename):

    import openpyxl

    sheetname = "Sheet1"

    if not os.path.isfile(filename):  # create new file

        df.to_excel(filename, startrow=0, index=False, sheet_name=sheetname) 

    else:  # append

        wb = openpyxl.load_workbook(filename)

        writer = pd.ExcelWriter(filename, engine='openpyxl') 

        writer.book = wb

        writer.sheets = dict((ws.title, ws) for ws in wb.worksheets) # need this to prevent overwrite

        lastrow = wb[sheetname].max_row

        df.to_excel(writer, startrow=lastrow, index=False, header=False, sheet_name=sheetname) 

        writer.save()

有了这个:


AppendExcel(df, 'hello_world.xlsx')

此代码未经测试,因此您可能需要对其进行一些调整。


查看完整回答
反对 回复 2023-06-27
  • 1 回答
  • 0 关注
  • 192 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信