为了账号安全,请及时绑定邮箱和手机立即绑定

替换在python中不起作用的字符

替换在python中不起作用的字符

慕森卡 2019-12-06 10:15:49
我正在使用漂亮的汤,并且正在编写一个爬虫,并且其中包含以下代码:  print soup.originalEncoding                #self.addtoindex(page, soup)                links=soup('a')            for link in links:                if('href' in dict(link.attrs)):                                       link['href'].replace('..', '')                    url=urljoin(page, link['href'])                    if url.find("'") != -1:                        continue                    url = url.split('?')[0]                    url = url.split('#')[0]                    if url[0:4] == 'http':                        newpages.add(url)        pages = newpages该link['href'].replace('..', '')应该修复出现为../contact/orderform.aspx、../contact/requestconsult.aspx等的链接。但是,它不起作用。链接仍带有前导“ ..”。我缺少什么吗?
查看完整描述

3 回答

?
烙印99

TA贡献1829条经验 获得超13个赞

string.replace()返回具有替换值的字符串。它不会修改原始文件,因此请执行以下操作:


link['href'] = link['href'].replace("..", "")


查看完整回答
反对 回复 2019-12-06
?
慕妹3146593

TA贡献1820条经验 获得超9个赞

它不是就地替换。您需要做:


link['href'] = link['href'].replace('..', '')

例:


a = "abc.."

print a.replace("..","")

'abc'

 print a

'abc..'

a = a.replace("..","")

print a

'abc'


查看完整回答
反对 回复 2019-12-06
  • 3 回答
  • 0 关注
  • 398 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信