为了账号安全,请及时绑定邮箱和手机立即绑定

从Python字符串中删除不在允许列表中的HTML标记

从Python字符串中删除不在允许列表中的HTML标记

喵喔喔 2019-08-24 17:42:50
从Python字符串中删除不在允许列表中的HTML标记我有一个包含文本和HTML的字符串。我想删除或以其他方式禁用某些HTML标记,例如<script>,允许其他人,以便我可以安全地在网页上呈现它。我有一个允许的标签列表,如何处理字符串以删除任何其他标签?
查看完整描述

3 回答

?
尚方宝剑之说

TA贡献1788条经验 获得超4个赞

我使用FilterHTML。它很简单,允许您定义一个控制良好的白名单,擦除URL,甚至匹配正则表达式的属性值或每个属性具有自定义过滤功能。如果小心使用它可能是一个安全的解决方案。以下是自述文件的简化示例:

import FilterHTML# only allow:#   <a> tags with valid href URLs#   <img> tags with valid src URLs and measurementswhitelist = {
  'a': {
    'href': 'url',
    'target': [
      '_blank',
      '_self'
    ],
    'class': [
      'button'
    ]
  },
  'img': {
    'src': 'url',
    'width': 'measurement',
    'height': 'measurement'
  },}filtered_html = FilterHTML.filter_html(unfiltered_html, whitelist)


查看完整回答
反对 回复 2019-08-24
  • 3 回答
  • 0 关注
  • 1526 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信