从Python字符串中删除不在允许列表中的HTML标记我有一个包含文本和HTML的字符串。我想删除或以其他方式禁用某些HTML标记,例如<script>,允许其他人,以便我可以安全地在网页上呈现它。我有一个允许的标签列表,如何处理字符串以删除任何其他标签?
3 回答

尚方宝剑之说
TA贡献1788条经验 获得超4个赞
我使用FilterHTML。它很简单,允许您定义一个控制良好的白名单,擦除URL,甚至匹配正则表达式的属性值或每个属性具有自定义过滤功能。如果小心使用它可能是一个安全的解决方案。以下是自述文件的简化示例:
import FilterHTML# only allow:# <a> tags with valid href URLs# <img> tags with valid src URLs and measurementswhitelist = { 'a': { 'href': 'url', 'target': [ '_blank', '_self' ], 'class': [ 'button' ] }, 'img': { 'src': 'url', 'width': 'measurement', 'height': 'measurement' },}filtered_html = FilterHTML.filter_html(unfiltered_html, whitelist)
添加回答
举报
0/150
提交
取消