2 回答
TA贡献1877条经验 获得超1个赞
你不应该为此使用正则表达式。您可以strpos像以前一样使用您的,但将其移动到 DOM 解析中并比较每个img. 然后您可以使用removeChild()删除相应的图像。(这是来自如何使用 DOMDocument 删除元素的改编答案?)
<?php
$inbox_message = '<p> Keep This</p><img src="http://example.com/someimage1.jpeg"><img src="http://example.com/someimage2.jpeg"><img src="http://example.com/someimage3.jpeg"><img src="http://example.com/someimage4.jpeg"><h1>Fake element</h1><img style="OVERFLOW: hidden; WIDTH: 0px; MAX-HEIGHT: 0px" alt="" src="http://test.mydomain.com/project433q325/track/Images/signature.gif?id=446&etc=1586624376">';
$doc = new DOMDocument();
$doc->loadHTML($inbox_message);
$imgs = $doc->getElementsByTagName('img');
for($i = $imgs->length; --$i >= 0;){
$node = $imgs->item($i);
if (strpos($node->getAttribute('src'), 'http://test.mydomain.com/project433q325/track/Images/signature.gif?') !== false) {
$node->parentNode->removeChild($node);
}
}
echo $doc->savehtml();
https://3v4l.org/qinLR
您也可以使用strtolowerif $node->getAttribute('src')might contain varying case。在这种情况下,针strpos也应该小写。
对于正则表达式问题...
preg_replace("\<img src\=\"(.+)\"(.+)\/\>/i", '', $src);
正则表达式的开头试图使用不是有效定界符的反斜杠。A delimiter can be any non-alphanumeric, non-backslash, non-whitespace character.起始定界符必须与结束定界符匹配。此外,您$src只包含属性的值,因此<img src...永远不会匹配。
如果您要实现该功能,则.+需要将其替换为您要检查的 URI。
但是正则表达式在这里确实是错误的方法。像以前一样,为这些类型的工作使用解析器。正则表达式不应用于结构化数据。如果它是结构化的,则可能已经为它编写了函数。
TA贡献1936条经验 获得超6个赞
要删除所有img
标签,请使用以下正则表达式模式:
<img\s+[^>]+>
https://regex101.com/r/HfStzZ/1
要包含您在问题中描述的特定src
网址,请使用以下正则表达式模式:
<img\s+[^>]*\bsrc="[^"]*\/signature\.gif[^\>]*\>
https://regex101.com/r/HfStzZ/2
在 PHP 中,使用preg_replace
如下命令:
$output = preg_replace('/<img\s+[^>]*\bsrc="[^"]*\/signature\.gif[^\>]*\>/', '', $input);
- 2 回答
- 0 关注
- 113 浏览
添加回答
举报