为了账号安全,请及时绑定邮箱和手机立即绑定

我的正则表达式中的某些内容无法将没有扩展名的位置提供的图片识别为有效的网址

我的正则表达式中的某些内容无法将没有扩展名的位置提供的图片识别为有效的网址

PHP
沧海一幻觉 2021-04-28 09:10:41
我一直在研究一个小的脚本,该脚本旨在将整个网页打包到一个html文件中。我整天都在努力,到目前为止,所有具有适当扩展名的图像都已正确转换并插入,但是,某些没有适当扩展名的图像将被跳过。这是我的代码function getimages($string) {    $html = $string;    $html = str_replace("https://", "http://", $html);$dom = new DOMDocument();$dom->loadHTML(mb_convert_encoding($html, 'HTML-ENTITIES', 'UTF-8'));$images = $dom->getElementsByTagName('img');foreach ($images as $image) {        $src = $image->getAttribute('src');        if (preg_match("|^(https?:)\/\/|i", $src)) {                $type = pathinfo($src, PATHINFO_EXTENSION);        $arrContextOptions=array(    "ssl"=>array(        "verify_peer"=>false,        "verify_peer_name"=>false,    ),);          $data = file_get_contents($src, false, stream_context_create($arrContextOptions));        if (strlen(bin2hex($data))/2 > 1) {            if (strlen($type) < 3) {                $type="png";            }        $base64 = 'data:image/' . $type . ';base64,' . base64_encode($data);        $image->setAttribute("src", $base64);        }        }        $image->removeAttribute("srcset");}$html = $dom->saveHTML();return $html;}这是一个示例图片网址,将被跳过https://encrypted-tbn0.gstatic.com/images?q=tbn:ANd9GcSTJgMWr6TgV_3mJcF9Q9jRw6K_-oTLfRErLcKGTFXhn-pMQLJB24MhbTHt4A这几乎完全可以按照我的要求工作,但是我对regex真的很陌生,而IDK所做的工作导致这些url无法得到处理,请以我的方式来写一行。的PHP
查看完整描述

1 回答

  • 1 回答
  • 0 关注
  • 181 浏览

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信