为了账号安全,请及时绑定邮箱和手机立即绑定

正则表达式获取 MTOM 二进制 PDF 内容

正则表达式获取 MTOM 二进制 PDF 内容

PHP
拉莫斯之舞 2023-04-21 13:34:25
我正在尝试使用 SoapClient 的扩展类获取 MTOM 二进制内容(这是一个 PDF)。这是参考类:https://github.com/debuss/MTOMSoapClient/blob/master/MTOMSoapClient.php因此,如果您看一下课程,您会看到我收到了一个响应,然后我使用正则表达式来获取它的特定部分。这是我得到的全部回复。整个反应HTTP/1.1 200 OKDate: ...Server: .....Set-Cookie: ....; Path=/; HttpOnlySet-Cookie: ...; Path=/; HttpOnlyContent-Type: multipart/related; type="application/xop+xml"; boundary="uuid:0f7fa750-c317-4039-897a-a90685b00d29"; start="<...>"; start-info="text/xml"Keep-Alive: timeout=5, max=99Connection: Keep-AliveTransfer-Encoding: chunked--uuid:0f7fa750-c317-4039-897a-a90685b00d29Content-Type: application/xop+xml; charset=UTF-8; type="text/xml";Content-Transfer-Encoding: binaryContent-ID: <root.message@cxf.apache.org><soap:Envelope xmlns:soap="http://schemas.xmlsoap.org/soap/envelope/"><soap:Body><ns2:downloadAttachResponse xmlns:ns2="http://..../"><return><errStr></errStr><result>0</result><contentFile><xop:Include xmlns:xop="http://www.w3.org/2004/08/xop/include" href="cid:c4d149e6-3f6a-4aa8-bd07-244c92bdc262-2@cxf.apache.org"/></contentFile></return></ns2:downloadAttachResponse></soap:Body></soap:Envelope>--uuid:0f7fa750-c317-4039-897a-a90685b00d29Content-Type: application/octet-streamContent-Transfer-Encoding: binaryContent-ID: <c4d149e6-3f6a-4aa8-bd07-244c92bdc262-2@cxf.apache.org>%PDF-1.4...   LOTS OF BINARY CODE HERE FOR THE PDF--uuid:0f7fa750-c317-4039-897a-a90685b00d29--"响应<soap:Envelope xmlns:soap="http://schemas.xmlsoap.org/soap/envelope/">   <soap:Body>      <ns2:downloadAttachResponse xmlns:ns2="http://.../">         <return>            <errStr/>            <result>0</result>            <contentFile>               <xop:Include href="cid:c4d149e6-3f6a-4aa8-bd07-244c92bdc262-2@cxf.apache.org" xmlns:xop="http://www.w3.org/2004/08/xop/include"/>            </contentFile>         </return>      </ns2:downloadAttachResponse>   </soap:Body></soap:Envelope>使用类的代码,我在二进制数组上得到一个错误,该数组基本上是空的,因为正则表达式没有获取 pdf 内容。这是具体部分:那么,如何使用正则表达式获取 PDF 二进制内容呢?
查看完整描述

1 回答

?
桃花长相依

TA贡献1860条经验 获得超8个赞

在示例数据中,Content-ID: 部分以>

Content-ID: <c4d149e6-3f6a-4aa8-bd07-244c92bdc262-2@cxf.apache.org>

在您使用的模式中,这部分$cid.'[\s\S].+?>至少需要一个字符,[\s\S]后跟任何非贪婪字符的 1+ 倍.+?,这意味着在>

但在示例数据中,它们之间没有字符。

您可以更新代码以使用

preg_match('/Content-ID:[\s\S].+?'.$cid.'[\s\S]*?>([\s\S]*?)--uuid/', $response, $binary);

正则表达式演示

如果数据的结构总是这样,您可以稍微优化一下模式:

Content-ID:\h+<c4d149e6-3f6a-4aa8-bd07-244c92bdc262-2@cxf.apache.org>\R\s*((?:(?!--uuid).*\R)*)--uuid

正则表达式演示


查看完整回答
反对 回复 2023-04-21
  • 1 回答
  • 0 关注
  • 96 浏览

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信