preg_match和guzzle响应的问题

preg_match和guzzle响应的问题

问题描述:

我试图preg_match通过guzzle收到的响应。 问题是当我将其内容输入到我的everything_in_tags函数peg_match函数不会返回任何结果。preg_match和guzzle响应的问题

的功能的preg_match当我的var_dump($这个 - >体)的内容复制粘贴手动进everything_in_tags功能的作用类似于aspected。

转换后$ this-> body是一个字符串对象。

所以,现在我想知道为什么它的行为如此,有人会如此善良,并告诉我如何解决这个问题。

Thx提前。

代码:

public function __construct() { 
    $this->dataRaw = (object) []; 
    $this->client = new GuzzleHttp\Client(); 
    $this->res = $this->client->request('GET', 'https://www- genesis.destatis.de/genesisWS/web/ExportService_2010?method=TabellenExport&kennung=kennung&passwort=password&namen=13321-0001&bereich=Alle&format=html&strukturinformation=false&komprimieren=true&transponieren=true&startjahr=2016&endjahr=2017&zeitscheiben=&regionalmerkmal=&regionalschluessel=&sachmerkmal=FAMSTD&sachschluessel=VERH&sachmerkmal2=&sachschluessel2=&sachmerkmal3=&sachschluessel3=&stand=&auftrag=false&sprache=de'); 

    $this->body = (string) $this->res->getBody()->getContents(); 
    $this->dom = new Dom; 

    var_dump($this->body); 


    $this->table = $this->everything_in_tags($this->body, 'table', false); 

    $this->dom->loadStr($this->table , []); 
    $this->html = $this->dom->outerHtml; 
} 

function everything_in_tags($string, $tagname, $inner) { 
    $pattern = "#<\s*?$tagname\b[^>]*>(.*?)</$tagname\b[^>]*>#s"; 
    preg_match($pattern, $string, $matches); 
    return $matches[$inner ? 1 : 0]; 
} 

狂饮 - 响应为字符串:

 200text/xml;charset=ISO-8859-11Bei mindestens einem Objekt sind Fehler  oder Warnungen aufgetreten.Information13321-000122Mindestens ein Parameter enthält ungültige Werte. Er wurde angepasst, um den Service starten zu können.: zeitscheibenWarnungAktualisierte 
 
Daten28.09.201713321-000109:21:273888 3114 9999674 falseKNZPT13false falseERW0024falseErwerbstätige3Wfalsefalse falseERW1235falseVeränderungsrate zum Vormonat3Wfalsefalse falseERW1246falseVeränderungsrate zum  Vorjahresmonat3WfalsefalseInlands-/ Inländerkonzept0SKfalsefalseTemporär 
 
false133211false falseDINSG2falseDeutschland insgesamt1RKfalsefalseErwerbstätigenrechnung in der VGR (national)0Efalsefalse8925 falseJAHR8false falseMONAT9falseMonate8ZKfalsefalseJahr0ZIfalsefalse falseWERTE17falseWerte0SKfalsefalse 
 
<?xml version="1.0" encoding="utf-8" standalone="no"?> 
 
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> 
 
<html xmlns="http://www.w3.org/1999/xhtml"> 
 

 
<head> 
 
    <title>GENESIS-Tabelle: Tempor&#228;r</title> 
 
</head> 
 

 
<body> 
 
    <table border="1" summary="Die Tabelle Tempor&#228;r enth&#228;lt aktuelle Daten zur Statistik - Erwerbst&#228;tigenrechnung in der VGR (national) - mit Stand vom 28.09.2017 "> 
 
    <caption>Erwerbst&#228;tige (inkl. Ver&#228;nderungsraten): Deutschland,<br />Monate, Inlands-/Inl&#228;nderkonzept, original/saisonbereinigte<br />Werte</caption> 
 
    <thead> 
 
     <tr> 
 
     <th id="Z4S1" colspan="8" align="left">Erwerbst&#228;tigenrechnung in der VGR (national)<br />Deutschland</th> 
 
     </tr> 
 
    </thead> 
 
    <tbody>  
 
    </tbody> 
 
    </table> 
 
    <p></p> 
 
    <div class="copyright">&#169; Statistisches Bundesamt (Destatis), 2017 &#160;&#124; Stand: 28.09.2017/09:21:27</div> 
 
    </body> 
 

 
    </html>Alle13321-0001false2017htmlfalseFAMSTDdetruefalse0

我假设你狂饮 - 响应作为字符串是真正的输出你会得到,那就是:你的浏览器会是什么当你打电话给你的时候

如果这是正确的,那么很可能是您不明白从该URL返回的内容。什么是返回是某种包含XML XML的,就像这样(或远程的东西类似):

<soapenv:Envelope><soapenv:Body>[content]</soapenv:Body></soapenv:Envelope> 

但是,你的目标的内容最有可能是HTML的转义,即:在<table>你看在浏览器的输出中实际上是&lt;table&gt;,因为标记是内容而不是标记。

我的建议是:

  1. 看看在浏览器中实际的源代码(右键点击:凡是查看源代码或),当你输出你的狂饮响应,它应该包含比你提供更多的输出。
  2. 使用xml解析器(或者一个soap解析器,或者任何解析器,不知道这是否实际是rpc)在肥皂信封中查找内容,然后使用xml解析器解析该内容。

这应该够了。但是,我可能是错的。