preg_match和guzzle响应的问题
问题描述:
我试图preg_match通过guzzle收到的响应。 问题是当我将其内容输入到我的everything_in_tags函数peg_match函数不会返回任何结果。preg_match和guzzle响应的问题
的功能的preg_match当我的var_dump($这个 - >体)的内容复制粘贴手动进everything_in_tags功能的作用类似于aspected。
转换后$ this-> body是一个字符串对象。
所以,现在我想知道为什么它的行为如此,有人会如此善良,并告诉我如何解决这个问题。
Thx提前。
代码:
public function __construct() {
$this->dataRaw = (object) [];
$this->client = new GuzzleHttp\Client();
$this->res = $this->client->request('GET', 'https://www- genesis.destatis.de/genesisWS/web/ExportService_2010?method=TabellenExport&kennung=kennung&passwort=password&namen=13321-0001&bereich=Alle&format=html&strukturinformation=false&komprimieren=true&transponieren=true&startjahr=2016&endjahr=2017&zeitscheiben=®ionalmerkmal=®ionalschluessel=&sachmerkmal=FAMSTD&sachschluessel=VERH&sachmerkmal2=&sachschluessel2=&sachmerkmal3=&sachschluessel3=&stand=&auftrag=false&sprache=de');
$this->body = (string) $this->res->getBody()->getContents();
$this->dom = new Dom;
var_dump($this->body);
$this->table = $this->everything_in_tags($this->body, 'table', false);
$this->dom->loadStr($this->table , []);
$this->html = $this->dom->outerHtml;
}
function everything_in_tags($string, $tagname, $inner) {
$pattern = "#<\s*?$tagname\b[^>]*>(.*?)</$tagname\b[^>]*>#s";
preg_match($pattern, $string, $matches);
return $matches[$inner ? 1 : 0];
}
狂饮 - 响应为字符串:
200text/xml;charset=ISO-8859-11Bei mindestens einem Objekt sind Fehler oder Warnungen aufgetreten.Information13321-000122Mindestens ein Parameter enthält ungültige Werte. Er wurde angepasst, um den Service starten zu können.: zeitscheibenWarnungAktualisierte
Daten28.09.201713321-000109:21:273888 3114 9999674 falseKNZPT13false falseERW0024falseErwerbstätige3Wfalsefalse falseERW1235falseVeränderungsrate zum Vormonat3Wfalsefalse falseERW1246falseVeränderungsrate zum Vorjahresmonat3WfalsefalseInlands-/ Inländerkonzept0SKfalsefalseTemporär
false133211false falseDINSG2falseDeutschland insgesamt1RKfalsefalseErwerbstätigenrechnung in der VGR (national)0Efalsefalse8925 falseJAHR8false falseMONAT9falseMonate8ZKfalsefalseJahr0ZIfalsefalse falseWERTE17falseWerte0SKfalsefalse
<?xml version="1.0" encoding="utf-8" standalone="no"?>
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<title>GENESIS-Tabelle: Temporär</title>
</head>
<body>
<table border="1" summary="Die Tabelle Temporär enthält aktuelle Daten zur Statistik - Erwerbstätigenrechnung in der VGR (national) - mit Stand vom 28.09.2017 ">
<caption>Erwerbstätige (inkl. Veränderungsraten): Deutschland,<br />Monate, Inlands-/Inländerkonzept, original/saisonbereinigte<br />Werte</caption>
<thead>
<tr>
<th id="Z4S1" colspan="8" align="left">Erwerbstätigenrechnung in der VGR (national)<br />Deutschland</th>
</tr>
</thead>
<tbody>
</tbody>
</table>
<p></p>
<div class="copyright">© Statistisches Bundesamt (Destatis), 2017  | Stand: 28.09.2017/09:21:27</div>
</body>
</html>Alle13321-0001false2017htmlfalseFAMSTDdetruefalse0
答
我假设你狂饮 - 响应作为字符串是真正的输出你会得到,那就是:你的浏览器会是什么当你打电话给你的时候
如果这是正确的,那么很可能是您不明白从该URL返回的内容。什么是返回是某种包含XML XML的,就像这样(或远程的东西类似):
<soapenv:Envelope><soapenv:Body>[content]</soapenv:Body></soapenv:Envelope>
但是,你的目标的内容最有可能是HTML的转义,即:在<table>
你看在浏览器的输出中实际上是<table>
,因为标记是内容而不是标记。
我的建议是:
- 看看在浏览器中实际的源代码(右键点击:凡是查看源代码或),当你输出你的狂饮响应,它应该包含比你提供更多的输出。
- 使用xml解析器(或者一个soap解析器,或者任何解析器,不知道这是否实际是rpc)在肥皂信封中查找内容,然后使用xml解析器解析该内容。
这应该够了。但是,我可能是错的。