Jsoup从
得到的内容
问题描述:
我需要得到某个<br>
标记的电话号码,该标记始终低于class
firmheader
。Jsoup从<br>得到的内容
<td class='second' valign='top'>
<div class='firmheader'>Police departament</div>
<br><h2 class='subtitle'>Adress</h2>New Jersey <a class='discret' target='_top' title='See NJ departamant' href='/nj/dep'>NJ</a>, Phone: +160923490434</br>
我尝试:
Document doc = Jsoup.connect("my_url").get();
Element element = doc.select("br.h2").first();
没有成功。
答
首先获取最近的外部标签的文本。在你的html片段中是<td>
。 <br>
标签没有结束标签。
String address = doc.select("td.second").text();
现在你得到“警察departament AdressNew新泽西NJ,电话:160923490434”的文字,你需要使用正则表达式为得到“手机”领域。
电话不在任何HTML元素中,你可以使用正则表达式来处理这种情况。 – aydinugur
@uğuraydın最后有一个'',对不起,为tipo –