从NHL.com上刮去数据
问题描述:
我试图抓住http://www.nhl.com/ice/standings.htm?season=20112012&type=LEA的表格,并将其存储到我的服务器上的MySQL数据库中。使用下面,我能够完全复制网站,但我不知道如何提取该表。代码如下:从NHL.com上刮去数据
任何想法?
function get_data($url)
{
$ch = curl_init();
$timeout = 5;
curl_setopt($ch,CURLOPT_URL,$url);
curl_setopt($ch,CURLOPT_RETURNTRANSFER,1);
curl_setopt($ch,CURLOPT_CONNECTTIMEOUT,$timeout);
$data = curl_exec($ch);
curl_close($ch);
return $data;
}
$returned_content = get_data('http://www.nhl.com/ice/standings.htm?season=20112012&type=LEA');
echo $returned_content;
UPDATE:
$html = file_get_html('http://www.nhl.com/ice/standings.htm?season=20112012&type=LEA');
$e = $html->find("table", 2);
echo($e);
此代码的工作,职位像我需要一个表。但是现在我很好奇我会如何去除所有不必要的链接/格式并将其保存到数据库中?
答
工作在谷歌电子表格,我所有的importhtml
功能nhl.com今年不工作。我认为他们是(出于某种原因)阻止用户抓取他们的数据。
对不起,这是PHP。 – jsquadrilla
这可能是针对他们的服务条款。公司为这些数据提供Web服务和API提供了大量资金。 –