从NHL.com上刮去数据

问题描述：

我试图抓住http://www.nhl.com/ice/standings.htm?season=20112012&type=LEA的表格，并将其存储到我的服务器上的MySQL数据库中。使用下面，我能够完全复制网站，但我不知道如何提取该表。代码如下：从NHL.com上刮去数据

任何想法？

function get_data($url) 
{ 
    $ch = curl_init(); 
    $timeout = 5; 
    curl_setopt($ch,CURLOPT_URL,$url); 
    curl_setopt($ch,CURLOPT_RETURNTRANSFER,1); 
    curl_setopt($ch,CURLOPT_CONNECTTIMEOUT,$timeout); 
    $data = curl_exec($ch); 
    curl_close($ch); 
    return $data; 
} 

$returned_content = get_data('http://www.nhl.com/ice/standings.htm?season=20112012&type=LEA'); 

echo $returned_content;

UPDATE：

$html = file_get_html('http://www.nhl.com/ice/standings.htm?season=20112012&type=LEA'); 
    $e = $html->find("table", 2); 

    echo($e);

此代码的工作，职位像我需要一个表。但是现在我很好奇我会如何去除所有不必要的链接/格式并将其保存到数据库中？

对不起，这是PHP。 – jsquadrilla

这可能是针对他们的服务条款。公司为这些数据提供Web服务和API提供了大量资金。 –

答

尝试使用这个库 http://simplehtmldom.sourceforge.net/

试过了。就像我用cURL做的那样，没有任何地方靠近。这很难，因为我无法找到一个体面的教程来开始使用，即使我想要做的事情是先进的。 – jsquadrilla

答

工作在谷歌电子表格，我所有的importhtml功能nhl.com今年不工作。我认为他们是（出于某种原因）阻止用户抓取他们的数据。

从NHL.com上刮去数据

相关推荐