通过Task Scheduler定时运行调用cURL的PHP脚本
PHP本身没有定时自动执行的功能,也不支持多线程。但是结合Task Scheduler和cURL,就可以弥补PHP的上述两个缺陷,同时还可以脱离Apache服务器环境,在任意路径下运行PHP脚本。
知识准备
cURL的学习与应用:
http://www.cnblogs.com/phphuaibei/archive/2011/09/29/2195838.html
Windows 7中使用Task Scheduler:
http://www.cnblogs.com/tylerdonet/archive/2011/05/25/2057227.html 中的“添加Windows任务”部分
How to use Windows Task Scheduler:
http://www.iopus.com/guides/winscheduler.htm
调用cURL多程序抓取网页的PHP脚本
batch.php
<?php
$urls = array(
'http://www.baidu.com',
'http://www.****.net',
'http://www.google.com.hk'
);
// 初始化多线程
$mh = curl_multi_init();
// 向多线程中添加每个单独的cURL
$conn = array();
foreach ($urls as $key => $url) {
$conn[$key]= curl_init($url);
curl_setopt($conn[$key],CURLOPT_HEADER, 0);
curl_setopt($conn[$key],CURLOPT_RETURNTRANSFER, 0);
curl_multi_add_handle($mh,$conn[$key]);
}
// 执行cURL多线程
do {
$mrc= curl_multi_exec($mh, $active);
}
while ($mrc == CURLM_CALL_MULTI_PERFORM);
while ($active && $mrc == CURLM_OK){
if(curl_multi_select($mh) != -1) {
do{
$mrc= curl_multi_exec($mh, $active);
}
while($mrc == CURLM_CALL_MULTI_PERFORM);
}
}
// 释放多线程中的每个cURL线程
foreach ($urls as $key => $url) {
curl_error($conn[$key]);
curl_multi_remove_handle($mh,$conn[$key]);
curl_close($conn[$key]);
}
// 关闭多线程
curl_multi_close($mh);
?>
需要说明的是,cURL在PHP中的多线程处理其实并不是真正的多线程,而是用单线程批处理模拟的多线程效果。
设置环境变量
为了方便调用php.exe,需要在环境变量的系统变量Path中添加php.exe所在目录的路径,如下图所示:
设置Windows Task Scheduler
Windows 7环境下,启动Task Scheduler(任务计划程序)的方式有两种,分别是:
1.控制面板→管理工具→任务计划程序;
2.开始→运行→输入“任务计划程序”或者“scheduled task”,回车。
设置计划任务来自动调用PHP脚本的步骤如下:
1.点击“创建基本任务”,进入导航
2.第一步,输入计划任务的名称和描述
3.设置任务开始的时间
4.设置任务执行的具体操作
前述调用cURL的PHP脚本放在E盘根目录下,脱离了Apache服务器环境。
此处填写的程序(或脚本)和参数需要再命令行下测试通过方才有效。
5.完成后打开属性对话框,在“触发器”中点击“编辑”,设置自动重复执行的间隔
以上就是设置任务计划程序的过程,之后每隔5分钟会弹出一个php.exe的DOS窗口,则设置成功。