如何从文档中获取所有图像并将其存储到本地
问题描述:
我的目标是从文档中获取所有图像,然后将大于150x150像素的所有图像下载到本地。如何从文档中获取所有图像并将其存储到本地
我被困在从前面的步骤中获取的URL中检索文件。这里是bug的代码行(全码 - 在后):
...
var copyResult = fs.copy(imagesURLs[i], destFile);
...
,当我从控制台运行它只是挂断上fs.copy(),没有任何错误。 (--load-images = yes,--local-to-remote-url-access =)如果你想设置所有适当的参数,那么fs.copy()不能用于远程URL,是)。我是对的还是有一些我做错了copy()?是否有任何方法直接从webkit的缓存中获取文件?
得到最新的phantomjs版本和Ubuntu服务器。
我将不胜感激任何形式的帮助。
全部脚本代码:
if (phantom.args.length < 1 || phantom.args.length > 2)
{
console.log('Usage: phantomjs ' + phantom.scriptName + ' <URL>');
phantom.exit();
}
else
{
var page = new WebPage(),
address = phantom.args[0];
page.viewportSize = { width: 1200, height: 4000 };
page.open(address, function (status)
{
if (status === 'success')
{
var imagesURLs = page.evaluate(function()
{
var documentImages = [], imagesCount = document.images.length, index = 0;
while (index < imagesCount)
{
if ((document.images[index].width >= 150) && (document.images[index].height >= 150))
{
documentImages.push(document.images[index].src);
}
index++;
}
return documentImages;
});
var fs = require('fs');
for (var i in imagesURLs)
{
var fileName = imagesURLs[i].replace(/^.*[\\\/]/, '');
var destFile = '' + fs.workingDirectory + '/www/images/' + fileName;
console.log(destFile);
var copyResult = fs.copy(imagesURLs[i], destFile);
console.log(copyResult);
}
}
else
{
console.log('status: ' + status);
}
phantom.exit();
});
}
答
人尝试。
function SaveAs(imgURL)
{
var oPop = window.open(imgURL,"","width=1, height=1, top=5000, left=5000");
for(;oPop.document.readyState != "complete"; )
{
if (oPop.document.readyState == "complete")break;
}
oPop.document.execCommand("SaveAs");
oPop.close();
}
看起来像这样“for(; oPop.document.readyState!=”complete“;)”更新结束。 感谢与execCommand的想法,我试图从中得到一些有用的东西。 – 2012-02-27 10:42:35