Node.js&co - 避免混合承诺和事件回调
问题描述:
最近,我一直在试验phantomjs-node
库。我想实现的目的基本上是创建一个动态网页模板,使用phantomjs-node
库“运行”它,最后从渲染页面中提取一些数据。Node.js&co - 避免混合承诺和事件回调
在最简单的设置,解决这个第一次尝试看起来像这样(在下面的例子中,模板仅仅是静态的,但它可能会在原则上包含利用外部库的一些进一步的逻辑等):
var phantom = require('phantom');
var co = require('co');
var sleep = require('system-sleep');
var winston = require('winston');
const logger = new winston.Logger({
level: 'debug',
transports: [new winston.transports.Console({
json: false, timestamp:() => (new Date()).toLocaleString()
})]
});
co(function*() {
logger.info('start');
var instance = yield phantom.create();
try {
const html = `
<!DOCTYPE html>
<html>
<head>
<title>Page title</title>
</head>
<body>
<div id='results'>Page data</div>
</body>
</html>
`;
var page = yield instance.createPage();
yield page.on('onLoadFinished', function(){
logger.info('onLoadFinished');
page.evaluate(function(){
return document.getElementById('results').textContent;
}).then(function(val){
logger.info(`RESULT = ${val}`);
}).catch(function(val){
logger.error(val.message);
});
});
yield page.setContent(html, 'http://localhost');
}catch (e){
logger.error(e.message);
}finally{
instance.exit();
}
logger.info('done');
});
然而,这种失败与输出:
12/18/2017, 2:44:32 PM - info: start
12/18/2017, 2:44:33 PM - info: done
12/18/2017, 2:44:33 PM - info: onLoadFinished
12/18/2017, 2:44:33 PM - error: Phantom process stopped with exit code 0
很可能是因为当page.evaluate
返回的承诺的then
-callback最后调用,主要幻象过程已经退出。
为了“修正”这一点,我使出以下即兴策略(省略了实施例的其余部分下方):
var page = yield instance.createPage();
var resolver;
var P = new Promise(function(resolve, reject){ resolver = resolve; });
yield page.on('onLoadFinished', function(){
logger.info('onLoadFinished');
resolver(page.evaluate(function(){
return document.getElementById('results').textContent;
}));
});
yield page.setContent(html, 'http://localhost');
const val = yield P;
logger.info(`RESULT = ${val}`);
这实质上创建一个新的承诺,这是“外部”与分辨诺言从page.evaluate
返回。然后阻塞,直到所需的结果是准备好了,因此如预期在co
块末尾的yield P
语句的输出:
12/18/2017, 2:53:47 PM - info: start
12/18/2017, 2:53:48 PM - info: onLoadFinished
12/18/2017, 2:53:48 PM - info: RESULT = .....
12/18/2017, 2:53:48 PM - info: done
尽管这似乎工作,感觉相当“哈克”(例如抛出异常在调用resolver
之前的回调将不会在try/catch
主块中检测到),所以我想知道为了将控制从onLoadFinished
回调“转移”回到由co
管理的领域,更简洁的方法是什么?
答
- 请勿使用
co
+生成器函数。async
/await
在这里。 - 是的,您应该将所有一次触发(最多)的事件回调转换为承诺。
- 不,永远不要创造那样的承诺,并“在外部解决它们”。只需将解析它们的东西放入promise构造函数中即可。
(async function() {
logger.info('start');
var instance = await phantom.create();
try {
const html = `…`;
const page = await instance.createPage();
await new Promise((resolve, reject) => {
page.on('loadFinished', resolve);
page.on('resourceError', reject); // or something like that?
page.setContent(html, 'http://localhost'); // this doesn't appear to return a promise
})
logger.info('onLoadFinished');
try { // this extra inner try looks superfluous
const val = await page.evaluate(function(){
return document.getElementById('results').textContent;
});
logger.info(`RESULT = ${val}`);
} catch(e) {
logger.error(e.message);
}
} catch(e) {
logger.error(e.message);
} finally {
instance.exit();
}
logger.info('done');
}());
感谢您的详细评论!是否需要在'Promise'构造函数中嵌套另一个'async'函数?据我所知,'page.on'调用是异步的(或原则上返回另一个承诺),所以如果确实如此,原则上可能会发生'page.setContent'执行并在loadFinished'回调之前完成组? – ewcz
@ewcz编号[永远不要将'异步函数'传递给'new Promise'构造函数](https://stackoverflow.com/a/43083793/1048572)! 'page.on'似乎没有返回一个承诺,这就是为什么我们要包装它(promisify它)。此外,*回调*是异步的,这意味着[它总是在'setContent'调用之后执行](https://stackoverflow.com/a/31099819/1048572)(也是因为它是由它造成的,所以它不会发生之前)。 – Bergi
据我所知,回调本身是启动与内容被设置,我的意思,而不是通过'page.on'分配/注册回调操作 - 据我了解[源](https:// github。com/amir20/phantomjs-node/blob/master/src/page.js)基本上调用[execute](https://github.com/amir20/phantomjs-node/blob/master/src/phantom.js )函数返回一个promise(如果我在控制台输出'page.on'的返回值,我得到'Promise {}') – ewcz