AAAI 2017论文简析:利用可拍照移动设备感知空气质量---Crowdsensing Air Quality with Camera-enabled Mobile Devices
论文思想
- 利用群智感知的思想通过可拍照的移动设备去监测环境空气质量
(即将智能移动设备转变为空气质量传感器,从而提供一种简单、便携式且低成本的工具,将普通用户转变为空气质量感官网络);
主要组成部分:
- ①Status Quo(设备拍摄的环境现状图)、
- ②Adaptive Transmission
Map(ATM—自适应传输图像分析)、 - ③Haze-free(无雾图)与Haze Impact(雾度分量)、
- ④Deep Neural Network Air Quality Estimator(DNA—深度神经网络空气质量估算器)、
- ⑤PSI(污染物标准指数);
方法思路:
- 设计一款移动应用程序AirTick—可以将任何支持摄像头的智能移动设备“转换为”空气质量传感器,实现对空气污染的感知及量化:
- 打开AirTick应用并拍摄周围环境的照片,然后ATM对照片进行分析,从图像中提取Haze Impact并生成无雾图(Haze-free),接着将该分量传递到DNA中为用户生成估算的PSI值。系统框架如下图所示:
论文背景
-
已有空气质量监测方法过于复杂昂贵或监测设备笨重,无法被大众有效使用
流行的空气质量监测方法包括锥形元素振荡微量天平(Ruppecht,Meyer和Patashnick 1992),黑烟测量(Muir和Laxen 1995)和基于过滤的重量分析法(Hauck等人2004)。然而对于大多数人来说,这些方法要么太昂贵,太复杂,要么太笨重。需要一种简单,便携式,可扩展且低成本的方法来监视空气污染,以支持对空气质量的感知,并补充本地空气质量数据的覆盖范围。
论文工作
-
如何在不知道图像的“无雾度”版本的情况下从单个图像中提取雾度?
-
如何准确地将从图像中提取的雾度转换为PSI值?
解决方法
从照片中提取模糊度:
- 可通过“大气散射模型”对模糊图像进行建模,得到以下公式:
- 其中I(w,h)是观察到的模糊图像(w和h分别表示图像的宽度和高度,以像素为单位);ε是大气衰减系数; L∞是大气光; d(w,h)是场景深度; R(w,h)是场景辐射度(又称无雾图像),即:
因为 是用于系统内数据传输的,所以由上式(1)可得公式(2), - 这里通过计算,我发现公式(2)中的β值应该为负的,作者应该没注意到打错了:
- 由于可以使用经验技术确定L∞,因此为了估计给定图像的模糊度,需要同时求解两个未知数d(w,h)和R(w,h)。仅用一张环境照片,就没有雾霾笼罩的地方的真实影像,因此,利用ATM方法将图像划分为许多小的局部窗口,并利用场景辐射在局部窗口内近似恒定的假设。通过找到可将图像雾度降低到预定水平的图像透射图和辐射度值,ATM可以量化给定图像中的雾度。感觉与何恺明博士提出的暗通道先验DCP去雾算法方法相似。
- 再根据(Levin,Lischinski和Weiss 2008)的原理,可以通过最小化以下目标函数来找到d(w,h)和R(w,h):
这里我没怎么看懂,去查看Levin08年写的论文也看不太懂。
将提取的模糊度转换为PSI值
- 这里作者是将提取出来的模糊度信息传递给DNA,以学习给定的模糊度矩阵与PSI值间的相关联。DNA是基于玻尔兹曼机设计的,DNA的学习方式是“专注于深层多层BM,每一层都捕获下一层中隐藏节点的活动之间的相关性,用作训练更高层次的数据。DNA框架如下图所示:
- DNA是一个对称耦合的随机二元节点的神经网络,它包含一组D个可见节点v∈{0,1} D 和一组P个隐藏节点h∈{0,1} P。对于BM给定状态{v,h}的有效性(能量函数)定义为:
其中θ= {L,J,W}是需要训练的模型参数, L,J和W分别对应于可见到可见,隐藏到隐藏和可见到隐藏的对称交互项。
用户心理上的激励
- 除了基于图像生成有用的估计PSI值,在AirTick的用户界面设计中还注入了心理激励功能,Priming(指的是一种内隐记忆效应,即一种知觉刺激会影响人们对另一种刺激的反应)。用户使用AirTick拍摄环境照片后,将从图像中提取的雾度图像和去除雾度的图像显示在拍摄照片的旁边,通过这种方式,该应用程序可为用户提供有关其周围环境中雾霾严重程度的视觉反馈。以此,可提高用户对环境保护的意识以及激励用户使用我们的AirTick程序。
- AirTick的ATM模块对于输入的数据,可生成雾度分量图(4.b)、图(5.b)及去除雾度分量的图像(4.c)、(5.c)输出,如下图所示:
作者将这两种类型的输出作为AirTick用户界面的一部分注入,如下图所示:
- 数据集
- 从网络在线资源中抓取了2014年至2016年在新加坡拍摄的1000张照片,作者使用照片文件的创建日期作为拍摄日期。在这些照片中,500张是在白天拍摄的,500张是在夜间拍摄的。所选的夜间照片是包括可见光源(例如,路灯,车辆前灯)的照片。确保数据集中包含的照片是在2014年4月1日之后拍摄的,因为PSI值是在该日期之前计算的。根据这些照片的创建日期,再从NEA网站的历史PSI数据中获得了相应的PSI值。通过这种方式,已经使用的照片和相应的PSI值(被视为真实数据)构建了数据集。通过数据集的测试训练,AirTick在白天时应用的准确度达到87%,而在晚上时应用的准确度为75%。
总结
- 这篇论文主要的话就是介绍了一款由AI技术提供支持的便捷、可扩展的空气质量监测工具,AirTick适合提高公众对空气质量的重视意识,可促进群众作出更多对环境负责任和可持续发展的行为。
- 通过阅读这篇文章主要了解到模糊图像上处理的思路”暗通道先验“的方法以及在群智感知应用上”激励机制“的重要性,文中通过处理前后模糊图像改进优化变成张无雾图给用户视觉上反馈,更好的激励用户继续使用程序。
补充
-
大气散射模型与暗通道先验方法
①大气散射模型如下图所示:
阳光在物体表面形成反射光 J(x),反射光在穿过雾霾的过程发生散射,只有部分能量 J(x)t(x) 能到达摄像头。与此同时,阳光也在悬浮颗粒表面散射形成大气光 α 被摄像头接收。因此,摄像头中的成像 I(x) 可由两部分组成,透射的物体亮度 J(x)t(x) 和散射的大气光照 α(1-t(x)),其中,t(x) 是媒介透射率(medium transmission)顾名思义表示能顺利透过雾霾到达摄像头的比率。因此,透射率跟物体与摄像头距离 d(x) 成反比,离摄像头越远的物体受雾霾影响更大。当距离 d(x) 趋于无穷大时,透射率 t(x) 趋于零,则有下列公式:
②暗通道去雾霾原理:(截图源于博客)