MAHNOB Databases 之 HCI-Tagging Databases 介绍
1、数据获取方式
- 打开官网,MAHNOB Databases会有三种类型的数据,可根据自己需求选择,本文选择的是HCI-Tagging Databases数据集;
- 网页的右上角申请账号,在左侧下载 EULA协议并打印签名扫描上传,注意细节:一定一定一定要使用学校的邮箱(stu;edu之类的邮箱);填写协议使用全英文(名字用拼音,Affiliation:学校的英文名,address:学校的地址);保持EULA和申请账号的信息一致;
- 大概1-2天就会发邮件通知你账号授权成功(如下图),就可以自己去登陆下载数据啦。
2、补充材料
在网页的Supplementary material模块可以下载相关的数据介绍材料:
4、背景介绍
使用相关,可靠和区分性标签来表征多媒体内容对于多媒体信息检索至关重要。 随着数字多媒体内容的快速扩展,需要现有显式标记(explicit tagging)的替代方法来丰富标记内容。目前,社交媒体网站鼓励用户标记他们的内容。但是,标记多媒体内容时用户的意图并不总是与信息检索目标匹配。 用户定义标签的很大一部分是通过提高用户在在线社区中的知名度和声誉来激发的,或者是基于个人和利己主义的判断。 而且,用户不会按照相同的标准评估媒体内容。 有些人可能会用文字标记多媒体内容以表达自己的情感,而另一些人可能会使用标记来描述内容。 例如,一张图片会根据图片中的对象,通过其拍摄图片的相机或用户看到该图片时的情感接收不同的标签。
隐式标记(implicit tagging)的原理是通过自动查找从观察者的自然反应得出的多媒体内容的描述性标记来代替用户输入。 例如,某人表现出的情绪。 上图显示了带有显式标记的这种区别的概述。
为了促进对多媒体标签这一新领域的研究,我们建立了一个用户对多媒体内容反应的数据库。
5、数据库内容
向30位被试显示了电影和图片的片段,同时使用6个摄像机,头戴式麦克风,视线(眼球)跟踪器以及测量ECG(心电图),EEG**(32个通道**),呼吸幅度和皮肤温度的生理传感器对其进行监控。
每个实验由两部分组成。在第一部分中,电影片段被展示出来,参与者被要求在每个片段之后标注自己的情感状态,如右边所示。
在实验的第二部分,图像或视频片段连同标签一起出现在屏幕的底部。在某些情况下,标记正确地描述了有关情况的某些内容。但是,在其他情况下,标记实际上并不适用于媒体项。下面是两个例子,分别用红点和线表示注视点的位置和移动,覆盖了眼球跟踪测量。
在每个项目之后,参与者被要求按下一个绿色按钮,如果他们同意标签适用于媒体项目,或者按下一个红色按钮,如果不同意。
在整个实验过程中,同时记录声音、视频、注视数据和生理数据(audio, video, gaze data and physiological data ),传感器之间精确同步。该数据库对研究人员免费开放。