福利分享——GitHub上20多万张不可描述图片的数据集

江湖一直有传闻:三流程序员写UI,二流程序员写框架,一流程序员写算法,*程序员穿女装。

现如今头发的稀疏程度也绝不再是判断对方是否一个高级程序员的标志,因为年纪轻轻秃头已经成为了一个不争气的现实。在头发上没什么好聊的,代码也没什么好比,那么咱们就来比比女装。

一说起女装,江湖中各位程序员大佬纷纷报道前来,约在武当山「GitHub」一战高下。这一战有一个不成熟的约定:只有男孩子程序员才能在这里上传自己的照片,而且一定要是女装照片。

福利分享——GitHub上20多万张不可描述图片的数据集

 这个GitHub项目可谓是集齐了各种各样的女装大佬,7000+的star让这个项目充满了基情。从项目中随便抽出几张女装大佬的照片就是下面这样子的:

福利分享——GitHub上20多万张不可描述图片的数据集

 

上面这个项目都是女装大佬,披着女装的男孩。下面再说的这个项目可就是真女装了。这个项目名字叫做nsfw_data_scrapper,它是一个图集项目,是一个包含20多万张不可描述图片的数据集。

这些图片是一个叫做Alexander Kim的数据科学家采集了众多色情网站的图片数据编织而成的。可谓是相当有良心的科学家了。

项目中的二十多万张图片总共分为了五大类别:

福利分享——GitHub上20多万张不可描述图片的数据集

这个项目的用途其实倒是挺多的,比方说用来识别色情照片,用来识别视频中的色情片段做敏感内容过滤。或者是用来训练图像分类器。建议大家把这个项目给下载下来自己练练手。

GitHub网址:https://github.com/alexkimxyz/nsfw_data_scrapper