awesome-dataset-hub
awesome-dataset-hub
说明:倾向于深度学习等数据集,希望可以从网站找到所有的数据集,而不仅仅是某个组织的数据库。最好是可以搜索,如基于数据集类型
搜索(人脸检测、文本分类等),基于数据集文件名
搜索,基于数据集在论文中的别名
搜索。
github
- awesome-public-datasets 可以在其子目录search engine找到更多数据集
竞赛类
竞赛类数据集都强烈推荐
,可按论文,数据集名称进行搜索。
- kaggle 竞赛类的TOP-1
- paperswithcode 论文stoa代码benchmark数据集应有尽有
- 机器之心stoa 国产,速度快
- ChaHub 简洁
- openml 稍逊kaggle
- codalab 稍逊kaggle
搜索类
- pgram 目前似乎不用翻墙,数据集也挺全的,支持用户添加,使用方便。
- google dataset search 名气大,但感觉一般,目前智能搜索结果的还是不如人工收集的。
-
academictorrents 学术型数据集,可用
文件名
搜索,对常用的数据集进行备份,支持用户上传数据集。强烈推荐
- datasetlist UCI机器学习数据库升级版
网页型
- YACVID 至2020仍在维护,比cvdataset, cvonline好一些。
- reddit r/datasets 发贴分享数据集,可搜索,但未必能搜到。