新闻  |   论坛  |   博客  |   在线研讨会
不得不赞!一个国内(可能)最好的海量CV数据集获取网站
计算机视觉工坊 | 2020-09-23 09:40:43    阅读:570   发布文章

在CV等计算机领域中,好的数据,对模型训练至关重要。自己做数据,即昂贵又费时费力;但是,使用现成的数据集,即不好找又不好下载及使用。直到最近,CV君找到一个数据集获取神器 Graviti Open Dataset。

    01    Graviti Open Dataset它是什么?

简单点说,Graviti 是一个提供公开数据集的平台,你可以很方便的搜索你想要的数据,可在线预览样例数据、标注、标签,对于国外的数据不需要“梯子”、可高速免费下载。

下面将对其进行一个详细介绍。

Graviti的公开数据集:

www.graviti.cn/open-datasets

►数据种类多

Graviti 收录了 400 多个高质量 CV 类数据集,覆盖无人驾驶、智慧零售、机器人等多种 AI 应用领域。举两个例子:

无人驾驶类

·  CityScapes (Semantic Understanding of Urban Street Scenes):https://www.graviti.cn/open-datasets/dataset-detail/CityScapes

1600824927133403.jpg


·   BDD100K (A Diverse Driving Dataset for Heterogeneous Multitask Learning):

https://www.graviti.cn/open-datasets/dataset-detail/BDD100K

1600824998536972.jpg

文字识别类

·  MNIST (Handwritten digits):

https://www.graviti.cn/open-datasets/dataset-detail/MNIST

1600825028671674.jpg

·  SVHN (The Street View House Numbers):

https://www.graviti.cn/open-datasets/dataset-detail/SVHN

1600825066405910.jpg

不仅种类多,还方便搜索,可以按应用行业 , 标注类型进行筛选!查找简单操作。

举个例子,查找一个自动驾驶类的数据集,直接在搜索框输入‘auto’。

1600825090788677.jpg

数据集详情页,除了详细的介绍以外,数据概要(包含数据格式、数据量、大小)、发布方标注方也是一应俱全,一目了然。

►数据可视化

除了整合数据集信息以外,在线可视化也是亮点!无需下载直接可以浏览样例数据,标注、标签同样可以轻松在线查看。

1600825137544100.png

甚至,提供了数据分布:

1600825166784492.png

►免费高速下载

除了以上两个优点之外,下载速度应该是许多小伙伴最关注的,特别是在下载一些国外大型数据集的时候,简直是国内小伙伴的梦魇,在 Graviti 获取数据集可以不用找梯子!不用再受网速限制!

只需进入数据集详情页,点击即可获取数据集,期间不用花费任何费用!

1600825206377136.jpg

亲测效果

1600825226946938.jpg

    02    总结

Graviti 数据种类多、在线可视化、下载速度快、免费易获取!

另外,除了托管公开标准的数据集,CV君发现该网站正在开发针对用户的个性化的数据管理服务,包括数据免费托管,数据版本管理,在线可视化!还可以轻松地完成数据的拆分与合并!这对于开发自己数据集的同学无疑是个非常值得期待的功能。

*博客内容为网友个人发布,仅代表博主个人观点,如有侵权请联系工作人员删除。

参与讨论
登录后参与讨论
推荐文章
最近访客