(资料图片仅供参考)

湖北日报讯 (记者张真真、通讯员张珊妮)智能机器人反复查看各种各样猫的图片,“学习”到猫的各种特征,慢慢地,智能机器人通过摄像头“看到”猫,就能准确识别,这就是通俗理解的“机器学习”过程。

9月30日,武汉人工智能研究院在光谷发布全球最大中文多模态训练数据集——江城太素(TaiSu),并正式对外开源开放。

武汉人工智能研究院院长王金桥介绍,开发者应用该数据集,不用从“学习”猫等一件件基础图片的采集和标注开始,而是可以直接利用这个大规模数据集来训练,让机器迅速变“聪明”,开发周期将从原来的6至8个月缩短为一至两周。

该数据集包含了自然界百万级的实体、场景和概念,比如桌子、椅子、猫、狗等等,包含了1.66亿张图片和2.19亿条中文描述,是当前规模最大的开源中文多模态数据集,也是业内唯一为图像提供多个中文文本描述的数据集。公开资料显示,全球范围内,该数据集比谷歌、雅虎等的公开数据集规模更大。

据介绍,该数据集主要通过互联网进行大规模图文数据采集,然后数据清洗去重、基于图文模型的数据质量评价、基于数据和模型的协同优化算法等,依托武汉人工智能计算中心算力,历时两年完成。

2021年,中科院自动化所在世界人工智能大会上发布的跨模态通用人工智能平台“紫东太初”落户光谷,为我国人工智能的“混沌初开”打造多模态通用模型。此次武汉人工智能研究院与中科院自动化所联合研发的多模态数据集,之所以取名“江城太素”,王金桥表示,太素为宇宙中最基本的元素,这里借指数据集为人工智能大模型训练的核心要素,江城则是指在武汉研发、发布。

标签: 人工智能 全球最大 智能机器人