主题:中国信通院:AI对高质量数据集的需求成为数据要素发展核心驱动力
中国青年报客户端讯(中青报·中青网记者 贾骥业)在11月28日举行的2025数据要素发展大会上,《数据要素发展报告(2025年)》正式发布。中国信息通信研究院云计算与大数据研究所副总工程师闫树在对报告进行解读时指出,AI(人工智能)对高质量数据集的需求已经成为数据要素发展核心驱动力。高质量数据集,是指经过采集、加工等数据处理,可直接用于开发和训练人工智能模型,能有效提升模型性能的数据的集合。“人工智能的发展高度依赖高质量数据集。”闫树提到,除了常见的结构化数据集之外,随着多模态大模型与具身智能技术的快速发展,多模态数据集、具身智能数据集、深度推理思维链数据集等多样化数据集需求旺盛。以具身智能数据集为例,闫树介绍,具身智能数据集可以增强机器人在多样化环境和任务中的适应性和决策智能,实现更高级别的自动化和智能化。“比如在训练机器人的过程中,一开始可能需要对机器人手部肌肉的每一个自由度进行建模,但后期让机器人从学会叠毛巾延展到学会叠衣服,其实是靠数据进行迭代训练来实现的。”闫树说。2024年年底,国家发展改革委等部门印发的《关于促进数据产业高质量发展的指导意见》提到,面向人工智能发展,提升数据采集、治理、应用的智能化水平;支持企业面向人工智能应用创新,开发高质量数据集,大力发展“数据即服务”“知识即服务”“模型即服务”等新业态。如今,各行各业都在积极探索,用高质量数据集赋能实际生产运营。比如,在医疗卫生领域,以AI为基础的辅助诊疗、辅助决策就大大提高了患者的就诊效率。国家卫生健康委办公厅等部门印发的《关于促进和规范“人工智能+医疗卫生”应用发展的实施意见》也提出目标:到2027年,建立一批卫生健康行业高质量数据集和可信数据空间,形成一批临床专病专科垂直大模型和智能体应用。来源:中国青年报客户端
回帖(5):全部回帖(5)»