开源的本质在于开放能激发群体智慧的资源。
11月21日,2025世界计算大会同期活动“RISC-V技术与行业应用”在长沙举行。中国科学院院士王怀民做了主题为《开源的本质》的主旨报告。
王怀民表示,从文字符号、文献书籍到人类工业文明,人类文明发展史就是一部开源开放的历史。开源软件的起源来自于自由与商业的博弈。自由软件强调对创新者创新自由的保护,但背负了伤害创新者创新利益的质疑。商业软件强调对创业者创新利益的保护,但背负破坏创新者创新自由的骂名。开源软件则以“开放源码”和“自由传播”为基础,融入商业运作模式,实现了对创新自由和创业利益的保护和平衡。
开源软件的本意是开放软件源代码,造就充满创新活力的软件生态。全球累计开源贡献超过35亿次(代码提交、报告缺陷、代码审查等),开发语言超过700种。仅GitHub社区2024年新增代码仓库1.08 亿个,新增代码贡献10亿次,总数据量达50TB。开源35年的源代码文明与人类5000年文字文明的数据量相当。(Google统计:全球总共约有1.3亿册藏书,数据量约23TB)。
开源,即打破处理器生态垄断的尝试。过去半个世纪,曾出现过几十种指令集,但都属于公司私有。如今全世界仅剩x86和ARM两种主流指令集,分别被Intel和ARM两家公司高度垄断。2010 年RISC-V项目在加州大学伯克利分校启动,更进一步推动基于开放指令集的软件源代码可以开放,开启硬件开源的新篇章。
在这个过程中,中国也开展了相关研究。比如中国科学院计算所,于2019年发起开源高性能RISC-V处理器核“香山”项目,在国家的支持下做RISC-V中高端芯片的设计,包括工具,还有之后相关IP的开源开放,形成了香山系列的芯片。他们愿景是,建立一个像Linux那样的开源RISC-V核主线,既能被工业界广泛应用,又能支持学术界试验创新想法。当然这是按照知识产权的形式予以保护的,传播的越广,计算所获得的声誉就会越广。在今天的世界,声誉本身也具有市场价值和经济价值。这个工作的推进十分有效,中国科学院计算所开源了以后,最近也进行了迭代,得到了北京市、科技部、工信部的大力支持。王怀民认为,这就是通过国家科技创新投入,形成了声誉之后吸引了社会资本的投入,构建的一个硬件领域的创新环境。在这个基础上,使得我们国家用RISC-V的指令集和相关的开源芯片,能够更好的走向垂类应用,这样的态势已经在形成。
因此,各个层次的开源软件主动适配RISC-V,已形成“可用”的RISC-V软件生态,进一步向“好用”迈进。
开源大模型方面,开源大模型从当时深度神经网络的开发框架的开源开始,在这个基础的支持上,一系列深度神经网络产生,使得基于神经网络的建模模式得以在各个领域应用。不仅在大语言领域,而且在其他模式识别领域都取得了巨大的成功。
开源的模式也在发展。有的开放结构权重,有的开放数据,有的开放训练代码,有的开放推理代码,有的开放微调代码或开放APP服务等不同层次的开放。现在的开源大模型,主要是开放稳定结构的神经网络权重参数。
有的专家认为,源代码开放权重就像把油浓缩成了浓缩油,把它开放出来是很危险的。也有专家认为,开放才是历史正确的一边。王怀民则认为,开源的本质在于开放能激发群体智慧的资源。智能时代的开源当属开源大模型。当前大模型仅公开权重的“伪开源”现象,要构建真正开放协同的创新生态。没有绝对的开源,没有绝对的闭源。世界不要唯我独尊,世界需要你我出征。
2025世界计算大会由湖南省人民政府主办,湖南省工业和信息化厅、长沙市人民政府、湖南大学、中国电子信息产业发展研究院、全球计算联盟承办。本次大会正式发布“2025全球计算十大创新成就”和“2026全球计算十大发展趋势”,总结2025全球计算产业创新成就,前瞻2026计算技术迭代方向。大会期间举办“1+5+5+1”共12场主题活动,包括1场高规格的开幕式暨主题报告会、5场聚焦计算核心前沿的专题活动、5场技术赋能行业发展的同期活动和1场创新成果展示。
自2019年起,世界计算大会已成功举办6届。经过6年的沉淀,大会已经成为计算领域展示科技创新成果、推动产业融合发展、促进国际交流合作的高端化、国际化、专业化平台,为推动数字经济和计算产业高质量发展提供了重要支撑。
采写:崔亮亮
编辑:亮亮
指导:辛文
回帖(3):
