今天去了一趟腾讯 Ima 的线下活动。
听了六个人的分享,有能源经济学家翟永平、百宸律所的龚焕律师、海南省统计局的符策文;还有北京交通大学的郑涛教授、屠龙之术主播庄明浩,以及 Ima知识号的产品经理Cathy。
然后,发现他们在讲同一件事:自己攒了十年、二十年、四十年的专业知识,正在脱离自己的大脑,独立活着。
因为这些人在AI出现之前,就已经在做知识积累这件事了,而且做了很久很久。
比如:翟永平,1978年考上清华热能工程系,后来去法国读完硕博,在非洲开发银行和亚洲开发银行一共干了27年。
写文章写了40多年,最早是纸质校刊,后来写新浪博客,再后来开了个公众号,叫「国际能源小数据」,写了十年,快五万订阅了。
庄明浩做了个播客叫「屠龙之术」,100多期,专门追踪AI行业的动态。
他每两三个月手搓一个几十页甚至近百页的PPT,把当期AI行业的技术、资本、竞争、融资全部整理一遍,朋友说听他播客像听网课,听之前需要沐浴更衣。
龚焕讲了一个很具体的痛点。
律师的经验全装在自己脑子里,人走了,经验就带走了。律所作为一个组织,一直想把这些东西沉淀下来,一直没找到好办法。
符策文,2014年就在海南省统计局开了微信公众号做数据服务。
十几年了,全省的统计数据、法律法规、实务指南一直在往外推,一直在琢磨怎么让数据真正被人用起来。
郑涛试过公众号、试过视频号,通宵写出来的文章发出去,阅读量个位数,一直在找一种适合教师身份的知识传播方式,碰壁好几年了。
你发现没有,这些人在遇到AI之前,状态很像,燃料已经攒了很久,缺一个更好的炉子。
......
那如果有了炉子,把知识倒进去之后会发生什么?Ima 做的就是这个事,变化比你想象的来得快。
符策文把知识分成三类:
官方统计数据、法律法规条文、统计工作实务指南;分好类灌进去之后,原来要打12345热线问的事,现在对着知识库打一句话就有答案,还带着原文出处。
一线统计员的感受最直接。
过去出差调研,要么打印一沓纸,要么往手机里塞一堆文档,在手机屏幕上翻表格找数据,非常考验眼力和耐心。
现在呢?一部联网的手机加一个知识库,全省的统计数据随你调用;写一个分析提纲,现在十几秒出框架。
他说了一句话,我觉得特别准确:数据的真正价值和发布出去关系不大,得被用上。
翟永平的变化是另一种。
他每天的工作流变成了固定的三问。早上打开Nature、Science或者顶级能源平台,找到最新的研究,扔进知识库。然后开始问:
一,库里已经有一千多篇文章了,这篇新东西,到底新在哪?二,这个成果对能源行业来说,意味着什么?第三,对普通人意味着什么?
他说,公众号永远回答不了第一个问题,知识库可以。
因为库里堆了一千多篇文章,新研究一进来,AI能把它放在已有的坐标系里定位,跟以前的工作比一比,亮点到底在哪,它说得出来。
还有一层变化,是语言。
他日常工作涉及中英法日四种语言。知识库直接把这面墙推倒了。
他说了个事,法国人在搞大模型,很少有人知道。法国人用核电这种低碳电力支持数据中心,这个方向上有值得参考的实践。
这些信息过去被语言挡着,现在直接穿透了。
他做了十年的公众号,订阅虽多,但一年知识号给他带来的互动质量,超过了经营十年的公众号。
郑涛的用法偏教学。
他主讲数字电子技术,这门课工科学生都要修;学起来不容易,因为不光有课本知识,还要面对示波器、频谱分析仪这些贵重设备,平时只能去实验室排队用。
他用copilot基于知识库里的教案,开发了一个基于网页的可交互模拟实验。
这个细节可以单独拎出来说一下。
它不仅能正确运行,还可以把输入输出结果,可视化展示出来,背后依赖知识库里,那些经过确认的教学资料,跟通用大模型的数据没关系。
教案、竞赛资料、嵌入式开发手册、实验指南全在里面,学生用他的知识库像查字典。
他布置作业的时候跟学生说,你可以用AI,看知识库里的文章能溯源,知道答案的出处在哪,给我说清楚就好。
百宸律所的变化,是最结构化的。
一年下来,龚焕自己建了20多个skill,覆盖了起诉状、答辩状、律师函、法律意见书这些核心交付文书。
操作流程不复杂:把项目信息放进共享知识库,把团队成员拉进来,调用对应的skill自动生成文书。
他给了一个数字:90%。
律所文书自动化的比例做到了90%;或者说,在整个流程中,90%的步骤是自动化完成的。
这个数字是什么意思呢?
律师不用再花时间翻法条、翻案例、改格式了,从四号字改到五号字,行间距从1.5改到24磅,这些事不再需要人来做,律师的精力可以放在更有价值的地方。
......
把知识扔进知识库,这件事不难;接下来发生的事,连创造者自己都没预料到,因为,知识开始自己跑了。
龚焕写了一个skill,名字挺有意思,叫「自我进化系统」。
启动之后,agent会全网去搜跟这个skill相关的方法论、工具、技术趋势、行业文献。然后,列一张表告诉你:
你现在的skill跟行业前沿差多少,差在哪几个点上,哪些地方可以改进;你挑几个改进项,它自己重新生成代码,自己跑出新版本。
他举了一个例子。
合同起草的skill,上线三四天,已经迭代到第十个版本了。大部分skill现在都是自动更新的。
他说了一句话,在场听着挺扎心的。他说,进化了四五轮之后,我已经没办法给这个skill提出更好的建议了。这句话的意思是,知识进化速度,已经超过了创造者本人。
还有一个变化,更安静,但也更深。
他说自己已经很长时间没有「打开」过知识库了;是每天都在用,用的方式变了。
他们律所所有的skill里面都写了一条强制规则:必须先检索知识库,再输出结果。
以前人在打开、在翻、在找;现在agent在调用;知识库从一个给人查的产品,变成了agent跑任务时必须经过的底座。
翟永平的copilot也发生了类似的事。
他把40多年写过的文章、博客、论文、会议发言,全部灌了进去,让copilot好好学,他给copilot起了个名字,说你先得懂我。
结果copilot真的懂了,他说了一件事,40年前的事,谁是谁,哪段历史,他自己都记不清楚了,copilot全知道,他自己都不知道的信息,copilot能从那些旧资料里翻出来。
他现在用copilot写书,40多年的经历、背景确认完之后,copilot出大纲,他确认章节,然后一节一节写,一天一节。
他说了一句话,我印象很深,这个copilot写出来的英语句子,我都能听出来是我的风格,它记忆力比我好。
Cathy在分享里给了一个数字:
1.4亿。这个数字是知识号的内容被AI调用的次数,我觉得数字的含义,比它表面看起来要重得多。
1.4亿次调用,意味着这些知识已经进入了AI的每一次回答、agent的每一个任务、用户做决策的每一个瞬间。
知识一旦被倒进容器,它就有了自己的生命周期,被调用,被组合,被进化,甚至进化到创造者自己都跟不上的地步。
......
看到这,估计又有人该焦虑了。心想,知识都自己跑了,那人还干什么?
庄明浩的分享,刚好站在所有人表达的反面。
他把做PPT的过程拆成四步:搜集、整理、加工、制作。前三步,AI已经深度参与了。
他每个月在IMA上收藏几十张可视化图表、几十份PDF报告,AI帮他做翻译、做摘要、做框架整理。
他说,IMA上PDF的对照翻译是他用得最多的功能,不改格式,免费,翻译质量稳定,这件事现在

