文|数智前线 赵艳秋
DeepSeek带动的新一轮AI大潮中,国内政务市场表现活跃,每周都有新进展。
从事政务应用开发的资深人士杨女士,今年开年以来,几乎六日无休。她所在的应用开发企业,已全面接入DeepSeek,目前与客户打磨的共创项目,也都采用了DeepSeek。
客户和生态的态度发生了巨大转变。之前,大模型应用推进速度,要看客户领导对新技术接受的快慢。现在,客户会积极推进,“很多客户主动找我们去讲课,然后打开场景来看,哪些可以结合AI”。从生态上找过来的企业也很多。“一体机很火,但要落地,客户需要应用。好多硬件厂家找我们做联合应用落地。”
不过,DeepSeek对政务领域的巨大推动,不能简单归结为开源和私有化部署。
“我个人认为,DeepSeek带来的震动是,人们可以自主地使用它。大家突然发现,其实不用拘泥于之前的大模型落地路径,也能用起来。”软通智慧CTO杨旭青说,“DeepSeek到底给我们带来了怎样的变革?很多人认为是工程类变革,但如果换个角度,它之所以能带来这么大的热潮和影响,核心是缩短了各行业AI转型的路径。”
而在政务领域,这种缩短和简化效应,更容易形成催化反应。
这轮AI激烈地影响到政务
DeepSeek对政务领域的震动很大,从春节到现在,政府部门落地应用的新闻持续不断,影响也极为深远。在深圳龙岗区这个最早部署、应用DeepSeek的政府部门,专门发文,倡导全区积极拥抱DeepSeek,鼓励公务员不仅在工作中,甚至在生活中也要积极运用AI,并将相关情况纳入干部正向报告体系。
以往,任何新技术几乎都是金融行业最早尝鲜,而这次由政务抢先,这其中有一些推动因素。
“从国家政策到两会研讨,都在倡导拥抱AI。在此时代大势下,政府部门要先行先试。”浪潮云山东海若副总经理陈艳清说。
DeepSeek打开了全民的AI意识。很多人在春节期间首次使用它,体验到AI的惊艳效果。大模型性能的提升,本身就提供了很多现成的应用,利用低代码甚至无代码的智能体外壳,便能在行业场景中发挥作用,政务领域便是其中之一。“而且,政务的很多应用,比如写报告,其实打破了智能办公和业务之间的界限。”软通智慧杨旭青分析,这也有力地推动了政务体系快速做出改变。
DeepSeek开源最大好处是可快速、本地化部署,这也与政务应用有很强的共性。
而最为关键的,是AI应用门槛下降,激发了整个生态。近几年政务系统坚持以AI驱动做转型。从去年开始,城市数字化转型都在强调AI中枢搭建和AI场景应用。不过,AI中枢平台建设成本很高,架构也很复杂。但DeepSeek推出后,简化了AI落地路径。
杨旭青以政务问答为例,之前需要政务部门先训练政务问答小模型。如今,DeepSeek已能达到自建平台效果的60%~70%,外挂知识库,能解决另外20%~30%的问题,行业无需再执着于从头训练。各场景能快速落地,让政务行业更容易接纳和认同。而且,落地路径简化,激发大量软硬件服务企业也快速跟上,协助用户展开落地。
此外,AI对地方产业有带动作用。很多城市看到在杭州等地,AI对产业的带动后,也不甘示弱。清华大学新闻学院、人工智能学院双聘教授沈阳发现,各地首先希望AI能推动经济发展与产业升级,例如通过支持智能制造或数字经济来提升本地竞争力。同时,城市管理与治理效率也是重点。
在各地的AI部署,很大程度要靠政数据、大数据局来统筹,由各地大数据产业集团来落地。作为最近一两年才成立的新部门,它们仍在探索履行职责的方式,而这些部门看到,通过政务来牵引产业,是一种有效的模式。
由于上述多种原因,在这轮政务AI落地潮中,各地政府、委办局的态度发生转变。之前,他们抱持谨慎态度。毕竟,涉足的业务场景越多,承担的业务责任也就越大。而今年以来,大家解放了思想。不少地方一次性提出数十个场景。比如,济南市今年计划要做200多个数智员工。大家全都打开场景去看如何与AI结合。
缩短落地路径,会持续产生影响
不少政务领域的应用服务商发现,DeepSeek推出后,模型落地的门槛在大幅下降。
“之前我们可能要在基础模型上精调,花费很大算力,也要投入很多精力。”华宇资深人士告诉数智前线,“现在这个过程都要省掉了。一些应用,DeepSeek满血版都不需要精调,我可能通过提示词+业务规则就搞定了。”华宇是政务和法院领域一家增值应用服务商。“由于底座大模型的提升,我们在上面也能开发更多的应用场景。”
DeepSeek-R1深度推理也开启了一个新模式,就是呈现整个思考过程,这对政务应用的精准回溯非常关键,让用户能更好理解模型给出结果的依据。
杨旭青以今年亲身经历的一个政务项目中矛盾调解应用举例,像公租房矛盾调解,DeepSeek会告诉社工,根据规章制度,要先联系负责公租房的企业物业。同时,它也提醒社工,考虑到部分企业改制,如果无法顺利找到对应的企业物业,可以转而求助房子所在的居委会。“本来社工对这类复杂流程可能并不熟悉,但DeepSeek的思考过程都告诉了他。”
而这些情况都不需要训练,只要结合一些政务专有知识库,就可以落地。
相比较而言,原来政务系统是按照智能中枢模式去设计的,用户要先有算力、有模型、有MaaS平台、有应用和智能体构建这样一个体系。而在现阶段,用户不用考虑这么复杂的情况,他们可以先选择一体机,算力、模型都有了,只要对接场景,就可以在一些场景中落地。
“政务与医疗或AI for Science不同,它首先是服务于产业、服务于民生、服务于企业的基础服务,因此,也最容易体现DeepSeek缩短技术路径的效益。现在,先外挂知识库,马上就会有一些变化。然后,再通过模型蒸馏,在第二阶段去改进它,这个过程比原来要快很多。”杨旭青强调。
如果按照之前的路径,政务AI转型可能需要两三年,但现在路径缩短,把原来一年干的事情,两个月就干完了。
“DeepSeek带来了落地路径的明显变化。”厦门众数信科创始人兼CEO吴炳坤告诉数智前线,如今,他们先将DeepSeek蒸馏,获得更小参数的模型,来降低算力需求,再通过强化学习而不是之前的微调,将数据训练到模型上去。而模型经过强化学习以后,可以反向指导它的深度推理质量。通过这种方法,一些用户实测,比DeepSeek拿来后直接使用,准确率高出15%~20%,而这些效果还在不断提升。
为什么模型蒸馏今年被广泛提及?华宇人士补充,满血版DeepSeek的算力成本,目前需要几百万元,一般客户承受不了。他们实践发现,32b是目前综合性比较好的模型,阿里也推出了QwQ-32b模型。“当然32b模型没法与满血版比,但适合专属助手,类似安全手册、律所卷宗搜索、报告生成这种。”另一位应用服务商CEO告诉数智前线。
在一台国产算力一体机上,只能部署一个DeepSeek满屏版或千问72b模型,但32b模型,可以部署3~4个。
落地路径简化后,大家在比拼什么?“其实挂了知识库,模型能不能理解,回答准不准,要做一些知识处理,也就是知识检索增强(RAG)。最简单的是做向量化。之后,要不要做深层的数据挖掘,比如构建知识图谱?这其实就考验应用服务商业务的积累了。”
政务应用会被重构吗?
政务应用的构建,因为智能体在发生变化。“智能体会在很大程度上,改变了以一网统管为代表的政务或城市治理类项目的交付模式。”软通智慧杨旭青说。
原来一网统管的交付,要有数据管理层、AI中智能中枢层、MaaS层、调度层以及应用场景。“而智能体就像一个个小的功能方块。政务领域目前在快速开发各种小方块,比如合同审查、分拨调度、矛盾调解......把这小方块通过API调用或Function Call模式,嫁接到现有系统上。”杨旭青解释。
现阶段智能体的应用模式,并没有重写所有应用。就像不久前引起关注的Manus一样,靠Function Call或API,对接到原系统,保存原系统的流程。
“在这一进程中,现有系统将很快融合诸多新型智能体,实现系统的提升。再往下走,我认为智能体技术会逐步开始重写系统了。”杨旭青说,“这是一件好事。”
聚焦智能体应用落地的吴炳坤观察,智能体落地是分阶段的。
“原来大家做智能体时的一大痛点,是大模型还不够强,用口语化方式告诉它要做什么时,大模型理解不了,智能体执行起来也就很容易翻车。”吴炳坤说,DeepSeek推出深度推理模型后,提高了大模型对指令的遵循准确率,加速了智能体落地过程,但智能体仍处在比较前期的阶段,比如说边聊边办、生成表单或PPT这些办公类场景。我们希望智能体能实现比较复杂的场景,比如多智能体调用,也就是中级应用。
“Manus的重大改变就是多智能体协同。”杨旭青说,未来,如果整个业界趋势是这样的,政务系统必然也会发生很大的重启。比如在共享单车堆积场景下,一张图片、一句话会激发多智能体调度,有调远方摄像头查看的、有分拨的、有派工单的、有跟踪结果的,在事情处理好之后,还有做评价的,这也是政务系统需要的。
“到那时,政务也有可能是一个积极的参与者和改写者,就像现在参与DeepSeek落地一样。”杨旭青说。其实他们已经在智能体上投入一年多,在为政务客户提供DeepSeek部署的同时,也提供智能体平台和数十个现成的智能体。
对于当下政务在这一轮AI落地的进展,杨旭青认为,第一阶段成果呈现已经完成,就是将DeepSeek部署起来,拿出示范性场景和效果。第二阶段是相对复杂的场景,这些场景与政务业务系统的融合度更高。“我们已经看到客户,认真组织研发团队去研发了,两三个月内,我们会看到一些应用,像一些城市一网通办通过DeepSeek提供市民服务。同时,会逐步看到一些多智能体调用的应用,甚至这两个发展会并行。”
“我个人认为,未来两三个月内,我们会看到政务系统不断变革、不断出现新的东西。”他说。