零点有数在数据智能技术(简称“数智技术”,以下同)研发过程中,始终秉承问题导向的价值主张,专注于解决客户的场景业务问题。在各个垂直领域,通过深入洞察客户需求和行业痛点,公司开发出了诸多数据智能管理与分析模块,将针对特定场景问题解决的行业知识、算法模型与大模型技术相结合构成决策支持核心,从而形成切实有效的数字化解决方案,应用效果受到很多客户认可。这种以问题为核心的方法论,不仅促使公司不断优化算法模型和决策支持系统,而且还大力推动了技术泛化。比如,在“12345政务服务便民热线”领域,公司基于问题导向开发的一套响应性算法模型机制,不局限于“12345政务服务便民热线”领域,其技术泛化能力使得它还能够更广泛地应用于其他行业领域的服务与响应场景。零点有数一直以来把握数智技术的发展路线,评估数智技术的当前状态及其发展趋势,合理运用数智技术,提升自身的数据分析与决策智能水平。公司的研发实践,分为三个阶段,基础发展期、快速冲浪期、前沿探索期。


附图一 零点有数的研发实践三阶段

基础发展期


自2016年起,结合公司多年积累的行业知识体系,运用较为成熟的数据分类、自助分析和知识图谱等技术,提升自身的数据分析与决策智能水平。


例如,在数据分类方面,结合12345政务服务便民热线数智应用场景,基于最先进的蒸馏分类模型以及多目标优化算法,将深度学习算法与智能多目标优化算法融合运用到工单派单过程中,产出适应多种派单需求的派单系统;在自助分析领域,开发了如可视化大屏、数据面板、无代码、自动报告等多种自助分析工具,为商业领域和政务服务领域客户提供便捷自助分析服务;在知识图谱应用方面,开发了覆盖城市治理应用的一些重要维度(如房地产全流程事理图谱、环保、实体画像图谱等)的事理图谱,构建了数据治理与算法库,搭建了从数据存储(数据层)、业务辅助(支撑层)、图谱处理(智谱层)、算子服务(引擎层)到系统展示(展示层)的知识图谱生产五层框架,为城市治理应用系统开发打造了一个知识提炼底座,从而极大地提供了城市治理应用系统开发的效率。


快速冲浪期


2022年底ChatGPT的技术爆发,标志着生成式AI大模型时代的开启。与时俱进,公司研发推进至特定领域生成式AI、增强型数据分析、复合式AI。


在特定领域生成式AI方面,2023年上半年,全方位打造了12345政务服务便民热线领域的生成式AI——“热线楷模”,开发了热线智能问答、热线智能制单、热线智能问数等功能,并成功实现了相应模块的应用落地,全面提升了该领域的数据分析与智能决策水平。“零点楷模内容生成算法”顺利通过国家网信办备案。


在增强型数据分析方面,鉴于生成式AI大模型在垂类场景应用过程中存在“幻觉”(即“事实性错误”),因而,应用过程中需要对生成式AI大模型进行“知识增强”,以减少大模型的“幻觉”,提高大模型的准确性。工程技术上,努力构建有效的行业知识图谱,并将行业知识图谱与大模型进行深度融合,就成为增强生成式AI大模型在垂类场景下的数据分析与智能决策水平的必要途径。公司着力研发通过建设各类知识增强智能引擎,叠加知识图谱等技术,开发了相关底层基座,聚焦知识增强(内容增强、检索增强、逻辑增强及增强抽取)等组件的研发,并实现对客户数据的整合、抽取、对标、推理,降低客户使用门槛,满足更广泛的客户需求。例如,面向公安行业的Chat BI产品,通过LLM微调、prompt工程、text2sql、RAG等关键技术以及多阶段不同模式的探索,全面提升了分析模块的准确率、稳定性、泛化能力和召回率,构建了text2sql的商用能力。


在复合式AI方面,零点有数认为,相比传统的单一AI模型,复合式AI通过多个组件有机融合,能够更有效地解决复杂问题。随着AI技术的进步,复合式AI有望成为推动AI领域发展的重要力量。在Gartner最新发布的技术成熟度报告中,Gartner也认为,在技术成熟度上,在中国,复合式AI正处于“创新触发期”。公司根据场景问题,研发复合算法方案,将大语言模型与其他AI模型、算法进行有机整合,形成端到端的解决方案,以支持复杂场景的多任务处理。例如,针对热线楷模的智能摘要模块,就融合了语音转录、NLP数据清洗、信息对齐、要素抽取以及摘要生成等多种AI模型和算法,综合形成了适应复杂场景多任务的产品解决方案。


前沿探索期


公司研发将持续关注并探索前沿新技术。在垂类数据智能方向,零点有数聚焦于决策智能与数据应用两大核心领域持续突破。在决策智能领域,公司致力于打造智能辅助决策系统,通过问题导向建模方法,融合动态图谱和垂类大模型技术,构建深度因果关系推断能力,形成类人协作的多层次架构,驱动基础架构向分布式智能体协作变革。在数据应用领域,公司构建了覆盖数据感知、监测到利用的全流程数据分析解决方案,深度融合垂类知识与垂直算法等技术,打通数据孤岛壁垒,依托响应式算法模型机制,实现从问题识别到协同分析、策略反馈的数据智能闭环。


对照Gartner注1权威发布的《2024 年中国数据分析和人工智能技术成熟度曲线》(Hype Cycle for Data, Analytics and AI in China,2024)(附图二),当前公司的基础核心技术已全面迈入稳步爬升复苏期,为业务提供坚实的支持,并进入规模化应用与持续优化新阶段;而快速冲浪与前沿探索期的技术引擎——复合型AI、自主智能体,现处于曲线中创新触发期,公司正加强研发探索,布局新商业模式,为中长期竞争力奠定基础。


附图二2024年中国数据分析和人工智能技术成熟度曲线


基础发展期快速冲浪期前沿探索期框中技术对应的研发阶段



注1:Gartner(高德纳,又译顾能公司,NYSE: IT and ITB)全球知名的IT研究与顾问咨询公司。Gartner技术成熟度曲线(Hype Cycle)是一种用于描述新兴技术发展周期的模型。该模型将发展周期定义为创新触发期 (Innovation Trigger)、期望膨胀期 (Peak of Inflated Expectations)、泡沫破裂低谷期 (Trough of Disillusionment)、稳步爬升复苏期 (Slope of Enlightenment)和生产成熟期 (Plateau of Productivity)。


在持续深耕核心技术的同时,公司不断强化工程化能力与规模化落地体系。通过构建企业级数据治理框架、MLOps平台与自动化部署流水线,实现从数据接入、特征处理、模型训练到服务上线、运行监控的全生命周期管理,提升模型交付效率与系统扩展能力,支撑智能应用在复杂业务场景中的快速落地与持续演进,也为正处于创新触发期的前沿方向如复合型AI、自主智能体等,提供了高效、灵活的研发验证环境,助力公司在新商业模式中抢占先机,迈向可持续创新的新阶段。


来源:日照新闻网