
6月9日,重庆中科云从科技有限公司,工程师正依托从容大模型开展应用落地效果核验工作。记者 张锦辉 摄/视觉重庆
6月9日,重庆市服务业大会召开,提出加快AI赋能产业数字化转型,深化拓展数智融合综合服务场景。
记者在采访中了解到,在重庆,AI大模型已走进众多行业,成为从业者的“专家型助手”。以重庆中科云从科技有限公司(以下简称云从科技)自主研发的从容大模型为例,拿一张发票让大模型“看”一眼,它就知道是否合规;拿到报销材料,大模型进行交叉比对后,能从几十张票据中,准确“拎”出不符合报销要求的部分。
去年5月,从容大模型在国际权威评测平台OpenCompass全球多模态榜单中,以80.7分的综合成绩荣登榜首。
作为一个完全国产自研的AI大模型,这个大模型为何能超越谷歌等巨头,在全球多模态榜单中登顶?它具体能干哪些事儿?记者进行了打探。
构建起技术“护城河”
“多模态榜单的评测,更注重考察AI大模型的综合能力,而从容大模型刚好是一个‘多面手’。”云从科技高级算法工程师刘盛中介绍,在AI领域,模态指信息的存在形式,如文本、图像、声音等数据类型,多模态就是混合处理这些信息。
OpenCompass的全球多模态测评,涵盖视觉感知、认知理解与跨领域应用的八大核心数据集,涉及医学健康、数理逻辑、艺术设计等十余个专业领域。
也就是说,AI大模型要在测评中取得好成绩,除了要有过硬的实力,还不能有“拖后腿”的短板。
以文图信息处理为例,许多AI大模型实际上是分别处理文图信息,即后台有两个AI模型:一个处理文字、一个处理图片,二者互相调用功能,类似于两个同事配合着干活。而从容大模型具备All-in-One多模态框架(即用一个统一模型或系统集成多种能力),能同时将文字和图片作为信息进行处理。
记者了解到,从容大模型在OpenCompass的MMBench中文测试、高难度学科综合评测及高阶推理榜单中均拔得头筹,并在复杂场景文本识别、开放域问答等关键场景中稳居全球前列。
好成绩的背后是过硬的实力。据悉,从容大模型聚焦通用视觉语言理解与推理任务,通过多模态对齐、高阶推理、长上下文建模的突破性优化,已构建起全球领先的技术“护城河”。
深耕多模态近10年
构建这一技术“护城河”,云从科技下了近10年的苦功。
2016年,云从科技开始着手研发AI产品。最初,基于团队在双层异构深度神经网络领域的技术优势,企业专攻人脸识别技术并很快取得成果,在金融、安防等领域落地应用。
但最初一批AI产品落地后,用户的反馈让云从科技很快意识到,仅仅提供会回答问题的“小助理”,或者会认人的“小秘书”,还远远不够。
刘盛中举了个例子:某金融企业使用云从科技提供的AI产品进行风控合规审查,一段时间后,便提出了新的要求——能不能增加写报告、审合同的功能?
“要增加这些功能,AI产品还得会识别票据、合同、协议。”刘盛中说。简单地说,AI产品需要理解报告、合同等文书中的图文逻辑关系,就像一个真正的金融从业者一样。
通过与客户开展深度合作,云从科技运用行业的真实数据沉淀,对AI进行了定制化的逻辑推理训练和识图训练,让AI产品不仅能读懂文字、理解行业术语,还能识别印刷票据、手写收据、签名等图片。
至此,这款AI产品算是在金融行业真正落地。如今,它能自动抽取海量文字和图片中的有效信息,自动识别姓名等关键文本段,自动生成合规报告。
“我们意识到,能帮客户解决实际问题的AI,才能真正产生价值。”刘盛中说,由此,云从科技决定在上述AI产品的基础上持续深耕多模态大模型,为各行各业赋能,从容大模型应运而生。
大小模型协同发力
现在,从容大模型已经走向全国,在许多场景落地应用。作为一个“多面手”,这个大模型还能当“领导”,组织、管理多个小模型一起工作。
刘盛中介绍,大模型的参数规模大,能力更强、泛化更好,但推理成本和资源消耗更高。相对的,小模型参数规模较小、计算需求低、可边缘部署在设备侧,效率高、延迟低,还能离线运行。
通俗地说,大模型“渊博”,小模型“专精”。大小模型协同,能在特定场景中发挥最大化的价值。
例如,云从科技基于从容大模型为某电力企业开发了电力大模型,帮助管理发电全过程。同时,根据云从科技提供的解决方案,企业在关键的安全位置部署多个小模型,实时监测电箱门是否关闭、绝缘索有无破裂等。
一旦发现异常,小模型就立刻“报告”电力大模型。电力大模型能迅速作出判断并正确应对。如此,企业既能降低AI模型部署的成本,又实现了用AI赋能安全生产。
目前,从容大模型已在金融、制造、政务等多个领域通过AI智能体实现规模化落地。其中,某银行与云从科技合作打造风控合规案防智能平台,构建风控AI智能体,实现风险识别自动化和问责标准化,投诉数量压降50%以上。

