蚂蚁知识增强大模型服务框架KAG亮相外滩大会 可显著提升知识推理准确率
近日,2024 Inclusion·外滩大会“超越平面思维,图计算让AI洞悉复杂世界“见解论坛上,来自美国伊利诺伊大学芝加哥分校、国际关联数据基准委员会(LDBC)、中国人寿财产保险、蚂蚁集团等单位的顶尖学者和企业负责人共聚一堂,针对深度图学习、知识图谱、图行业标准和产业应用等议题展开了探讨。在会上,蚂蚁集团还公布了“CCF-蚂蚁科研基金图计算专项”入选结果,东北大学、复旦大学、上海交通大学、华中科技大学、中国人民大学、香港中文大学(深圳)、清华大学的8位学者入选,将共同推动图计算产学研协同发展。
“数据挖掘领域巨擘”——美国伊利诺伊大学芝加哥分校计算机科学与技术系特聘教授俞士纶,分享了其在深度图学习方面的工作。俞教授认为,图模型是实体之间的关联关系的刻画,该技术路线不同于大语言模型基于神经网络的统计逻辑。比如,在推荐场景,图模型可以用协同过滤来发现用户之间的共同喜好,而大语言模型就很难做到。俞教授还提出了几何深度图学习(Geometric Deep Graph Learning)的概念,并从图的表征空间和混合曲面多关系的角度重新审视了图神经网络(GNNs)的能力。在多个应用中,GNNs都取得了良好的效果,为构建图基础模型开辟了新的思路。
(美国伊利诺伊大学芝加哥分校计算机科学与技术系特聘教授俞士纶分享图模型最新研究)
知识图谱由于能够有效解决大模型“幻觉”问题,被认为是大模型真正落地的关键技术之一。蚂蚁集团知识图谱负责人梁磊分享了知识增强在构建专业智能体中的实践。 梁磊介绍,蚂蚁集团自研了专业领域增强大模型服务框架KAG,这套框架通过图谱逻辑符号引导决策和检索,提升了垂直领域决策的精准性和逻辑严谨性;通过信息检索可补全知识图谱的稀疏性和知识覆盖的不足,同时充分利用大语言模型的理解和生成能力降低领域知识图谱的构造门槛。这套框架在垂直领域的适用性得到了有效验证。比如,支付宝最新推出的AI 原生App“支小宝”采用这套框架,在政务问答场景的准确率提升到了91%,医疗问答的准确率也超过了80%,围绕更垂直的指标解读准确率可达90%以上。梁磊还透露,KAG框架会进一步向社区开放,并在开源框架OpenSPG中原生支持,也欢迎社区共建。
(蚂蚁知识图谱负责人梁磊分享知识图谱在大模型中的应用)
浙江大学助理教授张强分享了利用知识图谱驱动科学发现方面的一些工作。他们主要从科学数据的图表示工作、领域专家知识的积累和表达、构建氨基酸知识图谱赋能蛋白质优化设计三个方面展开了研究。张强介绍,图对于处理科学数据、科学任务有非常广泛的应用。“我们可以用图去建模数据,表示数据跟数据之间的一些交互的关系。同时,图也是领域科学知识的结构化积累”。他认为,图模型跟大语言模型可以相互补充,促进科学研究当中属性或者物质的预测,和物质的生成,甚至可以作为一个更广泛的助手赋能科学发现。
在会上,国际关联数据基准委员会(LDBC)副主席Alastair Green介绍了国际图数据库基准工作的相关进展。中国人寿财产保险有限公司人工智能开发团队负责人孔宇飞分享了图计算在车险反欺诈中的应用实践,蚂蚁数科AI技术负责人章鹏介绍了TuGraph在产业图谱风控的应用,为行业带来了产业风控新视角。
图是一项蓬勃发展的前沿技术,需要行业携手攻破更多的技术难点,拓展更多的应用空间,对此行业正在做出积极努力。在会上,蚂蚁集团图计算技术负责人洪春涛发布了“CCF-蚂蚁科研基金图计算专项”入选结果。据介绍,这项基金旨在吸引和鼓励更多的专家学者来参与图计算技术共建,选择了图数据库、图智能和隐私图计算三个很有挑战性的方向。据了解,基金专家评审委员会历时一个月对申请材料进行了两轮评审,每项申请均由专家组分别从技术先进性、实施可行性、课题研究匹配度,计划可行性等多个维度,给予综合评价。最终,东北大学、复旦大学、上海交大、华中科技大学、上海交通大、中国人民大学、香港中文大学、清华大学的8位学者入选了专项基金,他们将从图存储、图查询、图检索增强、图神经网络泛化、图隐私保护等课题展开研究,共同推动图计算前沿研究。
(CCF-蚂蚁科研基金图计算专项发布,8位学者入选)
为加速知识图谱与大语言模型的双向融通,蚂蚁集团也和浙江大学成立了知识图谱联合实验室。据梁磊介绍,联合实验室已发布了大模型抽取框架OneKE,下一步还将构建增强语言模型的OneGraph。
行业认为,数据决定了大模型的上限。图计算、知识图谱与大模型的深度结合,将会为大模型的训练与推理提供更高质量的数据,让大模型变得更聪明。人工智能的上限,在这些关键技术加持下,有望再次被推高。