蚂蚁集团沈孝栋:自证技术背后的三大科技能力
“如何将碎片数据源转化成为更多人群的信用证明,是我们研究的重要课题。”7月19日,在2024中国国际金融展数字金融发展论坛上,蚂蚁集团资深技术总监沈孝栋首次分享,如何通过人工智能技术让交互式信贷自证成为可能。
他以花呗近期上线的自证提额功能为例,对背后的AI技术进行了分析。
在花呗的这一新功能上,今年新进入职场的毕业生,在花呗原有额度的基础上,如有更多需要,可通过上传大学毕业证书或四六级证书申请提额,如系统审核通过,则提额成功,未来花呗可能会支持更多类型的证书验证。
图:花呗近期测试上线的自证提额功能
“花呗背后的金融机构,要做到根据用户提交的材料判断出恰当的提额额度,首先需要有一套技术,能够助力金融机构识别这些材料,因为只有认得出,金融才能判得准,这就包括材料信息验真、数据档案萃取、大模型分析预判等。”沈孝栋在论坛现场介绍。
其实,“自证技术”不是一个新名词,通过申请者自己上传相关材料、申请提额的方式,在金融行业里较为常见,材料类型主要集中在收入流水、个税公积金缴纳证明等方面。
但随着数字化时代灵活就业越发普遍,对个人信用的增信证明方式也越来越多,比如外卖骑手网约车司机的相关等级认证、就业技能证书等,在一定程度上有利于金融机构的风控判断。
图:2024中国国际金融展现场
不过,做出这些判断的前提,是如何通过各种技术高并发、高效识别、读取、分析这些个性化、多样化的材料,这正是沈孝栋团队持续探索并为金融机构提供的能力。
“未来,我们希望让用户自证过程更加智能、便捷。几个简单的步骤,上传各类证件、证明截图甚至录屏等信息均可完成自动识别,在遇到疑问还可以得到即时的智能问答帮助。”沈孝栋介绍道。
图:蚂蚁集团沈孝栋在2024中国国际金融展分享自证技术
具体而言,蚂蚁集团自证技术背后具备三大科技能力包括:
首先,确保多模态数据的安全可信。
也就是建立全方位的防伪验真体系,基于PS篡改检测、合成(AIGC)生成检测、批量黑灰产防控、原图原件识别等多种智能防伪算法,保证多模态内容的真实可信。
其次,实时萃取多模态档案的碎片化特征。
通过构建三类特征萃取体系,对半结构化数据以及一些特定的非结构化数据采用专精模型识别,以此对图片类、表格类、视频类等数据要素,实现场景化中实时的用户特征智能化数据萃取。
最后,通过大模型助力金融机构风控判断。通过大模型预训练存量数据,再加入自证特征微调,满足千人千面的风险识别,为金融机构决策提供低延迟的在线服务。
“通过AI技术革新及数据要素的运用,我们将持续支持金融机构升级创新,未来应用到更多群体中,促进金融资源更加公平、广泛地惠及每一个有需求的个体。”沈孝栋表示。