1、演讲人:李明明 恒生研究院AI产品经理知识图谱与大模型双轮驱动:金融行业智能化产品与架构的演进之路金融场景的困局与破局另一种规则引擎?01大模型技术带来的新范式马拉火车?02产品功能与设计的演进单核带队-多核带队03落地挑战与未来变化可控智能体04目 录CONTENTS基于产业链上下游进行产业分析与传导投研投顾投研投顾基于反洗钱报送的高风险用户进行多跳关联反洗钱反洗钱基于股票、债券的交易行为构建知识图谱,实现对相关机构的交易行为进行刻画。证券交易行为画像证券交易行为画像基于企业图谱和产业链图谱进行多层事件风险传导、渗透评估和风险影响面估计。信用分析信用分析聚焦金融+AI领域金融知识图谱平台 一
2、站式图谱构建及应用平台数据存储ArangoDBNeo4jMySql缓存Redis全文检索ESD2R规则映射数据日志定时任务Quartz恒生任务调度框架Schema数据基础应用插件应用概念数值属性关系分组边属性关系属性实体关系标签系统配置动态索引最短路径关联分析数据可视化实体对比图谱下钻影响传导(子图推理)资本系计算股权穿透产业链可视化分析API H5企业画像债券评级财务风险事件预警智能问答图计算SparkGraphX动态参数扩展插件模式查询图谱管理台事件影响传导风险事件引发的全链路图实体和边的风险因子股权链路上的风险传递产业链条上风险传递更多数据更多规则代表更多传递展示泛化事件:变化即事件用户
3、风险厌恶性高,可控性要求高用户风险厌恶性高,可控性要求高(1)耗时费力;(2)因人而异;(3)规则逻辑无法跟随市场变化而更新,知识更新导致规则失效;规则逻辑的局限性规则逻辑的局限性(1)复杂关系,难以用数据表明:eg:同样都是债券交易但交易的目的往往不同;(2)信息系统的精确性要求与规则本身的模糊性之间的冲突(三元组本身是一种有损压缩)数据表示的局限性数据表示的局限性金融场景的困局与破局(1)外部影响难以预先预估:金融市场受到多维度信息变化影响(疫情?俄乌战争?)(2)模型复杂性与可解释性矛盾;(3)演绎推理往往比归纳推理更受到业内认可LLMLLM辅助辅助KGKG构建构建(1)动态更新知识,尤
4、其是推理逻辑;(2)演绎推理弥补数据原因导致的归纳推理的不足LLMLLM辅助辅助KGKG推理推理GraphRAG/LightGraphRAG:通过引入图结构增强了对复杂关系的建模能力和推理能力。KAG:结构化的图谱与知识推理方式,LLM可以生成符合特定知识结构和逻辑的内容。Think-on-Graph:通过识别与给定问题相关的实体,检索相关三元组,进行探索和推理。生成多个推理路径,直到收集到足够的信息回答问题或达到最大深度。基于基于KGKG技术的技术的RAGRAG新范式:KG+LLM的一些方向自动化抽取:LLM抽取实体、关系(如OpenIE技术),甚至发现隐含关联(如因果、类比关系),覆盖传统
5、方法难以处理的长尾知识。另一种规则引擎?知识图谱真的不行。如果哪个同学做知识图谱,我认真跟你讲,你不要用知识图谱。我自己也做知识图谱20多年.just dont do that。Just pretty bad。It does not work at all。You should use Transformer。质疑?马拉火车?产品功能与设计的演进:独立思考准确速度成本准确度视角为例:问题1:蚂蚁和恒生电子的关系是什么?(纯LLM更优)问题2:反洗钱系统中张三和李四的关系是什么?(KG更优)问题3:机构A和XXX债券的关系是什么?(OR 机构A、机构B频繁买入XXX债券说明了什么?)(LLM+K
6、G更优)产品功能与设计的演进:进一步思考KG的完备性高问题需要多步推理的程度越高知识的专业化越强(私域化、时效性)三元组表示与图谱三元组表示与图谱构建:构建:LLMLLM图数据库图数据库图查询、图查询、图分析与计算图分析与计算股权关系实控人资本系债券关系竞争/合作关系供应/客户关系任职关系质押/担保关系公司品牌关系诉讼关系主营产品上下游行业产品分类指标关联企业图谱产业图谱事件主体事件属性事件分类因果关系顺承关系事件图谱产品功能与设计的演进图谱推理:图谱推理:LLM+KGLLM