1、演讲人:孙佩霞中国电信研究院智行云网大脑技术负责人 2023 团队介绍 中国电信股份有限公司北京研究院中国电信股份有限公司北京研究院(原中国电信集团北京研究院)是中国电信集团公司为适应集团公司发展和电信市场竞争需要,于2001年4月18日挂牌成立的科研机构,旨在成为集团公司以及各省级公司的企业决策智库、技术创新引擎和产品创新孵化器。AI研发中心研发中心成立于2019年12月,基于大数据和AI算法赋能电信集团和省市公司智能化研发,承担集团和研究院双重项目研发。AI能力团队能力团队重点围绕网络运营领域研发网络AI算法能力,涵盖移动、传输、数据等专业。荣获荣获2021年年SNAI应用创新案例应用创新
2、案例荣获荣获2021年知识驱动先锋企业年知识驱动先锋企业发表多项论文、专利、软著等发表多项论文、专利、软著等电信网络运营场景网络运营事件知识图谱构建网络运营知识图谱应用展望电信网络运营场景电信网络运营场景 电信网络运营工单记录了大量的业务数据,还存在专业术语,有着数据量大、结构多样、缺乏规范等特点,是目前数据分析和挖掘的难点区域,目前主要通过人工对工单内容进行处理和分类,由于依靠人工经验,导致处理及时性低,分类规则不一致,不能有效发现客户的真实诉求。业务数据利用率低业务数据利用率低l 电信网络运维过程中产生规模庞大的数据,这些数据只有很小一部分被整理为案例,为运维人员提供参考,大量数据价值遗失
3、。l 没有形成运维行业的知识沉淀,缺少结构化的知识库,无法支撑智能化发展。智能化程度低智能化程度低l 运维依赖专家经验,缺少基于深度学习技术的智能感知和决策l 自动化达到瓶颈状态,先进AI算法和结构化数据资源匮乏,无法支撑版本迭代机制运维工作量逐年增长运维工作量逐年增长运维运维模式陈旧模式陈旧l 近年来随着业务量的不断增加,集团云网运营部维护网元数同比增加10%+,网络故障工单同比增长5%+。全网维护网元数同比增加10%+,故障工单同比增长5%+。l 网络运维多年,多是被动等待和接受问题,缺少化被动故障处理为主动网络维护。l 全流程自动化工单在所有工单占比仍较少。重复性基础维护工作占比大,处理
4、效率低下,严重影响客户体验。电信网络运营场景网络运营知识来源数据类型数据类型介绍介绍特点特点工单网络运维系统判定发生网络问题告警后,派出网络运维电子工单,运维工位人员进行跟进处理解决,分析处理过程记录在工单中。优点:数据较为规范,半结构化,数据量大,来源较稳定。缺点:工单中问题分析和处理过程较为简略,知识信息有缺失。案例运维人员在处理经典网络运维故障后,会撰写相关案例文档,供后续遇到类似问题查阅解决。优点:案例详细总结了运维故障问题发现、分析、处理过程、经验总结,知识信息全面。缺点:格式多样,依赖专家人工撰写,数据量少,来源不稳定。业务规则运维人员在处理经典网络运维故障时编写的业务规则逻辑。优
5、点:业务规则直白明确,实际使用有效,知识信息重要。缺点:格式多样,来源不一,需要从各个系统导出,依赖专家解读。专家经验运维人员在处理经典网络运维故障时积累的实际处置经验优点:专业性强、价值高缺点:依赖专家言传身教、无固定存储格式,依赖专家撰写输出。基于知识图谱的智能网络运营技术方案知识知识图谱图谱通过对专家案例、运维手册、历史工单数据、其他告警信息等多源异构数据的知识抽取,构建结构化知识库。并基于运维知识库,打造知识推理引擎,围绕重点领域业务场景,实现知识检索、智能决策、智能问答等,构建数据+知识驱动的智能运维体系。网络运营事件知识图谱构建网络运营事件知识图谱构建网络运营事件知识图谱本体构建工
6、单知识图谱本体构建案例知识图谱本体构建Step3:设计不同prompt策略进行UIE事件抽取,提升模型抽取结果准确性Step1:采用标注工具进行工单、案例实体知识标注,每个专业至少1000+篇。Step2:采用开源UIE模型训练各专业信息抽取模型,校验模型抽取结果网络运营事件知识图谱知识抽取网络运营事件知识图谱知识抽取选用不同prompt策略的UIE事件抽取实验结果工单告警事件模式构造由于该模型是基于prompt的方法,选择合适的prompt对抽取结果的性能有较大的影响,因此我们在寻找有效的prompt上进行了一些