用时:22ms

ai产业报告-PDF版

您的当前位置:首页 > 人工智能 > AI产业
  • 工业行业AI+农机:重塑田野生产力-250814(22页).pdf

    免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。1 证券研究报告 工业工业 AI 农机:重塑田野生产力农机:重塑田野生产力 华泰研究华泰研究 机械设备机械设备 增持增持 (维持维持)专用设备专用设备 增持增持 (维持维持)倪正洋倪正洋 研究员 SAC No.S0570522100004 SFC No.BTM566 (86)21 2897 2228 樊俊豪樊俊豪 研究员 SAC No.S0570524050001 SFC No.BDO986 (852)3658 6000 王龙钰王龙钰*联系人 SAC No.S0570124010018 (86)21 2897 2228 行业走势图行业走势图 资料来源:Wind,华泰研究 2025 年 8 月 14 日中国内地 深度研究深度研究 保障粮食安全保障粮食安全 劳动力紧缺,劳动力紧缺,AI 农机新时代“耕者”重要性凸显农机新时代“耕者”重要性凸显 人口基数扩张 膳食结构升级带来持续上涨的粮食需求,全球耕地紧张 农业劳动力总量萎缩带来供给端压力,粮食安全挑战下 AI 赋能农业机械提升农业生产效率势在必行。联合国粮农组织预计至 2050 年,全球粮食总需求较本世纪初将增长 50%-70%,而 2000 年来全球人均耕地面积持续下行,且全球农业劳动力从 2000 年超 10 亿降至 2022 年 8.92 亿,净减超 1 亿人,农作物供给压力持续增加。因此农业生产环节的机器替人与效率提升势在必行,AI 各类农机作为新时代“耕者”,重要性凸显。“耕“耕/种种/收”环节已完成初步机械替人,“管”环节仍大有可为收”环节已完成初步机械替人,“管”环节仍大有可为 “耕、种、管、收”构成传统农业生产流程的核心环节。目前“耕、种、收”环节已初步完成大型农机的机器替人,后续期待 AI 赋能大型农机的智能控制;而“管”环节机器替人空间仍较大。全球农业第一次动力替代革命以机械化为核心,大型拖拉机、播种机、联合收割机等装备的普及,解决了大规模土地耕作的“有无”问题。目前这些大型农业机械有望进一步被 AI 赋能,实现自动驾驶智慧决策等功能。目前种植环节中“管”这一流程仍较依赖人力,导致劳动强度高企、生产效率受限,后续需无人机/农业无人车等设备结合 AI 持续渗透。耕耕/种种/收:机械化解决规模化生产,从体力替代到决策替代收:机械化解决规模化生产,从体力替代到决策替代 第一次农业机械化浪潮中大型拖拉机、播种机、联合收割机等装备的普及主要对耕、种、收的过程进行了人工替代,但操作过程中仍依赖人进行决策,存在效率瓶颈。耕种收对应的大型农机后续需期待 AI 赋能,使农机机手向管理整个生产系统的“农场管理者”或“农业数据分析师”转变。全球农机巨头正围绕“精准”、“无人”和“数据”三大支柱,加速战略转型。中国企业在智控拖拉机/收获机等大型机械方面已有布局但尚未形成体系,道阻且长。以拖拉机为例,我们预计目前全国有约 2000 万拖拉机机手,智控/无人驾驶拖拉机替代劳动力空间可观,渗透率提升核心在于降本。管:机器替人进行时,无人机等设备全力接管灌溉管:机器替人进行时,无人机等设备全力接管灌溉/施肥等环节施肥等环节“管”环节消耗农业生产超 50%人力,机械化程度仍然较低,无人机/智能灌溉/农业无人车等为主要机械。农业无人机市场处于高速增长阶段,根据IMARC Group,2024 年全球农业无人机达 27.1 亿美元市场规模,预测 2033年有望达 318.8 亿美元(CAGR 27.97%)。农业无人机形成两大头部企业主导的格局,大疆与极飞科技处于垄断地位,2022 年国内市场占比分别为54.82%和 37.59%,全球市场占有率也在领先地位。我们预计当前全球农业无人机渗透率约为 5-10%,有望进入 S 型增长曲线中的快速增长区间。无人机替代劳动力人数有望从 2024 年千万级阶梯式增长至 2050 年亿级。产业链相关公司:1)中国:一拖股份,大疆(未上市),中联重科等;2)海外:约翰迪尔,凯斯纽荷兰,爱科等。风险提示:农业智能化发展不及预期;农业无人机渗透率提升不及预期;本研报中涉及到未覆盖个股内容,均系对其客观公开信息的整理,并不代表本研究团队对该公司、该股票的推荐或覆盖。(6)10274359Aug-24Dec-24Apr-25Aug-25(%)机械设备专用设备沪深300 免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。2 工业工业 正文目录正文目录 核心观点核心观点.3 与市场不同之处.3 保障粮食安全保障粮食安全 劳动力紧缺劳动力紧缺,AI 农机新时代农机新时代“耕者耕者”重要性凸显重要性凸显.4“耕耕/种种/收收”环节已完成初步机械替人环节已完成初步机械替人,“管管”环节仍大有可为环节仍大有可为.6 耕耕/种种/收:机械化解决规模化生产收:机械化解决规模化生产,从体力替代到决策替代,从体力替代到决策替代.7 全球农机巨头积极布局智控大型机械,海外约翰迪尔/凯斯纽荷兰/爱科,国内一拖股份/中联重科均有明显进展.12 管管:机器替人进行时,无人机等设备全力接管灌溉:机器替人进行时,无人机等设备全力接管灌溉/施肥施肥等环节等环节.14 农业无人机中国厂商全球领先,大疆/极飞科技为全球龙头.17 风险提示.19 XVRVyRwPnNpOuMoMwPnNoN6McM7NmOqQmOtOfQpPwOiNmNnQ8OnNvMMYtQpQwMoOrM 免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。3 工业工业 核心观点核心观点 供需缺口持续下粮食安全问题升级,农业生产“耕种管收”四环节积极向机械化、无人化供需缺口持续下粮食安全问题升级,农业生产“耕种管收”四环节积极向机械化、无人化迈进。迈进。人口增长与消费升级推动粮食需求刚性扩张,而土地资源约束叠加农业劳动力持续萎缩,供需错配下农业科技迎来战略机遇期。农业生产环节包括“耕、种、管、收”,目前“耕、种、收”环节已初步完成大型农机的机器替人,后续期待 AI 赋能大型农机的智能控制,“管”环节机器替人空间仍较大。全球农业第一次动力替代革命以机械化为核心,用机器动力全面替代人畜力。大型拖拉机、播种机、联合收割机等装备的普及,解决了大规模土地耕作的“有无”问题。目前这些大型农业机械有望进一步被 AI 赋能,实现自动驾驶/智慧决策等功能。目前种植环节中“管”这一流程仍较依赖人畜力,不仅导致劳动强度高企、生产效率受限,作业质量与稳定性也易受操作者个体经验及自然环境波动影响,后续机器替人空间较大,目前农业无人机、农业无人车等新兴装备正从概念走向田间,成为释放农业生产力潜能的“新耕者”。耕耕/种种/收:机械化解决规模化生产,后续期待从体力替代到决策替代。收:机械化解决规模化生产,后续期待从体力替代到决策替代。第一次农业机械化浪潮中大型拖拉机、播种机、联合收割机等装备的普及主要对耕、种、收的过程进行了人工替代,但操作过程中仍依赖人进行决策,存在效率瓶颈。耕种收对应的大型农机后续需期待 AI 赋能,使农机机手向管理整个生产系统的“农场管理者”或“农业数据分析师”转变。全球农机巨头正围绕“精准”、“无人”和“数据”三大支柱,加速战略转型。当前美国在耕种收领域的无人农业机械商用方面处于领先地位,主要依托其以大田为主的农业特征以及较为先进的农机指控技术,北美 2024 年在自动农场设备市场中占据全球 51%的份额。中国企业在智控拖拉机/收获机等大型机械方面已有布局但尚未形成体系,道阻且长。以拖拉机为例,我们预计目前全国有约 2000 万拖拉机机手,智控/无人驾驶拖拉机替代劳动力空间可观,渗透率提升核心在于降本。管:机器替人进行时,无人机等设备全力接管:机器替人进行时,无人机等设备全力接管灌溉管灌溉/施肥等环节。施肥等环节。“管”环节消耗农业生产超50%人力,机械化程度仍然较低,无人机/智能灌溉/农业无人车等为主要机械。农业无人机在“管”环节各细分领域(施肥、打药、巡田等)展现出应用的多样可能性及广阔前景。如新疆冬小麦的融雪期追肥作业、墨西哥龙舌兰种植园的除草作业均体现出其替人/作业的高效。农业无人机市场处于高速增长阶段,根据 IMARC Group,2024 年全球农业无人机达 27.1 亿美元市场规模,预测 2033 年有望达 318.8 亿美元(CAGR 27.97%)。农业无人机形成两大头部企业主导的格局,大疆与极飞科技处于垄断地位,2022 年国内市场占比分别为 54.82%和 37.59%,全球市场占有率也在领先地位。我们预计当前全球农业无人机渗透率约为 5-10%,有望进入 S 型增长曲线中的快速增长区间。无人机替代劳动力人数有望从 2024 年千万级阶梯式增长至 2050 年亿级。与市场不同之处与市场不同之处 市场对于农业作业中的智能化与无人化未有太高预期,但我们认为无论是“耕种收”环节大型农业机械的智能化还是“管”环节的无人机普及,均会通过节省人工成本,提高作业效率等方式,为农业生产带来较大的经济效益提升,智能化农业机械市场广阔。目前全国有约 2000 万拖拉机机手,当前智控与无人驾驶拖拉机在国内渗透率极低,后续随着高标准农田建设 补贴向智控等方向倾斜,渗透率有望逐渐提升,解放可观数量的农村劳动力。我们估算当前农业无人机渗透率约为 5%-10%,通过各类农场占比及无人机适用比例的加权平均计算,参照全球 15 亿公顷的可耕地总面积,可以推算出 2050 年全球农业无人机饱和渗透率约为 60%。依据技术采纳 S 曲线规律,近年有望进入快速增强区间。根据我们估算农业无人机在 2024 年可替代的劳动力规模约为 2000 万人。此后,这一替代规模将逐步增长,至 2035 年有望达 1.2 亿人。整体农业机械换人规模/市场空间广阔。免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。4 工业工业 保障粮食安全保障粮食安全 劳动力紧缺,劳动力紧缺,AI 农机新时代“耕者”重要性凸显农机新时代“耕者”重要性凸显 人口基数扩张人口基数扩张 膳食结构升级带来膳食结构升级带来持续持续上涨的粮食需求上涨的粮食需求,全球耕地紧张,全球耕地紧张 农业劳动力农业劳动力总量萎总量萎缩带来供给端压力,缩带来供给端压力,粮食安全挑战粮食安全挑战下下 AI 赋能赋能农业机械提升生产效率势在必行。农业机械提升生产效率势在必行。粮食需求端:粮食需求端:人口基数扩张人口基数扩张 膳食结构升级膳食结构升级带来持续上涨的粮食需求。带来持续上涨的粮食需求。根据联合国粮农组织展望 2050 年全球农业报告,2009-2050 年全球人口预计将净增超 23 亿,且几乎全部集中于发展中国家,直接转化为对粮食总量的刚性需求。预计至 2050 年,全球粮食总需求较本世纪初将增长 50%-70%,其中谷物需求将从约 21 亿吨跃升至 30 亿吨。根据美国农业部经济研究局的研究,亚洲、非洲等地区经济发展,推动居民饮食结构从植物性主食向肉蛋奶等动物蛋白转型。与此同时,动物蛋白的生产效率远低于植物(根据 A Well-Fed World 数据,生产 1 公斤肉类通常需消耗 2-25 公斤谷物饲料,具体数值取决于肉类的种类)。这种结构性升级将成倍放大对玉米、大豆等饲料作物的需求,其给全球粮食供给系统带来的压力远超单纯的人口增长率。供给端供给端一一:全球耕地资源紧约束。:全球耕地资源紧约束。FAO 数据显示,2001-2023 年间,尽管全球耕地总面积微幅净增,但主要依赖牺牲永久性草地和牧场,农业用地总面积实则略有收缩。同期全球人均耕地面积已从 0.24 公顷下滑至 0.19 公顷,萎缩 20%,单位土地承载的产出压力持续加重。中国以世界 7%-9%耕地养活约 18%人口的国家,土地资源约束也较为严峻。2000-2020 年间,全国耕地面积净减少达 54,996 平方公里。图表图表1:全球人均耕地面积逐年下降全球人均耕地面积逐年下降 图表图表2:中国整体中国整体/人均耕地面积持续下降供给有所减弱人均耕地面积持续下降供给有所减弱 资料来源:FAO,Wind,华泰研究 资料来源:FAO,Wind,华泰研究 供给端二:农村劳动力总量萎缩与老龄化挑战。供给端二:农村劳动力总量萎缩与老龄化挑战。农业劳动力向非农部门转移趋势显著且不可逆。农业劳动力向非农部门转移趋势显著且不可逆。1)全球:全球:国际劳工组织(ILO)数据显示,全球农业劳动力从 2000 年超 10 亿降至 2022 年 8.92 亿,净减超 1 亿人;农业就业人口占比从 39.8%降至 26.4%。2)中国:中国:农业劳动力从 1991 年峰值 3.91 亿减至 2020 年1.77 亿,近三十年净减少超 2.14 亿人,2001 年以来规模缩减超 50%。农业从业者年龄结构农业从业者年龄结构呈现逐渐呈现逐渐老化老化趋势趋势。1)全球:全球:农业老龄化普遍存在。美国农场主平均年龄达 58.1 岁,65 岁以上从业者数量约为 35 岁以下者的四倍。欧洲、日本及部分发展中国家情况类似。据美国农场局联合会(AFBF)报告,56%的美国农场将劳动力短缺明确列为采纳农业技术的首要驱动力。2)中国:中国:2016年55岁及以上农业劳动者占比已达33.6%;2020 年 65 岁以上占比攀升至 17.72%。劳动力成本持续攀升及短缺已成为掣肘农场经营的核心痛点。0.000.050.100.150.200.2513.613.713.813.914.014.114.22000200120022003200420052006200720082009201020112012201320142015201620172018201920202021全球耕地面积(亿公顷,左轴)全球人均耕地面积(公顷/人,右轴)1.001.051.101.151.201.250.0740.0760.0780.0800.0820.0840.0860.0880.0900.0922000200120022003200420052006200720082009201020112012201320142015201620172018201920202021中国人均耕地面积(公顷/人,左轴)中国耕地面积(亿公顷,右轴)免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。5 工业工业 图表图表3:全球农业劳动力呈持续下行趋势全球农业劳动力呈持续下行趋势 图表图表4:中国农业劳动力中国农业劳动力 2001 年以来规模缩减超年以来规模缩减超 50%资料来源:国际劳工组织(ILO),Wind,华泰研究 资料来源:国际劳工组织(ILO),Wind,华泰研究 供需缺口供需缺口持续持续下下粮食安全问题升级粮食安全问题升级,驱驱动农业科技产业步入动农业科技产业步入高景气高景气、长周期发展长周期发展。人口增长与消费升级推动粮食需求刚性扩张,而土地资源约束叠加农业劳动力持续萎缩,供需错配下农业科技迎来战略机遇期。此前拖拉机/收获机等大型农业机械初步完成了耕种/收获等环节的机器替人,后续 AI 将对其进行进一步赋能,有望将此类大型机械向无人驾驶/智控方向发展以提升效率。此外在农作物生产的管理过程中仍有很多环节还需大量人工,比如施肥,灌溉,施农药等环节,目前农业无人机、农业无人车等新兴装备正从概念走向田间,成为释放农业生产力潜能的“新耕者”。0%5 %054681012200020012002200320042005200620072008200920102011201220132014201520162017201820192020202120222023全球农业劳动力全球农业劳动力占总就业比例(亿人)0 0P%0.00.51.01.52.02.53.03.54.0200020012002200320042005200620072008200920102011201220132014201520162017201820192020202120222023中国农业劳动力中国农业劳动力占总就业比例(亿人)免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。6 工业工业 “耕“耕/种种/收收”环节已完成初步机械替人,“管”环节仍大有可为”环节已完成初步机械替人,“管”环节仍大有可为“耕、种、管、收”构成传统农业生产流程的核心环节。“耕、种、管、收”构成传统农业生产流程的核心环节。农业生产是高度系统化的流程,核心环节可归纳为“耕、种、管、收”四阶段。这四个环节覆盖作物从土地准备到最终收获的完整生命周期,每个环节的操作质量直接影响最终产量、品质及生产效率,构成农业价值创造的基础链条。1)“耕”是农业生产的起点,核心目标是为作物创造理想的生长环境起点。)“耕”是农业生产的起点,核心目标是为作物创造理想的生长环境起点。“耕”通过翻耕破除土壤板结,改善透气性与持水性,同时掩埋杂草和病残体促其转化为有机质。随后进行耙地以破碎土块、平整土地,形成精细苗床。并根据土壤和作物需求,可能进行镇压(压实土壤,促进种子吸水扎根)或起垄/作畦(优化排水、灌溉、通风及光照)。2)“种”)“种”决定田间群体结构和资源利用效率决定田间群体结构和资源利用效率。“。“种”环节始于种子精选与处理(如筛选、包衣),确保种子活力和抗性。精准把握播种时机对出苗率和整齐度至关重要。播种方式(如点播、条播、撒播)及对深度、密度的精确控制,决定了田间群体结构和资源利用效率。对于水稻等作物,育苗移栽策略能在可控环境中培育壮苗,提高成活率和整齐度,有效缩短大田周期并提升土地复种指数。3)“管”是历时最长、投入最多的阶段,核心在于动态协调水、肥、气、热等环境要素,)“管”是历时最长、投入最多的阶段,核心在于动态协调水、肥、气、热等环境要素,并抵御生物胁迫。并抵御生物胁迫。水分管理需确保旱能灌、涝能排,维持根系环境平衡。养分管理要求在基肥基础上,根据作物生育阶段(如拔节、孕穗、灌浆)精准追肥,保障关键期养分供应。杂草防控(常结合中耕,兼有松土保墒作用)和系统化病虫害防治是减少产量损失的核心防线。部分作物还需植株调整(如打顶、整枝)以优化株型结构,促进光合产物向经济器官分配,最大化产量与品质。4)“收)“收”环节时机把握较为重要,时间紧凑。”环节时机把握较为重要,时间紧凑。精准判断成熟度并适时及时收获是前提,过早影响产量品质,过晚易导致落粒、霉变损失。收获作业本身(收割、采摘、挖掘等)追求高效低损。图表图表5:“耕、种、管、收”构成传统农业生产流程的核心环节“耕、种、管、收”构成传统农业生产流程的核心环节 生产环节生产环节 核心阶段核心阶段 核心目标核心目标 主要工作内容主要工作内容 耕 整地、备地 为作物播种和生长创造良好的土壤环境。翻耕、耙地、镇压;起垄、作畦;施用基肥 种 播种、移栽 在适宜的时间,将优质种子或秧苗植入土壤。种子处理(选种、包衣);确定播期;播种作业(控制深度、密度);育苗与移栽 管 田间管理、植保 调控作物生长环境,防治灾害,保证健康生长。水分管理(灌溉、排水);养分管理(追肥);中耕除草;病虫害防治;植株调整 收 收获、产后处理 在最佳时期高效、低损地获取作物产品并做初步处理。判断成熟期;收割、采摘;脱粒、分离;晾晒、烘干;清选、分级、入库 资料来源:农业种植网,华泰研究 目前“耕、种、收”环节已初步完成大型农机的机器替人,后续期待目前“耕、种、收”环节已初步完成大型农机的机器替人,后续期待 AI 赋能赋能大型农机的智大型农机的智能控制,“管”环节机器替人空间仍较大。能控制,“管”环节机器替人空间仍较大。全球农业第一次动力替代革命以机械化为核心,用机器动力全面替代人畜力。大型拖拉机、播种机、联合收割机等装备的普及,解决了大规模土地耕作的“有无”问题。目前这些大型农业机械有望进一步被 AI 赋能,实现自动驾驶/智慧决策等功能。目前种植环节中“管”这一流程仍较依赖人畜力,不仅导致劳动强度高企、生产效率受限,作业质量与稳定性也易受操作者个体经验及自然环境波动影响,且“管”这一环节在种植流程中偏非标准化,相较其他环节需要更精细化的操作与经验判断。“管”这一环节目前机械化程度仍较低,后续机器替人空间较大。免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。7 工业工业 耕耕/种种/收:机械化解决规模化生产收:机械化解决规模化生产,从体力替代到决策替代从体力替代到决策替代 耕耕/种种/收环节已持续进行农业机械化,动力革命解决了规模化生产从无到有的问题。收环节已持续进行农业机械化,动力革命解决了规模化生产从无到有的问题。20 世纪初的美国,以拖拉机为代表的内燃机动力大规模取代了约 2400 万头耕畜,成为农场的主要动力来源。随后,英国、日本及欧洲大陆国家在 20 世纪中叶相继完成了这一进程,大型拖拉机、播种机、联合收割机等装备的普及,解决了大规模土地耕作的“有无”问题。中国中国大型大型农业农业机械发展机械发展进程呈现出进程呈现出“政策顶层设计政策顶层设计市场底层倒逼市场底层倒逼政策与市场双轮驱动政策与市场双轮驱动”的脉络。的脉络。1)创建起步阶段(1949-1980 年):缺乏市场动力情况下机械化由国家行政力量推动。国家主导投资,建立了一拖、天拖等一批骨干农机企业和遍布城乡的农机站体系。2)体制转换阶段(1981-1995 年):家庭联产承包责任制后,农业生产单元碎片化,大型农机遇冷,市场转向适应小农经济的手扶拖拉机等小型农机,而大中型农机发展停滞,暴露出小农经济与规模化机械之间的矛盾。3)市场引导阶段(1996-2003 年):农村劳动力开始大规模向城市转移,生产关系变化催生了对高效机械的真实市场需求。“小麦跨区机收”等农机社会化服务模式应运而生,有效解决了小农户与大机械的矛盾,高效率的大中型农机具开始恢复性增长。4)黄金发展阶段(2004 年至今):2004 年农业机械化促进法的颁布和农机购置补贴政策的实施,成为行业“黄金十年”的核心催化剂。精准的政策支持与持续的劳动力转移这一市场趋势相结合,形成了强大的合力。中中国农业机械化持续推进,尽管成就斐然,仍与主要农业国家有一定距离。国农业机械化持续推进,尽管成就斐然,仍与主要农业国家有一定距离。2014-2023 年,中国单位耕地面积上的平均农业机械总动力总体呈增长态势,CAGR=1.1%;2023 年已达0.88 万千瓦/平方公里,yoy 2.02%;其中,2016 年大幅下降系国三标准转换、部分存量小拖退役所致。在此期间内,农作物耕种收综合机械化率也呈现与平均农机总动力相同的增长态势,CAGR=2.1%;2023 年已达 74%,yoy 1.22%。放眼全球,根据联合国粮农组织数据统计,截至 2022 年,中国农业机械化水平在亚洲范围内位居前列,但仍与欧美、俄罗斯等先进农业地区有一定差距。例如,欧洲、美国的农业平均机械化率均超过 90%,俄罗斯超过 80%。与此同时,结构性不均衡问题同样突出:小麦等主要粮食作物已基本实现全程机械化,但棉油糖、果菜茶等经济作物,以及畜牧业、渔业、设施农业等领域的关键环节机械化水平依然较低。图表图表6:中国农业机械化进程持续推进中国农业机械化进程持续推进 图表图表7:截至截至 2022 年相较农业发达国家,年相较农业发达国家,中国农业机械化仍存在推进中国农业机械化仍存在推进空间空间 资料来源:Wind,华泰研究 资料来源:FAO,华泰研究 010203040506070800.00.20.40.60.81.02014201520162017201820192020202120222023农业机械总动力/耕地面积农作物耕种收综合机械化率(万千瓦/千公顷)(%)免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。8 工业工业 第一次农业机械化浪潮中,大型拖拉机、播种机、联合收割机等装备的普及主要对耕、种、第一次农业机械化浪潮中,大型拖拉机、播种机、联合收割机等装备的普及主要对耕、种、收(大田作物)的过程进行了人工替代收(大田作物)的过程进行了人工替代,但操作过程中仍依赖人进行决策存在效率瓶颈,但操作过程中仍依赖人进行决策存在效率瓶颈。我们认为,在“耕、种、收(大田作物)”核心赛道传统农机已发挥了至关重要的作用,但传统农机作为一种“强力工具”应用,但其作业的精准度与质量(如:播种的深度与株距、施肥均匀度、收获时机等)仍高度系于操作手的个人经验与技能。作业质量的参差不齐直接影响了作物的生长过程与最终产量。因此,对“人”的过度依赖,尤其是对个体经验决策的依赖,构成了机械化 1.0 时代难以逾越的效率天花板。图表图表8:大型拖拉机、播种机、联合收割机等装备的普及主要对耕、种、收(大田作物)的过程进行了人工替代大型拖拉机、播种机、联合收割机等装备的普及主要对耕、种、收(大田作物)的过程进行了人工替代 生产阶段生产阶段 大田作物大田作物(小麦、小麦、水稻、玉米水稻、玉米)甘蔗甘蔗 根茎类蔬菜根茎类蔬菜(马马铃薯、胡萝卜铃薯、胡萝卜)叶菜类叶菜类(生菜、甘生菜、甘蓝蓝)果园水果果园水果(苹果、柑苹果、柑橘橘)浆果浆果/藤本水果藤本水果(草莓、葡萄草莓、葡萄)耕 低,全程机械化,拖拉机与大型机具作业 低,全程机械化,需要深耕 低,全程机械化,需要起垄作业 低,全程机械化,作畦普遍 低,机械化作业,但受地形限制 中,需要搭建支架或设施,部分依赖人工 种 低,高速精量播种机/插秧机 低,机械化蔗种种植 低,自动化马铃薯播种机 中,育苗自动化,但田间移栽部分依赖人工 高,树苗栽植主要依赖人工 高,种苗定植主要依赖人工 管 低,人机/大型机械植保、灌溉自动化 低,无人机/机械化植保 中,机械化植保,但除草等仍需人工辅助 中,人工除草和病害检查仍占一定比重 高,修剪、疏花疏果、套袋等精细作业完全依赖人工 高,整形、修剪、绑枝等需要大量熟练人工 收 低,大型联合收割机 中,机械化收获机已应用,但仍有提升空间 中,机械化收获普遍,但易造成损伤,需分拣 高,主要依赖人工,以保证产品完整性 高,核心瓶颈,完全依赖人工选择性采摘 高,核心瓶颈,果实质地脆弱,需人工精细采摘 产后分选 低,多在收获时由机器完成,或在粮仓自动化处理 中,需要去除杂质 高,需人工剔除损伤、畸形产品 高,需人工进行分级、整理和包装 高,需人工按大小、颜色、瑕疵分级 高,需人工精细分选和包装 注:绿色代表低劳动强度(已高度自动化);黄色代表中等劳动强度(部分自动化,但仍需大量人工参与);蓝色代表高劳动强度(主要依赖人工,是自动化的关键瓶颈)。资料来源:联合国计划开发署,维基百科,华泰研究 “耕种收”对应的大型农机后续需“耕种收”对应的大型农机后续需期待期待 AI 赋能。赋能。以大型拖拉机、精量播种机与联合收割机为代表的核心作业装备,正经历从单一功能机械向多功能智能作业平台的战略转型。传统的人工驾驶机械极度依赖机手的操作水平,智能化升级后农业机械有望迎来效率的全面提升。智能化转型有望把农民从重复性的大型机械驾驶劳动和模糊的经验决策中解放出来,使其角色向管理整个生产系统的“农场管理者”或“农业数据分析师”转变。基于 AI 视觉识别、高精度定位和路径规划的自动驾驶农机,有望能够摆脱对驾驶员的依赖,实现 24 小时连续、高精度、标准化的田间作业。操作员可以实现一人同时监控、管理多台设备的“机群作业”模式,在耕种和收获环节根本解决农业劳动力短缺与老龄化的问题。图表图表9:耕种收环节需依靠关键耕种收环节需依靠关键 AI 赋能机械,增强运营效率赋能机械,增强运营效率 农业环节农业环节 关键关键 AI 赋能机械赋能机械 劳动替代潜力与性质劳动替代潜力与性质 运营增效潜力运营增效潜力 技术成熟度技术成熟度 核心参与者核心参与者 耕 自动驾驶拖拉机 非常高(直接替代驾驶员)燃油效率提升、作业一致性提升、实现 24/7 全天候作业 成长期 Deere,CNH,AGCO 种 精准播种机 低(增强驾驶员)启动肥用量减少(60%)、促进出苗整齐,提升产量潜力 成长期 Deere 收 -大田作物 智能联合收割机 低(增强/降低技能门槛)作业效率提升(20%)、降低谷物损失、大幅降低操作员疲劳度 成熟期 Deere,CNH,AGCO,Claas-经济作物 采摘机器人 非常高(直接替代采摘工)实现 24/7 采摘、减少食物浪费、精细化产量/质量数据采集 萌芽期 Tevel,Fieldwork Robotics 资料来源:John Deere 等各公司官网,华泰研究 免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。9 工业工业 具备自主作业能力的具备自主作业能力的大型化大型化智能农机是一个高度集成的复杂智能农机是一个高度集成的复杂智能体智能体。其技术架构主要由以下四大核心子系统构成,并通过紧密协同工作,奠定智能化作业的基础:1)环境感知系统:多维信息获取与理解的核心环境感知系统:多维信息获取与理解的核心,关键技术方案关键技术方案为为多传感器融合多传感器融合。如约翰迪尔的 See&Spray 技术,该系统的核心价值从避免撞击作物,转变成在作物植株旁精准识别杂草并实施点对点靶向施药。这种农艺层面的精准感知能力,将感知系统的角色从一项运营成本中心(安全功能)提升为直接创造价值的利润驱动点(可节省 76%的除草剂用量)。2)高精度定位导航系统高精度定位导航系统:目前全球农机行业普遍采用且公认的定位导航“黄金标准”是全球导航卫星系统(GNSS)与实时动态差分定位技术(RTK)的结合。3)智能决策与控制系统智能决策与控制系统:自主作业的自主作业的“大脑大脑”。智能决策与控制系统负责实时接收、融合来自环境感知系统和高精度定位导航系统的异构数据流,运用预设规则、优化算法和人工智能模型进行实时分析、态势评估与智能决策,向车辆的底层执行机构下达指令,以完成复杂、动态的田间作业任务,还可调节多台智能农机设备(如无人驾驶拖拉机 无人驾驶运粮车 联合收割机)进行安全、高效、同步的协同作业。4)云端管理平台:农场数字生态的“神经中枢”。)云端管理平台:农场数字生态的“神经中枢”。云端管理平台连接农场所有智能设备、数据与人员的“神经中枢”和数字底座。全球农机巨头均投入巨额资源构建并持续迭代其专属的云端管理平台(如 John Deere Operations Center,CNH MyFarm,AGCO AgCommand,Kubota K-Connect)。随着农户在平台上持续使用并积累多年的、高价值的农场专属历史数据(如连续多年的产量分布图、详细的肥料/农药施用记录、精确到厘米的田块边界与障碍物地图、土壤养分图谱)不断沉淀,平台对用户的价值粘性呈指数级提升。图表图表10:全球全球农机龙头厂商云端管理农机龙头厂商云端管理数字农业平台对比数字农业平台对比 特征指特征指标标 约翰迪尔约翰迪尔(John Deere)凯 斯 纽 荷 兰 工 业凯 斯 纽 荷 兰 工 业(CNH Industrial)爱科集团爱科集团(AGCO)久保田久保田(Kubota)主要平台名称 John Deere Operations Center AFS Connect/MyPLM Connect/FieldOps FendtONE/PTx Trimble IsoMatch FarmCentre 核心战略理念 主导集成生态 开放伙伴网络 混合车队优先 利基自动化专家 关键技术/IP JDLink,See&Spray Raven,Starlink,Farmers Edge,DataConnect PTx Trimble,Precision Planting Agtonomy,ISOBUS 主要市场渠道 深度集成经销商网络 经销商网络 第三方伙伴 分层技术经销商网络 区域性经销商网络 竞争壁垒 高(网络效应,高转换成本)中等(依赖伙伴质量,开放标准)新兴/颠覆性(盈利化技术/服务模式)市场专长(特定目标市场)资料来源:各公司官网,华泰研究 1)大型拖拉机:从动力单元到移动智能中枢大型拖拉机:从动力单元到移动智能中枢。拖拉机作为农场动力核心,高度依赖驾驶员实时操控。智能化升级后拖拉机可搭载高等级自动驾驶系统(如 John Deere AutoTrac),实现全天候无人化精准耕作,有效应对农业劳动力短缺,并精准匹配农时窗口。拖拉机还可实时执行变量深松/施肥等农艺指令(作业精度2.5cm)。最终通过车载物联网模块(如Case IH AFS Connect、AGCO AgCommand)持续回传设备工况、作业轨迹及土壤响应数据,构建农场数字孪生体基础数据库。免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。10 工业工业 图表图表11:传统拖拉机与智能化拖拉机性能对比传统拖拉机与智能化拖拉机性能对比 性能指标性能指标 传统(人工传统(人工操作操作)基线)基线 智能化系统表现智能化系统表现 关键关键提升指提升指标标 导航与自动驾驶 作业重叠率 5%-13%(农具宽度)1%-4%平均减少约 8.5%投入品节省(燃料、种子、农化产品)标准消耗 因重叠减少而降低 平均减少约 10%-15%;燃料最高可节省 20%整体田间效率 依赖操作员 优化路径与速度 平均提升约 20%土壤压实 随机交通模式 受控交通耕作 将压实限制在特定车道,保护种植区土壤结构 变量施用(VRA)肥料利用效率 全田统一费率 根据土壤潜力匹配施用量 提升约 15%-25%肥料成本 可能存在过量/不足施用 基于处方图优化 对条施的磷钾肥最高可节省约 30%完全自主作业 作业窗口 8-10 小时/天 16-24 小时/天 可用时长增加超过 100%劳动力需求 每台机器 1 名操作员 每组机群 0-1 名监控员 劳动力减少约 50%-70%停机时间 10%-15%5%-7%停机时间减少约 50%资料来源:Farmonaut,IPPM,麦肯锡,华泰研究 2)精量播种机:从均质播种到精准农艺执行器精量播种机:从均质播种到精准农艺执行器。播种机的传统局限主要体现在均一化播种模式忽略田块内土壤肥力、墒情空间异质性,导致资源错配。智能化升级主要为实现变量播种,通过多源数据驱动(基于土壤电导率图、历史产量图及遥感墒情数据生成播种处方图)、动态精准调控(行进间实时调节单粒播种速率(如 AGCO Precision Planting 技术),高产潜力区增密 15-20%,低产区降密 10-15%(据 CLAAS 田间试验数据),实现智能化升级,避免贫瘠区过度竞争(亩均节种 4-7kg),充分释放肥沃区增产潜力(高产田增产 8-12%),实现可量化的精准种植。图表图表12:播种机智能化后各项关键指标均有提升,种子使用更加节省,产量增加播种机智能化后各项关键指标均有提升,种子使用更加节省,产量增加 性能指标性能指标 传统(传统(人工操作)人工操作)基线基线 智能化系统表现智能化系统表现 关键提升指标关键提升指标 变量播种(VRS)种子使用 全田统一播种率 播种率适应产量潜力 在低潜力区节省种子约 2-3%产量响应 大部分区域种群次优 在高潜力区增加密度(15-20%)在高潜力区增产约 8-12%综合经济回报 基线盈利能力 优化的投入产出比 平均经济增益约 100 欧元/公顷(150 公顷农场)投资回报周期 取决于农场规模 对于 400 公顷的农场,通常在 1 个生长季内 自动下压力控制 播种深度一致性 因土壤变化而不一致 逐行实时调整,保持一致 避免因深度不均造成的产量损失(约为 6-22%)不当压力造成的产量影响 因压力过大/过小导致产量损失 自动维持最佳压力 避免 14.3 蒲/英亩(过轻)和 5.8 蒲/英亩(过重)的损失 资料来源:MDPI,Farmonaut,Crop Production Magazine,Precision Planting,华泰研究 3)联合收割机:从经验依赖型设备到实时决策中枢。)联合收割机:从经验依赖型设备到实时决策中枢。传统联合收割机作业质量依赖机手对30 参数的手动调节(滚筒转速、清选风速等),经验壁垒形成效率黑箱。智能化升级后实现 1)闭环自适应系统:实时监测籽粒损失率(0.8%)、含杂率(1.5%)等关键指标(如John Deere Harvest SmartTM系统)。并基于预设目标自动调节作业参数,降低人为失误导致的产量损失(较人工操作损失率减少 40%)。2)预测性效能优化:融合近端视觉与卫星影像数据,预判前方作物密度并动态调整行进速度(如 Case IH AFS Harvest Command),确保设备持续峰值效率运行。免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。11 工业工业 图表图表13:传统收割机与智能化收割机性能量化对比传统收割机与智能化收割机性能量化对比 性能指标性能指标 传统(人工传统(人工操作操作)基线)基线 智能化系统表现智能化系统表现 关键提升指标关键提升指标 闭环自适应系统 籽粒损失 常见为 2-4%,依赖操作员 自动调整以维持目标 损失比人工操作减少约 45%样品质量 因设置不当风险高 自动调整以保证籽粒质量 最大限度减少破碎粒;提高样品洁净度 预测性性能优化 吞吐量/生产力 速度保守以应对最差情况 前瞻性速度调整以匹配作物量 生产力提升约 20%;处理能力可达 75 吨/小时 整体效率 依赖操作员 优化以在峰值能力下运行 效率提升约 10%燃料消耗 随操作员习惯波动 优化的发动机负载 油耗降低约 11.2%数据生成(产量数据)整个田块的总产量 厘米级地理配准产量图 为下一季 VRA/VRS 处方图提供基础数据集 资料来源:John Deere 官网,Harvest Smart,Farmonaut,MDPI,华泰研究 全球农业无人化技术在耕全球农业无人化技术在耕/种种/收领域加速迈向规模化商用,美国在该领域显著领先。收领域加速迈向规模化商用,美国在该领域显著领先。美国在耕种收领域的无人农业机械商用方面处于领先地位,主要依托其以大田为主的农业特征以及较为先进的农机指控技术,北美 2024 年在自动农场设备市场中占据全球 51%的份额。例如农业科技服务商 Sabanto 在爱荷华州 Bellcock Farms 农场成功实施 500 英亩(约 3035亩)大豆田的全程无人化自主春播,为美国无人农场商业化提供有力实证。该项目以 235马力 JCB 拖拉机为载体,通过远程操控,集成 Climate FieldView 数据平台、DigiFarm 高精度 GPS 及 Precision Planting 播种设备,标志着技术从单点自动化迈入多平台协同阶段。该案例清晰表明,美国无人农业已全面进入商业化服务阶段,凭借核心技术、创新 FaaS模式及万英亩级测试积累的数据优势,在引领以无人化、智能化为核心的精准农业效率突破中占据全方位领先地位。图表图表14:北美北美 2024 年在自动农场设备市场中占据全球年在自动农场设备市场中占据全球 51%的份额的份额 资料来源:Precedence Research,华泰研究 智控智控/无人驾驶无人驾驶拖拉机等大型机械替代劳动力空间可观,渗透率提升核心在于降本。拖拉机等大型机械替代劳动力空间可观,渗透率提升核心在于降本。根据国家统计局数据,2023 年全国小型拖拉机数量为 1562.4 万台,大型拖拉机数量为 551 万台,按照拖拉机与机手 1:1 配比来看,目前全国有约 2000 万拖拉机机手,当前智控与无人驾驶拖拉机在国内渗透率极低,后续随着高标准农田建设 补贴向智控等方向倾斜,渗透率有望逐渐提升,解放可观数量的农村劳动力。我们认为当下智控拖拉机等大型机械无法快速放量的核心原因是价格较高,目前初级的智控技术主要搭配动力换挡拖拉机机型,同马力下售价预估为四轮驱动产品的 2-3 倍。后续智控版本大型机械成功降本有助于推动该产品迅速普及。免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。12 工业工业 图表图表15:2024 年年中央财政资金中央财政资金开始补贴动力换挡智控拖拉机(单位:元)开始补贴动力换挡智控拖拉机(单位:元)2021-2023 年年 2024-2026 年年 24 年较年较 21 年最高补贴变化年最高补贴变化 20 马力以下两轮驱动拖拉机 1800 1000-800 100 马力及以上两轮驱动拖拉机 24100 15300-8800 20 马力以下四轮驱动拖拉机 2100 1200-900 200 马力及以上四轮驱动拖拉机 63200 38600-24600 8090 马力四轮驱动动力换挡拖拉机 20600 180200 马力四轮驱动动力换挡拖拉机 55200 54000-1200 200 马力及以上四轮驱动动力换挡拖拉机 67200 72200 5000 100120 马力四轮驱动动力换挡智控拖拉机 28300 200 马力及以上四轮驱动动力换挡智控拖拉机 74700 资料来源:农业农村部办公厅,财政部办公厅,华泰研究 全球农机巨头积极布局智控大型机械,海外约翰迪尔全球农机巨头积极布局智控大型机械,海外约翰迪尔/凯斯纽荷兰凯斯纽荷兰/爱科,国爱科,国内一拖股份内一拖股份/中联重科均有明显进展中联重科均有明显进展 面对智能化浪潮,全球农机巨头正围绕“精准”、“无人”和“数据”三大支柱,加速战略面对智能化浪潮,全球农机巨头正围绕“精准”、“无人”和“数据”三大支柱,加速战略转型。转型。各厂商基于自身的市场地位、技术积累和战略愿景,展现出清晰且日趋分化的竞争路径。1)约翰迪尔(约翰迪尔(John Deere)为全球农机龙头,其无人化为全球农机龙头,其无人化战略核心在于打造高度垂直整合战略核心在于打造高度垂直整合的“闭环生态系统”的“闭环生态系统”。约翰迪尔精准农业与无人化方案的推进路径呈现渐进式特征,依托数十年自主研发积累与关键领域的战略性收购。如旗舰级“感知-执行”技术 See&Spray 深度集成自研喷药机、高精度摄像头与 AI 算法,可实现超 70%的靶向除草剂节省,显著提升农户投资回报。公司还接连收购 Blue River Technology(AI 视觉感知)、Bear Flag Robotics(自动驾驶改装)等关键企业,明确提出 2030 年实现完全自主农业生产的目标。2)凯斯纽荷兰)凯斯纽荷兰(CNH Industrial)通过收购与合作快速在通过收购与合作快速在 AI 农业农业生态方面进行追赶。生态方面进行追赶。凯斯纽荷兰斥巨资收购 Raven Industries 获得涵盖导航、控制与执行器的完整自主技术堆栈;在此基础上,通过多维度合作加速技术落地例如与 ASI Robotics 联合开发无驾驶室概念拖拉机,与以色列初创公司 Bluewhite 合作为特种作物(如果园)拖拉机提供后装自动驾驶套件,快速覆盖不同细分市场需求。数据与商业模式层面,其 AFS Connect 平台与约翰迪尔 Operations Center 形成直接竞争,提供车队管理、远程监控及数据管理等核心功能。3)爱科集团爱科集团(AGCO)核心是构建类似“安卓”的开放生态系统,主打跨品牌兼容与“后核心是构建类似“安卓”的开放生态系统,主打跨品牌兼容与“后装优先”(装优先”(retrofit-first)理念)理念。爱科的目标是打破单一品牌生态束缚,提供可在任意品牌设备上运行的先进技术。在精准农业与无人化领域,集团新成立的 PTx 品牌(整合原有Precision Planting 部门与 Trimble 合资公司)是战略执行的核心载体,旗舰产品 OutRunTM系统即为典型作为后装套件,该系统正被明确推广至竞争对手设备(包括市场保有量巨大的约翰迪尔 8R 系列拖拉机),直接挑战行业现有竞争格局。图表图表16:全球农机主要厂商战略概况比较全球农机主要厂商战略概况比较 战略维度战略维度 约翰迪尔约翰迪尔(John Deere)凯斯纽荷兰工业凯斯纽荷兰工业(CNH Industrial)爱科爱科(AGCO)战略目标 通过技术解锁超 1500 亿美元的潜在市场;大力发展 SaaS 的客户价值 到 2030 年将农业部门 EBIT 利润率提升至16-17%到 2029 年将 PTx 收入翻倍至超 20 亿美元;引领混合车队技术 技术发展路径 垂直整合 内部研发 合资与开放平台 自动化目标 到 2030 年实现完全端到端的生产系统 渐进式,从耕作开始;对完全自动化态度较谨慎 针对特定任务的可改装套件(如谷物车)商业模式 资料来源:华泰研究预测转向 SaaS/经常性收入(目标到 2030 年占销售额 10%)拒绝经常性收入;依赖硬件的前期利润 前期销售改装技术和组件 资料来源:John Deere 官网,CNH 官网,AGCO 官网,华泰研究 免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。13 工业工业 中国企业在智控拖拉机中国企业在智控拖拉机/收获机收获机等大型机械方面已有布局但尚未形成体系,道阻且长等大型机械方面已有布局但尚未形成体系,道阻且长,智控,智控拖拉机渗透率提升有望显著提升各公司盈利水平拖拉机渗透率提升有望显著提升各公司盈利水平。相较于约翰迪尔成熟的智慧农业技术生态,中国拖拉机企业的智控技术尚未形成体系,但一些关键技术已经取得了突破。根据农机新闻网,目前取得突破的智控技术主要集中在无人驾驶、路径规划和用户终端功能上,而针对农机互联系统、农业高精度专用传感器和智能播种系统的技术突破较少。各公司积极布局下智控大型农业机械渗透率有望不断提升 1)一拖股份:一拖股份:2021 年 10 月,东方红 LF2204 无驾型无人驾驶拖拉机问世,是国内第一款无驾驶室的无人驾驶拖拉机,具有自主知识产权,关键技术达到国际先进水平。一拖还成功开发 5G 的智能农机远程驾驶系统,该技术是中国一拖与河南移动联合开发的基于 5G 的智能农机远程驾驶系统,将 5G 技术与智能农机完美结合,打破了传统农机的操作限制,开启了智能农机远程驾驶的新纪元。2024 年公司投资近 4 亿元,启动实施智能多用途拖拉机能力提升等项目,持续进行智慧农机研发。2)中联重科:中联重科:中联重科进军农机后进展较快,2024 年公司农业机械收入 46.5 亿元,同 比增长 122.29%。公司成功研发出无人智能驾驶插秧机、AI 拖拉机、AI 小麦收获机等产品。后续将依托工程机械的制造优势不断研发大马力智能化农机。图表图表17:中国企业在智控拖拉机等大型机械方面已有布局中国企业在智控拖拉机等大型机械方面已有布局 资料来源:一拖股份,潍柴雷沃,超星智能等公司官网,华泰研究 应用领域应用领域研发企业研发企业技术突破技术突破一拖股份北斗 无人驾驶超星智能北斗农机自动驾驶系统潍柴雷沃作业智能监控 雷沃智能农事数字平台华测导航杂草AI图像识别技术一拖股份电控耕深系统一拖股份基于高精度农业地图的路径规划技术潍柴雷沃基于北斗的多传感器信息融合定位技术一拖股份东方红云APP(定位与作业统计、运维、调度)潍柴雷沃智农雷沃APP(作业监控、农机管理、无线连接)路径规划用户终端无人驾驶高效种植 免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。14 工业工业 管管:机器替人进行时,无人机等设备全力接管灌溉:机器替人进行时,无人机等设备全力接管灌溉/施肥施肥等环节等环节“管”环节“管”环节消耗农业生产消耗农业生产超超 50%人力人力,机械化程度仍然较低。,机械化程度仍然较低。“管”环节(田间管理/植保)机械化程度明显滞后,成为农业链条最薄弱环节。例如修剪、疏花疏果、套袋、除草、病虫害防治等精细作业高度依赖人工,根据 CropLife Foundation 数据,该环节消耗农业生产超 50%人力,是劳动力缺口的主要领域。此外,该环节依赖人工造成效率较低,作业质量与稳定性依赖个体经验,易引发农资施用不均等问题,造成资源浪费、环境污染、农残风险,并制约病虫害防控效果及产量潜力释放,构成提升农业生产效率的关键瓶颈。因此,“管”环节的机械化与智能化升级势在必行,为农业无人机等智能新装备提供了广阔发展空间。“管管”各个环节多场景可使用机械产品替人,无人机各个环节多场景可使用机械产品替人,无人机/智能灌溉智能灌溉/农农业无人车等为主要机械业无人车等为主要机械。田间管理/植保对应的“管”环节可使用地面的田间灌溉/施肥等设备与空中的无人机等。地面机械(如大型喷杆喷雾机、小型管理机、农业无人车)形态多样并率先应用,但其受限于地形适应性(如丘陵、山地、水田)、作物生长中后期压苗伤苗风险以及土壤压实问题,应用场景存在局限。农业无人机通过空中作业,有效突破地形与作物类型限制,实现全场景覆盖,作业效率远超人工(可达 40-60 倍)。同时,无人机通过精准定位与施药技术显著提升农药利用率,达成节水节药减排,并已从单一植保功能进化为集农情监测、植保/施肥、播种于一体的多功能平台,广泛覆盖田间管理多环节。无人机有效弥补了地面机械的不足,成为推动“管”环节机械化、智能化升级的核心解决方案。图表图表18:我国农业无人机主要应用场景我国农业无人机主要应用场景 图表图表19:极飞智慧水肥管理阀与农业无人车极飞智慧水肥管理阀与农业无人车 资料来源:36 氪研究院,华泰研究 资料来源:极飞官网,华泰研究 国内海外政策助力发展无人机等农业机械发展。国内海外政策助力发展无人机等农业机械发展。国内外政策持续加码,为农业无人机等智能农机产业高速发展提供强劲支撑。国内层面,2021 年“十四五”全国农业机械化发展规划明确将植保无人飞机等智能装备列为发展重点;财政支持上,农用无人驾驶航空器已全面纳入全国农机购置补贴范围,对个人和农业经营组织实行定额补贴(比例一般30%,部分薄弱环节及智能产品可达 35%),有效降低购置门槛并激发需求。海外主要农业国同样将精准农业技术提升至战略高度,美国 2019 年通过农业法案下的农场经营贷款、环保激励计划等为智能设备应用提供资金支持;欧盟 2023 年实施的新“共同农业政策”明确资助无人机等精准农业技术以提高资源效率;日本于 2019 年设立高额补助金(可达设备成本50%以上)并覆盖培训费用,大力推动无人机普及以应对老龄化。国内外政策共振,显著降低用户采纳成本,为农业无人机等产业扩张和技术迭代创造了有利环境。免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。15 工业工业 图表图表20:全球主要经济体农业无人机支持政策对比全球主要经济体农业无人机支持政策对比 区域区域 主要政策主要政策/法案名称法案名称 实施年份实施年份 支持方式支持方式 补贴对象补贴对象 核心支持环节核心支持环节/技术技术 关键指标关键指标与与特点特点 中国 农机购置与应用补贴实施意见 2021 直 接 购 置 补贴、定额补贴 农民、农业生产经营组织 农用无人驾驶航空器 补贴额测算比例不超过均价30%,短板机具可提至 35%美国 农业法案(Farm Bill)2019 低息贷款、项目资助、竞争性赠款 农业生产者 精准农业技术、资源保护实践 农场经营贷款最高$175 万,EQIP、CIG 项目提供资金支持 欧盟 共 同 农 业 政 策(CAP)2023 直接支付、项目资助 农民(特别是中小农场、青年农民)精准农业、农业生态创新、无人机监测 资金向可持续实践倾斜,支持技术创新 日本 智慧农业相关补助金 2019 直 接 购 置 补贴、项目资助 农户、农业经营体 智慧农业设备(含无人机)、技术培训 补助率可达 1/2 或更高,覆盖购机和培训费用 资料来源:中国农业农村部,美国国会,欧盟委员会,日本农林水产省,华泰研究 农业无人机海外和国内农业无人机海外和国内市场均市场均处于高速增长阶段处于高速增长阶段。全球农业无人机市场正处于高速增长阶段。根据 IMARC Group 预测,2024 年全球农业无人机达 27.1 亿美元市场规模,其预测2033 年将达 318.8 亿美元(CAGR=27.97%)。中国不仅是农业无人机全球主要制造基地,更是潜力巨大的终端市场。根据 Market Research Future 预测(基准 2024 年为 8.582 亿美元),中国农业无人机市场 2035 年有望达 117.4 亿美元(CAGR=26.8%)。这一庞大的国内市场有望为中国龙头厂商(如大疆、极飞)提供有力支撑。图表图表21:2024 年全球农业无人机达年全球农业无人机达 27.1 亿美元市场规模亿美元市场规模 图表图表22:中国农业无人机市场中国农业无人机市场 2035 年有望达年有望达 117.4 亿美元亿美元 资料来源:IMARC Group,华泰研究 资料来源:Market Research Future,华泰研究 农业无人机在“管”环节各细分领域(施肥、打药、巡田等)展现出应用的多样可能性及农业无人机在“管”环节各细分领域(施肥、打药、巡田等)展现出应用的多样可能性及广阔前景。广阔前景。细分场景一:精准施肥细分场景一:精准施肥突破农时与地形限制,提升肥料利用率。突破农时与地形限制,提升肥料利用率。农业无人机凭借其高效、精准、地形适应性强的特点,正深刻变革传统施肥模式,尤其是在特定农时和复杂地形条件下,其应用前景尤为广阔。以新疆冬小麦的融雪期追肥作业为例,传统地面机械在积雪融化期间难以进场,容易错过最佳施肥窗口。而农业无人机则可通过“融雪撒播”的方式,在不损伤幼苗、不压实土壤的前提下,将肥料均匀撒播在雪面,随雪水下渗至作物根部。此举不仅解决了特殊农时下的作业难题,确保了养分及时供给,更通过精准变量的播撒(亩用量控制在 8-10 公斤),显著提高了肥料利用率,为冬小麦的返青和增产奠定了坚实基础。我们认为,无人机在变量施肥、特定农时施肥(如返青肥、穗肥)等精细化作业场景中具备巨大潜力,能够显著提升肥料利用率,实现农业生产的降本增效与绿色发展。免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。16 工业工业 细分场景二:化学施药细分场景二:化学施药颠覆成本结构,解决高价值作物作业痛点。颠覆成本结构,解决高价值作物作业痛点。在化学除草与病虫害防治领域,农业无人机展现出颠覆性的成本与效率优势,特别是在高价值经济作物和复杂地形种植区,其替代人工与传统机械的趋势明确。以墨西哥龙舌兰种植园的除草作业为例,该作物种植环境复杂,传统人工作业面临效率低下(10 人团队每公顷需 1.5 小时)、人力成本高昂、农药接触存安全风险、耗水量大等多重难题,而拖拉机作业则存在灵活性差、易损伤植株的问题。引入农业无人机后,作业成本结构被彻底优化。数据显示,无人机作业的总成本为每公顷139.83美元,相较于拖拉机的200.11美元和人工作业的217.60美元,降幅分别达到 30%和 36%。其中,人力成本从人工的 57.14 美元骤降至 1.43 美元,优势极为突出。此外,无人机作业还显著提升了效率,帮助用户在雨季前完成施药,并大幅减少了用水量,实现了经济效益与环境效益的双赢。图表图表23:无人机作用于墨西哥龙舌兰种植无人机作用于墨西哥龙舌兰种植 图表图表24:大疆大疆 T60 播撒融雪肥均匀出料播撒融雪肥均匀出料 资料来源:大疆农业无人机行业白皮书(2023)(2024 年 7 月),华泰研究 资料来源:大疆农业无人机行业白皮书(2023)(2024 年 7 月),华泰研究 我们预计当前农业无人机渗透率约为我们预计当前农业无人机渗透率约为 5-10%,饱和值可达,饱和值可达 60%,当前当前有望进入有望进入 S 型增长曲型增长曲线中的线中的快速增长区间。快速增长区间。我们按照年度无人机作业面积/全球耕地总面积口径计算当前农业无人机渗透率。根据大疆农业无人机白皮书,2024 年大疆保有量 30 万台,按照其全球市场60%份额(Loyalty Drones 数据),预估全球农业无人机在 50 万台量级。根据全国农业技术推广服务中心数据,计算出单台农业无人机约可作业 600 公顷土地,按照平均作业复数2-4 次/一年,当前无人机年度覆盖土地面积当前可达 0.75-1.5 亿公顷,参照全球 15 亿公顷的可耕地总面积,当前农业无人机渗透率约为 5%-10%。饱和渗透预测方面,根据 FAO 和世界银行的数据推算,全球耕地中,大型农场占比约为 30%(以美国、加拿大、澳大利亚典型农场为主),其适用无人机比例为 90%;中型农场占比约为 40%(如中国中东部平原、东欧部分地区),其适用无人机比例为 70%;小型/丘陵/分散地块占比 30%(如南亚、非洲、东南亚等地区),其适用无人机比例为 15%。通过各类农场占比及无人机适用比例的加权平均计算,参照全球 15 亿公顷的可耕地总面积,我们可以推算出 2050 年全球农业无人机饱和渗透率约为 60%。依据技术采纳 S 曲线规律,近年有望进入快速增强区间。免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。17 工业工业 图表图表25:我们预计当前农业无人机渗透率约为我们预计当前农业无人机渗透率约为 5-10%,饱和值可达,饱和值可达 60%,当前有望进入,当前有望进入 S 型增长曲线中的快速型增长曲线中的快速增长区间增长区间 参数参数 数值数值 数据来源数据来源/假设假设 全球无人机当前渗透率估算全球无人机当前渗透率估算 1.全球农业无人机机队规模估算 500,000 台 基于大疆数据(30 万台)及其市场份额(60%)推算 2.平均单机年作业效率 约 600 公顷/台 基于全国农业技术推广服务中心 2021 年数据 3.年度作业总面积 约 3 亿公顷(1)(2)4.平均作业复数(假设)2-4 次/年 假设每个生长季对同一块土地进行多次作业 5.年度覆盖土地面积 约0.75-1.5亿公顷(3)/(4)6.全球可耕地总面积 15 亿公顷 根据 FAO,世界银行数据 数据当前渗透率 约约 5%-10%(5)/(6)全球无人机饱和渗透率预测全球无人机饱和渗透率预测 1.全球可耕地总面积 15 亿公顷 根据 FAO,世界银行数据 2.大型农场占比 70%美国、加拿大、澳大利亚、巴西等国典型大农场占比较高 3.中型农场占比 15%中国黄淮海、土耳其、墨西哥等地较为常见 4.小型/丘陵/分散地块占比 15%如中国西南丘陵、印度、非洲、东南亚等地区耕地零碎,坡度大等 5.饱和覆盖土地面积 约 8.93 亿公顷 基于(1)及各类农场无人机适用比例(大型70%,中型 60%,小型 10%)的合理增长假设进行测算 饱和市场渗透率饱和市场渗透率 约约 60%(5)/(1)资料来源:大疆农业无人机行业白皮书(2023)(2024 年 7 月),华泰研究 无人机替代劳动力人数有望从无人机替代劳动力人数有望从 2024 年千万级增长至年千万级增长至 2050 年亿级。年亿级。根据大疆农业无人机行业白皮书数据,无人机作业较拖拉机/人工作业分别实现 30%与 36%的总成本节约,其结构化优势体现于三大维度:(1)劳动力成本级差:)劳动力成本级差:自动化作业使人效成本较人工与拖拉机均降低 90%及以上,形成绝对替代优势;(2)能源成本重构:)能源成本重构:电力驱动实现燃料支出归零,较拖拉机作业产生根本性节省;(3)效率数量级跃迁:)效率数量级跃迁:以大疆 Agras T50 为例,单公顷耗时仅约为人工 1/50、拖拉机 1/6,小时作业能力达传统模式数十倍。根据 FAO 数据,全球从事基础农业生产的就业人数为 8.57 亿人。其中,从事作物耕种的人员比例约为 70%,即6 亿人。参照农业生产劳动量中管理环节占比约 50%的计算标准,管理环节涉及劳动人口数量约为 3 亿人。依据前文得出的渗透率计算结果推断,农业无人机在 2024 年可替代的劳动力规模约为 2000 万人。此后,这一替代规模将逐步增长,至 2035 年有望达 1.2 亿人,并最终于 2050 年达到约 1.8 亿人的替代规模。图表图表26:根据大疆农业无人机行业白皮书(根据大疆农业无人机行业白皮书(2023),各类农机以喷药作业为例运营成本对比),各类农机以喷药作业为例运营成本对比 成本项目成本项目(美元(美元/公顷)公顷)大疆农业无人机大疆农业无人机 拖拉机拖拉机 人工人工 无人机无人机 vs.人工节省比例人工节省比例 无人机无人机 vs.拖拉机节省比例拖拉机节省比例 人力成本 1.43 14.29 57.14 97.5.0%药剂成本 133.71 133.71 133.71-燃料成本 0.00 44.57 0.00-100.0%设备维护及折旧 1.83 1.83 0.00-其他费用 2.86 5.71 26.74 89.3I.9%总成本 139.83 200.11 217.60 35.70.1%资料来源:大疆农业无人机行业白皮书(2023)(2024 年 7 月),华泰研究 农业无人机中国厂商全球领先,大疆农业无人机中国厂商全球领先,大疆/极飞科技极飞科技为全球龙头为全球龙头 农业无人机农业无人机两大中国头部企业主导,全球份额较高两大中国头部企业主导,全球份额较高。中国企业凭借在消费级无人机领域积累的核心技术、强大供应链及规模成本优势,成功实现技术溢出与产业协同,迅速确立全球领导地位,产品覆盖超百个国家地区。根据观研报告网,国内植保无人机领域集中度较高,2022 年行业前五企业市场占比达 98.13%,形成两大头部企业主导的格局,大疆与极飞科技处于垄断地位,2022 年市场占比分别为 54.82%和 37.59%,合计超 9 成,已从技术、品牌、渠道、生态等领域构筑起极高行业壁垒。全球市场上中国企业份额同样较高。截至2022 年末,大疆的植保无人机全球累计保有量超 20 万台,覆盖 100 多个国家和地区;极飞科技业务已布局全球五大洲,产品与服务遍及 57 个国家和地区。免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。18 工业工业 图表图表27:2023 年全球无人机主要厂商中大疆与极飞领先,极飞专注于农业领域因此农业无人机地位比图中更高年全球无人机主要厂商中大疆与极飞领先,极飞专注于农业领域因此农业无人机地位比图中更高 资料来源:DroneIIs Drone Utilization Report(2023),华泰研究 大疆:大疆:全球农业无人机核心厂商全球农业无人机核心厂商之一之一,依托消费级领域积累的技术与生态优势,构建了“硬,依托消费级领域积累的技术与生态优势,构建了“硬件件 平台”的闭环解决方案。平台”的闭环解决方案。大疆产品体系包括:T 系列农业无人机承担喷洒/播撒核心作业,Mavic 3 多光谱版等机型提供农田测绘支持,配合“大疆智图”软件及“大疆农服”平台实现航线规划、AI 处方图生成及作业管理,形成“航测-分析-作业”全流程智能化闭环,显著提升作业精准度与效率。凭借强大的品牌、规模化生产及成本控制能力,大疆占据全球领先地位:根据大疆白皮书公告,截至 2024 年 6 月 30 日,其农业无人机全球保有量已超 30万台,累计作业面积逾 75 亿亩次。尽管未单独披露农业板块收入,根据头豹研究院数据,显示其 2023 年在中高端无人机市场(农业为主要组成部分)销售额约 80 亿元人民币,远超同业。庞大的用户基数和供应链优势进一步巩固其竞争壁垒。图表图表28:截至截至 2024 年年 6 月,大疆农业无人机全球累计作业月,大疆农业无人机全球累计作业 75 亿亩次,覆盖率较广亿亩次,覆盖率较广 资料来源:大疆农业无人机行业白皮书(2023),华泰研究 免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。19 工业工业 极飞极飞科技:专注于农业领域收入持续增长,发力海外空间广阔科技:专注于农业领域收入持续增长,发力海外空间广阔。极飞科技作为专注农业领域的核心厂商,聚焦打造专业、耐用的智能农机产品矩阵,并向“无人化农场”布局。其产品体系以 P 系列农业无人机(如 P150/P100 系列等)为核心,强调高载重、高作业效率及耐用性,并延伸至农业无人车、农机自驾仪、农业物联网设备等,构建覆盖田间管理多环节的解决方案。商业模式上,极飞曾采取积极定价策略推动市场渗透。根据其此前科创板招股书披露,公司营收呈现高速增长态势:2018 年 3.22 亿元、2019 年 3.57 亿元、2020年 5.30 亿元、2021 年上半年达 4.69 亿元。根据 2023/2024 年极飞科技年度大会 CEO 讲话内容,公司处于战略性投入期,研发支出高企以构筑技术壁垒及拓展产品线,尚未实现盈利。国际市场拓展成效显著,2022 年海外业务增速达 128%。极飞凭借对农业场景的深度理解及全生态布局,在国内与大疆形成双寡头格局,并持续推进全球化战略。图表图表29:极飞科技收入与农业无人机收入都处在快速上涨阶段极飞科技收入与农业无人机收入都处在快速上涨阶段 图表图表30:极飞科技极飞科技产品遍及全球产品遍及全球 70 个国家个国家和地区和地区 资料来源:极飞科技招股说明书,华泰研究 资料来源:极飞科技官网,华泰研究 风险提示风险提示 农业智能化发展不及预期:农业智能化发展依赖垂类大模型进度,相关领域数据可得性等一系列技术进展,且应用时需考虑使用者的价格接受程度,存在发展不及预期的可能性。农业无人机渗透率提升不及预期:农业无人机目前在部分小田仍应用较少,后续小田能否集中管理,无人机租用服务能否顺利将决定渗透率提升速度。本研报中涉及到未覆盖个股内容,均系对其客观公开信息的整理,并不代表本研究团队对该公司、该股票的推荐或覆盖。0 0,00020,00030,00040,00050,00060,0002018201920202021(1-6月)总收入农业无人机收入总收入YoY(右轴)农业无人机收入YoY(右轴)(万元)免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。20 工业工业 免责免责声明声明 分析师声明分析师声明 本人,倪正洋、樊俊豪,兹证明本报告所表达的观点准确地反映了分析师对标的证券或发行人的个人意见;彼以往、现在或未来并无就其研究报告所提供的具体建议或所表迖的意见直接或间接收取任何报酬。请注意,标*的人员并非香港证券及期货事务监察委员会的注册持牌人,不可在香港从事受监管活动。一般声明及披露一般声明及披露 本报告由华泰证券股份有限公司或其关联机构制作,华泰证券股份有限公司和其关联机构统称为“华泰证券”(华泰证券股份有限公司已具备中国证监会批准的证券投资咨询业务资格)。本报告所载资料是仅供接收人的严格保密资料。本报告仅供华泰证券及其客户和其关联机构使用。华泰证券不因接收人收到本报告而视其为客户。本报告基于华泰证券认为可靠的、已公开的信息编制,但华泰证券对该等信息的准确性及完整性不作任何保证。本报告所载的意见、评估及预测仅反映报告发布当日的观点和判断。在不同时期,华泰证券可能会发出与本报告所载意见、评估及预测不一致的研究报告。同时,本报告所指的证券或投资标的的价格、价值及投资收入可能会波动。以往表现并不能指引未来,未来回报并不能得到保证,并存在损失本金的可能。华泰证券不保证本报告所含信息保持在最新状态。华泰证券对本报告所含信息可在不发出通知的情形下做出修改,投资者应当自行关注相应的更新或修改。华泰证券(华泰证券(美国)有限公司除外)不是 FINRA 的注册会员,其研究分析师亦没有注册为 FINRA 的研究分析师/不具有 FINRA 分析师的注册资格。华泰证券力求报告内容客观、公正,但本报告所载的观点、结论和建议仅供参考,不构成购买或出售所述证券的要约或招揽。该等观点、建议并未考虑到个别投资者的具体投资目的、财务状况以及特定需求,在任何时候均不构成对客户私人投资建议。投资者应当充分考虑自身特定状况,并完整理解和使用本报告内容,不应视本报告为做出投资决策的唯一因素。对依据或者使用本报告所造成的一切后果,华泰证券及作者均不承担任何法律责任。任何形式的分享证券投资收益或者分担证券投资损失的书面或口头承诺均为无效。除非另行说明,本报告中所引用的关于业绩的数据代表过往表现,过往的业绩表现不应作为日后回报的预示。华泰证券不承诺也不保证任何预示的回报会得以实现,分析中所做的预测可能是基于相应的假设,任何假设的变化可能会显著影响所预测的回报。华泰证券及作者在自身所知情的范围内,与本报告所指的证券或投资标的不存在法律禁止的利害关系。在法律许可的情况下,华泰证券可能会持有报告中提到的公司所发行的证券头寸并进行交易,为该公司提供投资银行、财务顾问或者金融产品等相关服务或向该公司招揽业务。华泰证券的销售人员、交易人员或其他专业人士可能会依据不同假设和标准、采用不同的分析方法而口头或书面发表与本报告意见及建议不一致的市场评论和/或交易观点。华泰证券没有将此意见及建议向报告所有接收者进行更新的义务。华泰证券的资产管理部门、自营部门以及其他投资业务部门可能独立做出与本报告中的意见或建议不一致的投资决策。投资者应当考虑到华泰证券及/或其相关人员可能存在影响本报告观点客观性的潜在利益冲突。投资者请勿将本报告视为投资或其他决定的唯一信赖依据。有关该方面的具体披露请参照本报告尾部。本报告并非意图发送、发布给在当地法律或监管规则下不允许向其发送、发布的机构或人员,也并非意图发送、发布给因可得到、使用本报告的行为而使华泰证券违反或受制于当地法律或监管规则的机构或人员。本报告版权仅为华泰证券所有。未经华泰证券书面许可,任何机构或个人不得以翻版、复制、发表、引用或再次分发他人(无论整份或部分)等任何形式侵犯华泰证券版权。如征得华泰证券同意进行引用、刊发的,需在允许的范围内使用,并需在使用前获取独立的法律意见,以确定该引用、刊发符合当地适用法规的要求,同时注明出处为“华泰证券研究所”,且不得对本报告进行任何有悖原意的引用、删节和修改。华泰证券保留追究相关责任的权利。所有本报告中使用的商标、服务标记及标记均为华泰证券的商标、服务标记及标记。中国香港中国香港 本报告由华泰证券股份有限公司或其关联机构制作,在香港由华泰金融控股(香港)有限公司向符合 证券及期货条例及其附属法律规定的机构投资者和专业投资者的客户进行分发。华泰金融控股(香港)有限公司受香港证券及期货事务监察委员会监管,是华泰国际金融控股有限公司的全资子公司,后者为华泰证券股份有限公司的全资子公司。在香港获得本报告的人员若有任何有关本报告的问题,请与华泰金融控股(香港)有限公司联系。免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。21 工业工业 香港香港-重要监管披露重要监管披露 华泰金融控股(香港)有限公司的雇员或其关联人士没有担任本报告中提及的公司或发行人的高级人员。有关重要的披露信息,请参华泰金融控股(香港)有限公司的网页 https:/.hk/stock_disclosure 其他信息请参见下方“美国“美国-重要监管披露”重要监管披露”。美国美国 在美国本报告由华泰证券(美国)有限公司向符合美国监管规定的机构投资者进行发表与分发。华泰证券(美国)有限公司是美国注册经纪商和美国金融业监管局(FINRA)的注册会员。对于其在美国分发的研究报告,华泰证券(美国)有限公司根据1934 年证券交易法(修订版)第 15a-6 条规定以及美国证券交易委员会人员解释,对本研究报告内容负责。华泰证券(美国)有限公司联营公司的分析师不具有美国金融监管(FINRA)分析师的注册资格,可能不属于华泰证券(美国)有限公司的关联人员,因此可能不受 FINRA 关于分析师与标的公司沟通、公开露面和所持交易证券的限制。华泰证券(美国)有限公司是华泰国际金融控股有限公司的全资子公司,后者为华泰证券股份有限公司的全资子公司。任何直接从华泰证券(美国)有限公司收到此报告并希望就本报告所述任何证券进行交易的人士,应通过华泰证券(美国)有限公司进行交易。美国美国-重要监管披露重要监管披露 分析师倪正洋、樊俊豪本人及相关人士并不担任本报告所提及的标的证券或发行人的高级人员、董事或顾问。分析师及相关人士与本报告所提及的标的证券或发行人并无任何相关财务利益。本披露中所提及的“相关人士”包括FINRA 定义下分析师的家庭成员。分析师根据华泰证券的整体收入和盈利能力获得薪酬,包括源自公司投资银行业务的收入。华泰证券股份有限公司、其子公司和/或其联营公司,及/或不时会以自身或代理形式向客户出售及购买华泰证券研究所覆盖公司的证券/衍生工具,包括股票及债券(包括衍生品)华泰证券研究所覆盖公司的证券/衍生工具,包括股票及债券(包括衍生品)。华泰证券股份有限公司、其子公司和/或其联营公司,及/或其高级管理层、董事和雇员可能会持有本报告中所提到的任何证券(或任何相关投资)头寸,并可能不时进行增持或减持该证券(或投资)。因此,投资者应该意识到可能存在利益冲突。新加坡新加坡 华泰证券(新加坡)有限公司持有新加坡金融管理局颁发的资本市场服务许可证,可从事资本市场产品交易,包括证券、集体投资计划中的单位、交易所交易的衍生品合约和场外衍生品合约,并且是财务顾问法规定的豁免财务顾问,就投资产品向他人提供建议,包括发布或公布研究分析或研究报告。华泰证券(新加坡)有限公司可能会根据财务顾问条例第 32C 条的规定分发其在华泰证券内的外国附属公司各自制作的信息/研究。本报告仅供认可投资者、专家投资者或机构投资者使用,华泰证券(新加坡)有限公司不对本报告内容承担法律责任。如果您是非预期接收者,请您立即通知并直接将本报告返回给华泰证券(新加坡)有限公司。本报告的新加坡接收者应联系您的华泰证券(新加坡)有限公司关系经理或客户主管,了解来自或与所分发的信息相关的事宜。评级说明评级说明 投资评级基于分析师对报告发布日后 6 至 12 个月内行业或公司回报潜力(含此期间的股息回报)相对基准表现的预期(A 股市场基准为沪深 300 指数,香港市场基准为恒生指数,美国市场基准为标普 500 指数,台湾市场基准为台湾加权指数,日本市场基准为日经 225 指数,新加坡市场基准为海峡时报指数,韩国市场基准为韩国有价证券指数,英国市场基准为富时 100 指数,德国市场基准为 DAX 指数),具体如下:行业评级行业评级 增持:增持:预计行业股票指数超越基准 中性:中性:预计行业股票指数基本与基准持平 减持:减持:预计行业股票指数明显弱于基准 公司评级公司评级 买入:买入:预计股价超越基准 15%以上 增持:增持:预计股价超越基准 5%持有:持有:预计股价相对基准波动在-15%5%之间 卖出:卖出:预计股价弱于基准 15%以上 暂停评级:暂停评级:已暂停评级、目标价及预测,以遵守适用法规及/或公司政策 无评级:无评级:股票不在常规研究覆盖范围内。投资者不应期待华泰提供该等证券及/或公司相关的持续或补充信息 免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。22 工业工业 法律实体法律实体披露披露 中国中国:华泰证券股份有限公司具有中国证监会核准的“证券投资咨询”业务资格,经营许可证编号为:91320000704041011J 香港香港:华泰金融控股(香港)有限公司具有香港证监会核准的“就证券提供意见”业务资格,经营许可证编号为:AOK809 美国美国:华泰证券(美国)有限公司为美国金融业监管局(FINRA)成员,具有在美国开展经纪交易商业务的资格,经营业务许可编号为:CRD#:298809/SEC#:8-70231 新加坡:新加坡:华泰证券(新加坡)有限公司具有新加坡金融管理局颁发的资本市场服务许可证,并且是豁免财务顾问,经营许可证编号为:202233398E 北京北京 北京市西城区太平桥大街丰盛胡同28号太平洋保险大厦A座18层/邮政编码:100032 电话:86 10 63211166/传真:86 10 63211275 电子邮件:ht- 上海上海 上海市浦东新区东方路18号保利广场E栋23楼/邮政编码:200120 电话:86 21 28972098/传真:86 21 28972068 电子邮件:ht- 华泰证券股份有限公司华泰证券股份有限公司 南京南京 南京市建邺区江东中路228 号华泰证券广场1 号楼/邮政编码:210019 电话:86 25 83389999/传真:86 25 83387521 电子邮件:ht- 深圳深圳 深圳市福田区益田路5999 号基金大厦10 楼/邮政编码:518017 电话:86 755 82493932/传真:86 755 824920 62 电子邮件:ht- 华泰金融控股(香港)有限公司华泰金融控股(香港)有限公司 香港中环皇后大道中 99 号中环中心 53 楼 电话: 852-3658-6000/传真: 852-2567-6123 电子邮件: 华泰证券(美国)有限公司华泰证券(美国)有限公司 美国纽约公园大道 280 号 21 楼东(纽约 10017)电话: 212-763-8160/传真: 917-725-9702 电子邮件:Huataihtsc- 华泰证券(新加坡)有限公司华泰证券(新加坡)有限公司 滨海湾金融中心 1 号大厦,#08-02,新加坡 018981 电话: 65 68603600 传真: 65 65091183 版权所有2025年华泰证券股 份有限公司

    发布时间2025-08-15 22页 推荐指数推荐指数推荐指数推荐指数推荐指数5星级
  • 电子行业AI、AR眼镜系列报告(四):眼动追踪赋能智能眼镜助力人机交互体验-250814(17页).pdf

    请仔细阅读在本报告尾部的重要法律声明 眼动追踪赋能智能眼镜,助力人机交互体验 AI/AR 眼镜系列报告(四)眼动追踪眼动追踪实现“视线即交互的智能化控制”实现“视线即交互的智能化控制”眼动追踪是一种通过利用传感器,如红外摄像头来捕捉和分析眼球运动信息(眼球/瞳孔位置、瞳孔变化、虹膜角度、视线轨迹、角膜反射点),进而通过算法实时测量视线方向、注视点位置及眼动模式的技术。其核心在于将人眼的生理特征转化为可计算的数据,实现“视线即交互”的智能化控制。眼动追踪有望成为眼动追踪有望成为 XRXR 眼镜的核心交互方式之一眼镜的核心交互方式之一 眼动追踪为 XR 设备增添了新的交互手段,助推用户体验升级。眼动追踪技术与 XR 眼镜结合,可实现注视点渲染、身份验证、辐辏调节、瞳距调节、屈光矫正、人机交互、虚拟社交、健康监测等多种功能和应用,提升用户的使用体验。眼动追踪功能在 XR 眼镜上实现加速渗透。近两年已有多款头部XR 头显例如苹果 Vision Pro、Meta Aria Gen 2 等搭载眼动追踪模块。随着技术不断成熟及商业化落地,眼动追踪功能有望在更多机型上实现搭载,并逐步拓展至娱乐、医疗、工业、教育的多个下游应用领域。TobiiTobii 和七鑫易维领衔布局眼动追踪解决方案和七鑫易维领衔布局眼动追踪解决方案 Tobii:公司于 2010 年自研并发布了首款眼动追踪眼镜(不带显示),目前该产品已经迭代至第三代,眼动追踪精度可达0.6。与此同时,公司还与 HTC、Pico、HP、Sony 等客户合作,推出数款搭载眼动追踪技术的企业级/消费级的 VR 头显。七鑫易维:2016 年公司发布 VR 眼球追踪模组 aGlass,并逐步在HTC、Pimax、Pico、创维、Xreal 等产品实现搭载。2025 年 3 月公司推出 AI 智能眼镜原型机“小七”,眼动数据处理延迟低于5ms,眼动追踪精度为 0.2-1,体积小于 222mm,重量0.5g,并可实现双目追踪功耗仅 26.32mW30fps 的超低功耗。歌尔股份:歌尔在首届创新大会上推出高精度眼动追踪 AR 智能眼镜。采用双相机多光源方案 先进眼动算法,实现全眼域眼动追踪,平均准确度可达 0.5,算法响应延迟小于 3ms。投资建议投资建议 眼动追踪有望成为 XR 眼镜的核心交互方式之一,实现“视线即交互”的智能化控制,有望在 XR 眼镜上实现加速渗透,助推用户体验升级。相关受益标的:1)方案商:Tobii、七鑫易维(未上市)、歌尔股份;2)摄像头模组:炬光科技、豪威集团。风险提示风险提示 新技术发展不及预期,XR 设备出货不及预期。评级及分析师信息 行业评级:推荐 行业走势图 分析师:单慧伟分析师:单慧伟 邮箱: SAC NO:S1120524120004 联系电话:分析师:陈天然分析师:陈天然 邮箱: SAC NO:S1120525060001 联系电话:-5%5&6G 24/082024/112025/022025/052025/08消费电子沪深300证券研究报告|行业动态报告 仅供机构投资者使用 Table_Date 2025 年 08 月 14 日 证券研究报告|行业动态报告 请仔细阅读在本报告尾部的重要法律声明 2 正文目录 1.眼动追踪实现“视线即交互”的智能化控制.3 2.眼动追踪有望成为 XR眼镜的核心交互方式之一.5 2.1.眼动追踪赋能 XR 眼镜,助推用户体验升级.5 2.2.各大厂商纷纷布局,眼动追踪有望加速落地.8 3.主要厂商.11 3.1.Tobii.11 3.2.七鑫易维.12 3.3.歌尔股份.14 4.投资建议.15 5.风险提示.15 图表目录 图 1 眼动追踪原理图(瞳孔角膜反射法).4 图 2 MEMS 方案 PD接收信号示意图.4 图 3 IR PD 方案信号输入和注视位置输出示意图.4 图 4 眼动追踪在 XR眼镜的应用.5 图 5 注视点渲染.6 图 6 虹膜识别.6 图 7 辐辏调节-动态变焦调节景深.6 图 8 瞳距调节-可实现 59-68mm 瞳距调节.7 图 9 屈光矫正-针对屈光度调节变焦显示器.7 图 10 意图识别-AI 根据注视点进行对应分析.7 图 11 视线操控-图标跟随视线呈现 3D 凸起状态.7 图 12 虚拟社交-眼神交流减少恐怖谷效应.8 图 13 健康监测-实现视觉健康及认知健康检测.8 图 14 苹果 Vision Pro 交互传感器方案-外侧.10 图 15 苹果 Vision Pro 交互传感器方案-内侧.10 图 16 苹果 Vision Pro 可实现双目独立电驱自动无极 IPD调节.10 图 17 Meta Aria Gen2.10 图 18 Tobii Pro Glasses 3.11 图 19 Tobii 主要合作伙伴.11 图 20 眼动追踪的人群覆盖度.12 图 21 Tobii 的 G2OM算法.12 图 22 Tobii 与豪威集团合作开发眼动追踪方案.12 图 23 七鑫易维合作伙伴.13 图 24 七鑫易维 XR眼动追踪方案优势.13 图 25 七鑫易维 XR眼动追踪方案合作案例.13 图 26 七鑫易维 AI/AR眼球追踪解决方案.14 图 27 歌尔股份眼动追踪解决方案.14 表 1 眼动追踪主要方案.3 表 2 搭载眼动追踪方案的主要产品.8 表 3 相关受益标的.15 WUPXvMxOmMqRvNpNvMmMtQaQ9RaQmOmMpNmRkPnNzRlOrQqNaQrRzQNZnRqPvPpPqP 证券研究报告|行业动态报告 请仔细阅读在本报告尾部的重要法律声明 3 1.1.眼动追踪眼动追踪实现“视线即交互”的智能化控制实现“视线即交互”的智能化控制 眼动追踪(眼动追踪(Eye TrackingEye Tracking):):是一种通过利用传感器,如红外摄像头来捕捉和分析眼球运动信息(眼球/瞳孔位置、瞳孔变化、虹膜角度、视线轨迹、角膜反射点),进而通过算法实时测量视线方向、注视点位置及眼动模式的技术。其核心在于将人眼的生理特征转化为可计算的数据,实现“视线即交互”的智能化控制。目前眼动追踪方案主要包含瞳孔角膜反射法、视网膜影像定位法、重建三维模型法、视网膜反射光强度法(光电方案)、角膜反射光强度法(MEMS 方案)。表 1 眼动追踪主要方案 方案方案 原理原理 关键器件关键器件 代表厂家代表厂家 优劣势优劣势 瞳孔角膜反射法 通过角膜中心和瞳孔中心的连线来进行眼动追踪。IR 图像传感器、红外光源 Magic Leap、Digilens、Tobii、SMI、Apple、索尼、七鑫易维等 方案成熟,单光源方案精度略有下降 DVS 图像传感器、红外光源 暂无代表厂家-视网膜影像法 通过计算视网膜上的血管、中央凹、视盘、黄斑等生理特征的变化,可以获取眼球运动和注视方向。光波导 Magic leap、Lumus、三星 医疗领域常用 重建三维模型法 利用结构光或者光场相机实时对眼球重建为三维模型,通过计算眼球三维模型获取眼球的运动方向 结构化发光器/光场相机 Facebook 功耗高、成本高 视网膜反射光强度 激光透过角膜、瞳孔、晶状体,打在视网膜上,通过检测视网膜反射光强度以确定眼球运动的方向。光电传感器、红外光激光器、透镜 Facebook、Lumus 体积小、功耗低、成本低 但技术尚未成熟、精度低 IR LED/白炽光源、光电传感器、温度传感器 Inseye 角膜反射光强度 通过激光 二维振镜扫描整个眼睛,通过 PD 的时域信息和振镜角度可以计算出角膜中心的位置,再通过核心控制器,反推眼睛的注视位置。红外光激光器、二维振镜、光电传感器 AdHawk、微软、华为等 体积小、功耗低、成本低 但技术尚未成熟、精度低 资料来源:S-Dream Lab,映维网,艾邦 VR 产业资讯,华西证券研究所 当前应用较多且较为成熟的眼动追踪方案为瞳孔角膜反射法(以当前应用较多且较为成熟的眼动追踪方案为瞳孔角膜反射法(以 TobbiTobbi 为主导)。为主导)。该方案主要由眼动摄像机、红外光源和算法共同完成。其原理为:光源发射红外光在眼角膜反射形成闪烁点,由眼动摄像机捕捉眼睛的高分辨率图像,再通过算法解析,实时定位闪烁点与瞳孔的位置,最后借助模型估算出用户的视线方向和落点。证券研究报告|行业动态报告 请仔细阅读在本报告尾部的重要法律声明 4 图 1 眼动追踪原理图(瞳孔角膜反射法)资料来源:Tobbi,VR 陀螺,映维网,华西证券研究所 与此同时,非视觉方案也正在持续推进。与此同时,非视觉方案也正在持续推进。1 1)MEMSMEMS 方案(角膜反射光强度法):方案(角膜反射光强度法):该技术主要起源于加拿大初创公司 Adhawk。其原理为由 Laser/VCSEL 发射红外光,MEMS 振镜实现对眼部区域二维扫描,多个 PD 光电传感器检测经过角膜反射的红外光强度信号,对角膜(强光反射)和瞳孔(弱光反射)特征进行检测。其优点在于体积小、采样频率高、硬件及算法功耗低;缺点在于技术方案及供应链不成熟、稳定性和精准度不足。2 2)IR PDIR PD 方案(视网膜反射光强度法):方案(视网膜反射光强度法):该技术来源于美国初创公司 Ineye。其原理为 IR LED/白炽灯照亮指定区域,光电传感器检测选择区域的反射强度,同时配备温度传感器进行温漂补偿,进而建立眼睛位置与 PD 检测信号强度之间的多项式映射关系,并通过个体参数标定确定。其优点在于体积小、功耗低、成本低;缺点在于技术方案尚不成熟、精准度仍有待测试。图 2 MEMS 方案 PD 接收信号示意图 资料来源:S-Dream Lab,华西证券研究所 图 3 IR PD 方案信号输入和注视位置输出示意图 资料来源:S-Dream Lab,华西证券研究所 眼球追踪模块由若干眼动摄像头、光源、算法构成光源发射红外光,在眼角膜反射形成闪烁点眼动摄像机捕捉眼镜的高分辨率图像,包括闪烁点图像通过算法解析,实时定位闪烁点与瞳孔的位置,借助模型估算出用户的视线方向和落点红外光源红外光源摄像头 证券研究报告|行业动态报告 请仔细阅读在本报告尾部的重要法律声明 5 2.2.眼动追踪有望成为眼动追踪有望成为 XRXR 眼镜的核心交互方式之一眼镜的核心交互方式之一 2.1.2.1.眼动追踪赋能眼动追踪赋能 XRXR 眼镜,助眼镜,助推用户体验升级推用户体验升级 眼动追踪为眼动追踪为 XRXR 设备增添了新的交互手段,助推用户体验升级。设备增添了新的交互手段,助推用户体验升级。眼动追踪技术与XR 眼镜结合,可实现注视点渲染、身份验证、辐辏调节、瞳距调节、屈光矫正、人机交互、虚拟社交、健康监测等多种功能和应用,提升用户的使用体验。图 4 眼动追踪在 XR 眼镜的应用 资料来源:Tobii Eyetracking,VR 陀螺,创维 VR 玩家,天蝎科技,艾邦 VRAR 网,华西证券研究所 注视点渲染:早期注视点渲染:早期 XRXR 设备搭载眼动追踪的主要目的,就是通过基于眼动追踪的设备搭载眼动追踪的主要目的,就是通过基于眼动追踪的注视点渲染技术,实现注视点渲染技术,实现 XRXR 设备系统资源的优化。设备系统资源的优化。伴随着 VR 设备分辨率及视场角的提升,全画幅的高清渲染对算力提出了极高的要求。采用注视点渲染就可以仅对用户注视的中心区域进行高精度渲染,而对其他区域进行低分辨率渲染,在降低 GPU 着色负载的同时保持高帧率,进而更好配置有限的算力资源,让用户获得出色体验。据VR 陀螺,在 Pico Neo 3 Pro Eye 的硬件环境下,Tobii 的动态注视点技术 Tobii Spotlight 能将帧率提高 78%,一体机能耗降低 10%。身份验证:由于虹膜特征具备唯一性、稳定性和高安全性。眼动追踪身份验证:由于虹膜特征具备唯一性、稳定性和高安全性。眼动追踪 虹膜识别虹膜识别可以实现账号登录、虹膜支付等功能。可以实现账号登录、虹膜支付等功能。通过搭载虹膜识别算法,眼动追踪可以实现单设备、多用户的差异化账户配置。即不同的用户戴上 XR 设备时,系统可以匹配并调用该用户的账户信息、偏好设置和应用数据,提升 XR 设备使用的安全性和便捷性。证券研究报告|行业动态报告 请仔细阅读在本报告尾部的重要法律声明 6 图 5 注视点渲染 图 6 虹膜识别 资料来源:Tobii Eyetracking,华西证券研究所 人机适配:用户个体之间存在差异,通过眼动追踪可以实现辐辏调节、瞳距调人机适配:用户个体之间存在差异,通过眼动追踪可以实现辐辏调节、瞳距调节、屈光矫正等功能,使得产品与用户实现更好的适配,提升用户的使用体验。节、屈光矫正等功能,使得产品与用户实现更好的适配,提升用户的使用体验。1)辐辏调节:辐辏调节:当前的 XR 设备经常存在视觉辐辏调节冲突(VAC),即在长时间的 XR 环境中,由于用户眼睛的调节或聚集状态被 XR 设备光学系统驱动到了一个固定的距离,导致双眼视差与眼睛的聚散调节不一致,进而会导致用户人眼疲劳,甚至是恶心和头痛。加入眼动追踪后,一方面其可以用于模拟景深,实现用户眼睛焦平面之外的物体的模糊;另一方面通过配合变焦显示器,可以实现动态变焦,使得焦深与用户眼睛到物体的虚拟距离相匹配,实现沉浸式体验。2)瞳距调节:瞳距调节:XR 佩戴时,如果用户的双眼瞳孔中心、透镜中心、屏幕中心不在同一条直线,就容易出现重影、头晕、恶心等症状,因此需要进行瞳距(IPD)调节,使双眼瞳距和 XR 设备匹配。相较于手动 IPD 调节,基于眼动追踪的自动 IPD 调节更加精准。通过眼动追踪,XR 设备可以精准测量用户的 IPD,并通过系统自动调节镜头和显示器,使其自动适配人眼的最佳观看位置,让用户获得更加舒适的视觉效果。3)屈光矫正:屈光矫正:眼动追踪系统可捕获视网膜上不同视觉深度图像的反射光影像,然后通过图像处理算法确定用户的光学屈光度处方,最后通过搭配变焦显示器即可投射适应用户眼球屈光度的影像,使得智能眼镜可以更好的适配近视/远视等人群。图 7 辐辏调节-动态变焦调节景深 资料来源:VR 陀螺,华西证券研究所 证券研究报告|行业动态报告 请仔细阅读在本报告尾部的重要法律声明 7 图 8 瞳距调节-可实现 59-68mm 瞳距调节 图 9 屈光矫正-针对屈光度调节变焦显示器 资料来源:创维 VR 玩家,华西证券研究所 人机交互:眼动追踪不仅可以提升人机交互:眼动追踪不仅可以提升 XRXR 设备的交互效率和准确性,还可以作为辅设备的交互效率和准确性,还可以作为辅助交互的手段,代替手柄实现简易操作。助交互的手段,代替手柄实现简易操作。1)意图识别:意图识别:在利用 AI/AR 眼镜搭载的前置摄像头进行多模态交互时,由于传统的图像识别场景中缺乏准确的指令,AI 会将眼前所有的信息进行分析并一一列举,用户体验感较差。而眼动追踪模式下,AI 无需分析整个画面内容,而是通过聚焦眼睛注视点所在的重点区域直接进行分析,实现真正的“所见即所需”,显著提升设备的交互效率和准确性,同时降低延迟和功耗。2)视线操控:视线操控:眼动追踪的交互模式下,用户可以通过视线移动来实现菜单控制、页面选择、上下文翻页等操作。此外,在 VR 游戏中眼动追踪交互还可以代替传统手柄,实现视角切换和游戏互动,增强用户的沉浸感。图 10 意图识别-AI 根据注视点进行对应分析 图 11 视线操控-图标跟随视线呈现 3D 凸起状态 资料来源:VR 陀螺,华西证券研究所 虚拟社交:虚拟社交:用户社交存在感的重要标志之一是生动而真实的“眼神”交流。眼动追踪通过模拟自然的目光接触和眼部运动,可以实现有效沟通和更强的真实存在感,减少“恐怖谷”(Uncanny Valley)效应。健康监测:眼球运动与大脑神经功能具有深度关联性,眼动追踪技术可以进行健康监测:眼球运动与大脑神经功能具有深度关联性,眼动追踪技术可以进行视觉健康和认知健康检测。视觉健康和认知健康检测。眼球运动由前额叶皮层、顶叶、基底节等区域协同控制,若发生神经退行性疾病(如阿尔茨海默病、帕金森病)和精神疾病(如精神分裂症)时,上述脑区将容易受损,进而导致眼动模式异常。眼动追踪技术能够进行视觉健康检测和认知健康检测,例如:监督用户用眼时长、距离、疲劳度等,进行近视、弱视、证券研究报告|行业动态报告 请仔细阅读在本报告尾部的重要法律声明 8 斜视的预防检测;以及检测认知障碍,例如儿童多动症、自闭症;老年人认知障碍、老年痴呆;成年人抑郁症、精神分裂等。图 12 虚拟社交-眼神交流减少恐怖谷效应 图 13 健康监测-实现视觉健康及认知健康检测 资料来源:VR 陀螺,华西证券研究所 资料来源:VR 陀螺,华西证券研究所 2.2.2.2.各大厂商纷纷布局,眼动追踪有望加速落地各大厂商纷纷布局,眼动追踪有望加速落地 眼动追踪功能在眼动追踪功能在 XRXR 眼镜上实现加速渗透。眼镜上实现加速渗透。近两年已有多款头部 XR 头显例如苹果 Vision Pro、Meta Aria Gen 2 等搭载眼动追踪模块,致力于提升用户体验。随着技术不断成熟及商业化落地,眼动追踪功能有望在更多机型上实现搭载,并逐步拓展至娱乐、医疗、工业、教育的多个下游应用领域。表 2 搭载眼动追踪方案的主要产品 品牌品牌 产品产品 发布发布/上市时间上市时间 VR PICO PICO G2 4K 眼球追踪一体机 2019 年 3 月 爱奇艺 爱奇艺奇遇 2S 眼球追踪一体机 2019 年 5 月 HTC VIVE Pro Eye 2019 年 6 月 HTC VIVE Cosmos 2019 年 10 月 varjo Varjo VR-2 Pro 2019 年 10 月 varjo Varjo XR-1 开发者版 2019 年 12 月 StarVR StarVR One 2020 年 4 月 varjo Varjo VR-3 2021 年 1 月 HP HP Reverb G2 Omnicept Edition 2021 年 5 月 PICO PICO Neo3 企业版 2021 年 5 月 PICO PICO Neo 3 Pro/Pro Eye 2021 年 5 月 HTC VIVE Focus 3 2021 年 6 月 小派 Pimax Reality 12K QLED 2021 年 10 月 VIVE VIVE Flow 2021 年 11 月 varjo Varjo Aero 2022 年 1 月 创维 创维 PANCAKE 1Pro 2022 年 7 月 创维 创维 PANCAKE 1 2022 年 7 月 Oculus Oculus Quest pro 2022 年 10 月 varjo Varjo XR-3 Focal Edition 2022 年 11 月 PICO Pico 4 Pro 2022 年 11 月 HTC VIVE XR 精英套装 2023 年 1 月 索尼 PlayStation VR2 2023 年 2 月 小派 Crystal 2023 年 5 月 Ajna Lens Ajna XR Enterprise 2023 年 6 月 Immersed Immersed Visor 2023 年 8 月 证券研究报告|行业动态报告 请仔细阅读在本报告尾部的重要法律声明 9 Ajna Lens Ajna XR 2023 年 8 月 Ajna Lens Ajna XR Pro 2023 年 8 月 Ajna Lens Ajna XR Pro SE 2023 年 8 月 varjo Varjo XR-4 Series 2023 年 11 月 创维 创维 4K MR 眼镜 2024 年 1 月 苹果 Apple Vison Pro 2024 年 2 月 小派 Crystal Super 2024 年 4 月 Somnium Space Somnium Space VR One 2024 年 6 月 PICO Pico 4 Enterprise 2024 年 9 月 HTC VIVE Focus Vision 2024 年 10 月 小派 Dream Air 2024 年 12 月 大朋 VR DPVR P2 Vision 2025 年 2 月 小派 Dream Air SE 2025 年 5 月 玩出梦想科技 玩出梦想 MR 一体机 2025 年 6 月 小派 Crystal super 2025 年 7 月 大朋 VR DPVR P2 Vision 2025 年 7 月 Bigscreen Beyond 2e 2025 年 7 月 AR 七鑫易维 aGlass 系列智能眼镜 2016 年 11 月 Pupil Neon Pupil Invisible 2019 年 1 月 Ganzin Technology 佐臻 J7EF Gaze AR 智能眼镜 2021 年 12 月 Meta Meta Orion 2024 年 9 月 Meta Meta Aria Gen 2 2025 年 2 月 秋果计划 Wigain Omnision 眼镜 2025 年 7 月 歌尔 歌尔高精度眼动追踪 AR 智能眼镜 2025 年 7 月 AI 眼镜 智通华宇 SOL 眼动追踪眼镜 2024 年 11 月 七鑫易维 小七 2025 年 3 月 Sesame Sesame AI 眼镜 2025 年 4 月 Ganzin Technology Ganzin Gaze2AI 2025 年 7 月 资料来源:VR52 网,VR 陀螺,艾邦 VRAR 网,华西证券研究所 苹果:苹果:20232023 年年 6 6 月月 6 6 日,苹果在日,苹果在 WWDCWWDC 大会正式发布大会正式发布 Apple Vision ProApple Vision Pro。该产品通过搭载多个摄像头及传感器来实现手势识别 眼动追踪的功能。其中据 VR 陀螺数据,相较于 Quest Pro、PS VR2 等产品左右眼各配备 1 颗摄像头,Vision Pro 眼镜内部左右眼各配备 2 颗 IR 摄像头来实现眼动追踪的功能,在保障追踪精度的同时,还能用于测算双眼瞳深,进而完善预畸变算法以实现更好的画面显示效果。并且借助眼动追踪技术,Vision Pro 还可实现双目独立电驱自动无极 IPD 调节。除此之外,为了让眼动追踪交互能够正常响应,苹果还在 UI 层面提供底层级别的视觉反馈。比如用户视线扫过某个 APP 图标时,会出现相应的 3D 效果;用户查看菜单栏时,会有相应的光流效果。与此同时,据彭博社 Mark Gurman,Apple 还正在为 Vision Pro 开发眼动滚动的功能,可通过上下移动眼睛来滚动浏览应用程序。证券研究报告|行业动态报告 请仔细阅读在本报告尾部的重要法律声明 10 图 14 苹果 Vision Pro 交互传感器方案-外侧 图 15 苹果 Vision Pro 交互传感器方案-内侧 资料来源:AR 圈,华西证券研究所 资料来源:AR 圈,华西证券研究所 图 16 苹果 Vision Pro 可实现双目独立电驱自动无极 IPD 调节 资料来源:AR 圈,华西证券研究所 MetaMeta:20252025 年年 2 2 月,月,MetaMeta 宣布推出实验性智能眼镜宣布推出实验性智能眼镜 Aria Gen2Aria Gen2。该产品通过搭载 4 颗 CV 摄像头和 2 颗眼动追踪摄像头来实现手势识别 眼动追踪的功能。其中,在眼动追踪功能方面,Aria Gen2 可以追踪每只眼睛的注视、辐辏点、眨眼检测、瞳孔中心估计、瞳孔直径和角膜中心等信息。相关信号有助于深入理解佩戴者的视觉注意力和意图,为人机交互带来全新可能性。图 17 Meta Aria Gen2 资料来源:XR 控,华西证券研究所 证券研究报告|行业动态报告 请仔细阅读在本报告尾部的重要法律声明 11 3.3.主要厂商主要厂商 3.1.Tobii3.1.Tobii TobiiTobii 成立于成立于 20012001 年,年,20152015 年在瑞典上市,是全球领先的眼动追踪技术解决方年在瑞典上市,是全球领先的眼动追踪技术解决方案提供商。案提供商。公司于 2010 年自研并发布了首款眼动追踪眼镜(不带显示),目前该产品已经迭代至第三代,眼动追踪精度可达 0.6。此外,公司还与 HTC、Pico、HP、Sony 等客户合作,推出数款搭载眼动追踪技术的企业级/消费级的 VR 头显。图 18 Tobii Pro Glasses 3 图 19 Tobii 主要合作伙伴 资料来源:Tobii 官网,华西证券研究所 资料来源:Tobii 官网,华西证券研究所 技术布局:技术布局:1、动态注视点渲染:动态注视点渲染:基于 20 年的眼动追踪技术创新和积累,Tobii 打造了 XR眼动追踪的核心技术动态注视点渲染,该技术充分利用人眼的生理机制,通过仅仅渲染用户的视觉焦点所在区域降低对设备的算力需求和功耗,充分释放硬件性能。2、动态畸变补偿:动态畸变补偿:Tobii 利用眼动追踪技术,可通过入瞳位置瞳孔在三维空间中的具体位置,来解决光学镜头畸变产生的扭曲效果及瞳孔游移问题,减轻用户在使用 XR 设备时可能感受到的恶心和失衡感,改善用户体验。3、扩大人群覆盖率:扩大人群覆盖率:消费级 XR 设备需要考虑千百万用户中可能出现的不同情况,比如眼睑下垂、化妆品覆盖眼部重要特征、佩戴框架眼镜和隐形眼镜、具有弱势眼或优势眼、以及因不同种族而有的眼部特征差别等各类复杂情况。因此,若想眼动追踪技术可以在消费级设备上实现大面积推广,眼动追踪的人口覆盖率需要达到 95%甚至 99%。目前,Tobii 的技术方案在这一指标上处于领先地位。4、推出推出 G2OMG2OM 算法:算法:Tobii 推出一种对象选择算法G2OM 算法,可以根据眼动数据的输入和虚拟场景的内容更加准确预测用户正在看什么,进而在已有的眼动信号性能上提升交互应用层面的准确度。5、布局冷铸造工艺:布局冷铸造工艺:Tobii 并购了一家专门做冷铸造工艺的瑞士光学公司。通过冷铸造工艺,可将眼球追踪器件直接嵌入到镜片里面,实现眼镜的高度整合和轻量化。目前公司正在与国内外 XR 大厂开展相关的预研项目。证券研究报告|行业动态报告 请仔细阅读在本报告尾部的重要法律声明 12 图 20 眼动追踪的人群覆盖度 图 21 Tobii 的 G2OM 算法 资料来源:VR 陀螺,华西证券研究所 资料来源:AR 圈,华西证券研究所 产业合作:产业合作:20222022 年年 1 1 月,月,TobiiTobii 宣布与豪威集团合作共同宣布与豪威集团合作共同开发眼动追踪方案,也是业内第一个基于 BSI 全局快门(GS)传感器系列的眼动追踪方案。该解决方案采用了豪威集团用于眼动追踪的超小摄像头模块 OC0TA,在近红外(NIR)和快门效率方面具有新的高性能优势,可显著提高 XR 消费级产品的开发时间。20252025 年年 5 5 月,月,TobiiTobii 宣布与宣布与 PropheseeProphesee 合作共同开发面向下一代合作共同开发面向下一代 AR/VRAR/VR 头显和智能眼镜的眼动追踪头显和智能眼镜的眼动追踪技术。技术。该解决方案采用了 Prophesee 基于事件的传感器技术,可以实现低功耗、低延迟、低数据传输,可以更好的与眼睛形态融合,提升用户使用体验。图 22 Tobii 与豪威集团合作开发眼动追踪方案 3.2.3.2.七鑫易维七鑫易维 北京七鑫易维科技有限公司(北京七鑫易维科技有限公司(7invensun7invensun)成立于)成立于 20092009 年,持续专注于眼球追年,持续专注于眼球追踪技术的研发、创新和应用,拥有完全自主知识产权。踪技术的研发、创新和应用,拥有完全自主知识产权。作为眼动追踪技术领域的全球知名品牌,公司产品覆盖眼动分析、XR 眼动、沟通辅具等应用领域,已服务科研 证券研究报告|行业动态报告 请仔细阅读在本报告尾部的重要法律声明 13 教育、空间计算(XR)、医疗健康、能源交通、航空航天等领域的 1000 余家标杆客户,并为多个国家级重点项目提供国产自主的眼动分析解决方案。与此同时,公司还获得高通、英伟达、腾讯等巨头认可,建立长期生态合作伙伴关系。图 23 七鑫易维合作伙伴 VRVR 眼动追踪方面:眼动追踪方面:2016 年公司发布 VR 眼球追踪模组 aGlass,率先实现了注视点渲染、眼控交互和眼动数据分析三大“黑科技”,并逐步在 HTC、Pimax、Pico、创维、Xreal 等产品实现搭载,具备适配性强,交互自然、准确度高(0.5)、采样率高(60-380Hz)、追踪范围广、可用率高、跨平台支持、集成简单的优点。图 24 七鑫易维 XR 眼动追踪方案优势 图 25 七鑫易维 XR 眼动追踪方案合作案例 证券研究报告|行业动态报告 请仔细阅读在本报告尾部的重要法律声明 14 AI/ARAI/AR 眼动追踪方面:眼动追踪方面:2025 年 3 月公司推出 AI 智能眼镜原型机“小七”。该原型机配备自主研发的微型红外眼动传感器,其体积小于 222mm,重量0.5g,并可实现双目追踪功耗仅 26.32mW30fps 的超低功耗表现。此外,“小七”眼动数据处理延迟低于 5ms,远远低于人眼感知阈值(50-70ms),确保用户获得即时流畅的交互反馈。同时,其眼动追踪精度为 0.2-1,确保用户实现精准的智能交互体验。图 26 七鑫易维 AI/AR 眼球追踪解决方案 3.3.3.3.歌尔股份歌尔股份 歌尔股份成立于歌尔股份成立于 20012001 年,年,20082008 年于深交所上市,是全球领先的声光电产品及方年于深交所上市,是全球领先的声光电产品及方案供应商案供应商。作为全球 XR 代工龙头,公司通过内生布局(XR 光学/光机技术、整机解决方案等) 外延投资(收购驭光科技等)打造核心竞争力。与此同时绑定核心大客户,成为 Meta、Pico、索尼等头部厂商的核心代工厂商,市场份额遥遥领先。20252025 年年 7 7 月月 1717 日,歌尔在首届创新大会上推出高精度眼动追踪日,歌尔在首届创新大会上推出高精度眼动追踪 ARAR 智能眼镜。智能眼镜。据艾邦 ARAI 眼镜资讯,该产品采用超薄碳纤维框架和超轻钛合金铰链,总重仅有 36克,是行业内最轻的 AR 眼镜;双相机多光源方案 先进眼动算法,实现全眼域眼动追踪,平均准确度可达 0.5,算法响应延迟小于 3ms。图 27 歌尔股份眼动追踪解决方案 资料来源:艾邦 ARAI 眼镜资讯,华西证券研究所 证券研究报告|行业动态报告 请仔细阅读在本报告尾部的重要法律声明 15 4.4.投资建议投资建议 眼动追踪有望成为 XR 眼镜的核心交互方式之一,实现“视线即交互”的智能化控制,有望在 XR 眼镜上实现加速渗透,助推用户体验升级。相关受益标的:1)方案商:Tobii、七鑫易维(未上市)、歌尔股份;2)摄像头模组:炬光科技、豪威集团。表 3 相关受益标的 公司公司 代码代码 股价(元)股价(元)EPSEPS(元)(元)PEPE(倍)(倍)2025E 2026E 2027E 2025E 2026E 2027E 歌尔股份*002241 25.68 0.93 1.21 1.51 27.61 21.22 17.01 炬光科技*688167 96.86 0.51 1.70 3.28 189.92 56.98 29.53 豪威集团 603501 122.84 3.69 4.68 5.66 33.28 26.27 21.70 注:表*采用华西一致预测,其他采用 Wind 一致预期,时间截至 2025 年 8 月 14 日 5.5.风险提示风险提示 新技术发展不及预期:若相关公司技术创新不及预期,眼动追踪方案效果不好,导致眼动追踪方案渗透不及预期或搭载眼动追踪方案的硬件产品销售不及预期,从而对行业景气度造成负面影响,进而对产业链上下游公司业绩造成影响。XR 眼镜出货不及预期。若下游需求疲软,导致 XR 眼镜出货不及预期,将对行业景气度造成负面影响,进而对产业链上下游公司业绩造成影响。Table_AuthorTable_AuthorInfoInfo 证券研究报告|行业动态报告 请仔细阅读在本报告尾部的重要法律声明 16 分析师承诺分析师承诺 作者具有中国证券业协会授予的证券投资咨询执业资格或相当的专业胜任能力,保证报告所采用的数据均来自合规渠道,分析逻辑基于作者的职业理解,通过合理判断并得出结论,力求客观、公正,结论不受任何第三方的授意、影响,特此声明。评级说明评级说明 公司评级标准公司评级标准 投资投资评级评级 说明说明 以报告发布日后的 6 个月内公司股价相对上证指数的涨跌幅为基准。买入 分析师预测在此期间股价相对强于上证指数达到或超过 15%增持 分析师预测在此期间股价相对强于上证指数在 5%之间 中性 分析师预测在此期间股价相对上证指数在-5%5%之间 减持 分析师预测在此期间股价相对弱于上证指数 5%之间 卖出 分析师预测在此期间股价相对弱于上证指数达到或超过 15%行业评级标准行业评级标准 以报告发布日后的 6 个月内行业指数的涨跌幅为基准。推荐 分析师预测在此期间行业指数相对强于上证指数达到或超过 10%中性 分析师预测在此期间行业指数相对上证指数在-10%之间 回避 分析师预测在此期间行业指数相对弱于上证指数达到或超过 10%华西证券研究所:华西证券研究所:地址:北京市西城区太平桥大街丰汇园 11 号丰汇时代大厦南座 5 层 证券研究报告|行业动态报告 请仔细阅读在本报告尾部的重要法律声明 17 华西证券免责声明华西证券免责声明 华西证券股份有限公司(以下简称“本公司”)具备证券投资咨询业务资格。本报告仅供本公司签约客户使用。本公司不会因接收人收到或者经由其他渠道转发收到本报告而直接视其为本公司客户。本报告基于本公司研究所及其研究人员认为的已经公开的资料或者研究人员的实地调研资料,但本公司对该等信息的准确性、完整性或可靠性不作任何保证。本报告所载资料、意见以及推测仅于本报告发布当日的判断,且这种判断受到研究方法、研究依据等多方面的制约。在不同时期,本公司可发出与本报告所载资料、意见及预测不一致的报告。本公司不保证本报告所含信息始终保持在最新状态。同时,本公司对本报告所含信息可在不发出通知的情形下做出修改,投资者需自行关注相应更新或修改。在任何情况下,本报告仅提供给签约客户参考使用,任何信息或所表述的意见绝不构成对任何人的投资建议。市场有风险,投资需谨慎。投资者不应将本报告视为做出投资决策的惟一参考因素,亦不应认为本报告可以取代自己的判断。在任何情况下,本报告均未考虑到个别客户的特殊投资目标、财务状况或需求,不能作为客户进行客户买卖、认购证券或者其他金融工具的保证或邀请。在任何情况下,本公司、本公司员工或者其他关联方均不承诺投资者一定获利,不与投资者分享投资收益,也不对任何人因使用本报告而导致的任何可能损失负有任何责任。投资者因使用本公司研究报告做出的任何投资决策均是独立行为,与本公司、本公司员工及其他关联方无关。本公司建立起信息隔离墙制度、跨墙制度来规范管理跨部门、跨关联机构之间的信息流动。务请投资者注意,在法律许可的前提下,本公司及其所属关联机构可能会持有报告中提到的公司所发行的证券或期权并进行证券或期权交易,也可能为这些公司提供或者争取提供投资银行、财务顾问或者金融产品等相关服务。在法律许可的前提下,本公司的董事、高级职员或员工可能担任本报告所提到的公司的董事。所有报告版权均归本公司所有。未经本公司事先书面授权,任何机构或个人不得以任何形式复制、转发或公开传播本报告的全部或部分内容,如需引用、刊发或转载本报告,需注明出处为华西证券研究所,且不得对本报告进行任何有悖原意的引用、删节和修改。

    发布时间2025-08-15 17页 推荐指数推荐指数推荐指数推荐指数推荐指数5星级
  • 大数跨境:2025智能眼镜市场洞察报告(43页).pdf

    MARKET INSIGHTS:SMART GLASSES INDUSTRY智能眼镜作为融合现实与数字世界的先锋载体,已从科幻想象跃入商业实践前沿,其意义远非简单的可穿戴设备迭代,而是承载增强现实、人.

    发布时间2025-08-14 43页 推荐指数推荐指数推荐指数推荐指数推荐指数5星级
  • 郎瀚威will:2025年Perplexity Comet测试报告-电商选购类任务(51页).pdf

    Perplexity Comet 电商购物能力测试报告2025.08.12郎瀚威/GPTDAO猫猫头AIwatch.ai2aiwatch.ai 01目录09测试4:给定预算购物(风衣)02关于作者10.

    发布时间2025-08-14 51页 推荐指数推荐指数推荐指数推荐指数推荐指数5星级
  • Alluxio:2025多GPU集群时代的I/O优化白皮书-分布式缓存在AI基础架构中的关键作用(22页).pdf

    多GPU集群时代的I/O优化分布式缓存在AI基础架构中的关键作用前言一、多GPU集群时代二、诊断GPU利用率低下问题 模型训练中 GPU 利用率低的常见原因 (1)基础设施瓶颈 (2)代码瓶颈三、优化.

    发布时间2025-08-13 22页 推荐指数推荐指数推荐指数推荐指数推荐指数5星级
  • AI行业电气专题:AIDC建设迎风起产业加速迭代创新机-250812(56页).pdf

    1AI电气专题:AIDC建设迎风起,产业加速迭代创新机请务必阅读正文之后的免责声明部分证券研究报告证券分析师:曾朵红、谢哲栋、司鑫尧执业证书编号:S0600516080001、S06005230600.

    发布时间2025-08-13 56页 推荐指数推荐指数推荐指数推荐指数推荐指数5星级
  • 2025中美AI应用领域对比及中美AI应用商业化场景、市场空间分析报告(56页).pdf

    行业研究市场分析深度洞察行业分析报告2025INDUSTRY REPORT 2 0 2 5 中美A I 应用领域对比及中美A I 应用商业化场景、市场空间分析报告WURVuNxOnNoPxPsQvMr.

    发布时间2025-08-13 56页 推荐指数推荐指数推荐指数推荐指数推荐指数5星级
  • 北京大学:2025从AI工具到“最佳拍档”V10(100页).pdf

    学习交流可加AI肖睿团队助理微信号(ABZ2829)AI肖睿团队第1页从AI工具到“最佳拍档”V10AI肖睿团队(吴寒、张惠军、李娜、李晴)20250728北京 北大青鸟人工智能研究院 北大计算机学院.

    发布时间2025-08-12 100页 推荐指数推荐指数推荐指数推荐指数推荐指数5星级
  • 人工智能行业系列报告(八):AI应用公司的估值方法-250811(29页).pdf

    AI应用公司的估值方法应用公司的估值方法人人工工智智能能系系列列报报告告(八八)分析师|郑宏达 S0800524020001 邮箱地址:联系人|卢可欣邮箱地址:西部证券研发中心2025年08月11日证.

    发布时间2025-08-12 29页 推荐指数推荐指数推荐指数推荐指数推荐指数5星级
  • 算力核芯:2025WAIC全球人工智能大会总结报告(22页).pdf

    2025/08/052025WAIC全球人工智能大会总结报告算力核芯CONTENTS目录01大会核心成果02历史性突破03中国方案04人机共生新范式05未来战略制高点06行动倡议大会核心成果01规模与.

    发布时间2025-08-11 22页 推荐指数推荐指数推荐指数推荐指数推荐指数5星级
  • 广州市基础地理信息中心:2025规划和自然资源行业应对DeepSeek浪潮的思考报告(62页).pdf

    绩效管理绩效管理实施过程KPI与BSC规划和自然资源行业应对广州市基础地理信息中心DeepSeek浪潮的思考何正国中国城市规划学会城市规划新技术应用专业委员会目录页 CONTENTS PAGE未来展望与思考四四横三纵应对路径三大模型技术原理二DS影响千行百业一绩效管理绩效管理实施过程KPI与BSC一、DeepSeek影响千行百业1.接入DeepSeek热潮2.对千行百业的影响1、三大科技巨头同日接入 DeepSeek1月31日,英伟达、亚马逊和微软这三大美国科技巨头在同一天宣布接入DeepSeek的大模型。英伟达将这一模型应用于其GPU加速卡和数据中心中以提供更高效的计算能力;而亚马逊则利用自身的云计算平台优势来推广该模型的使用;至于微软将其集成到现有的软件产品和服务中去以增强用户体验。1、中国基础电信运营商接入 DeepSeek2月1日:中国电信“息壤”平台接入,华为昇腾云服务部署推理服务。2月3日:中国联通“星罗”平台集成,覆盖270 骨干云池。2月5日:中国移动适配全版本模型,火山引擎支持多尺寸部署截至 2025 年 3 月,已有超过百家国内外企业宣布接入DeepSeek,覆盖政务、互联网、制造业、汽车、医疗、能源、金融、手机、教育、科技等多个领域,形成从底层算力到终端应用的完整生态闭环。1、千行百业深度拥抱 DeepSeek自 2025 年 2 月以来,北京、广东、江西、新疆等省市相继宣布接入 DeepSeek 大模型,通过智能导办、工单处理、公文写作等场景创新,推动政务服务从“人工密集型”向“数据智能型”转型。1、DeepSeek赋能政务效率提升2、技术普惠:让AI不再是巨头的专属工具DeepSeek 大模型正以“低成本、高性能、开源化”的创新路径,打破技术垄断壁垒,推动 AI 从巨头专属走向全民共享。其技术突破不仅重塑了全球 AI 竞争格局,更通过生态赋能为发展中国家提供了技术追赶的新机遇。2、行业重构:从效率优化到模式改变DeepSeek通过“技术穿透、数据觉醒、模式重构”的三重跃迁路径,其核心价值不仅在于单点效率提升,更在于通过AI与产业场景的深度融合,重塑行业决策底层逻辑。DeepSeek 一、在行业应用方面,DeepSeek 成效显著制造业中,汽车设计仿真迭代加快,零部件参数优化从月级缩至天级,研发周期缩短超 50%;医疗领域,医学影像检出率提升 20%,药物研发靶点筛选效率突破,研发周期缩至传统模式的三分之一。二、决策模式从经验驱动向“数据 AI”协同驱动转变金融风控中,传统依赖规则与经验难应对实时风险,DeepSeek 构建协同网络,通过实时数据驱动模型动态学习,反欺诈准确率从 90%提至 99.7%,推动决策转向算法实时优化,实现精准动态风险识别。2、提振算力产业链:助力国产算力成长DeepSeek 高效算法助力国产芯片商用,性能提升,相关企业股价上涨,中下游也各有积极表现。资本市场投资逻辑转变,转向聚焦技术落地效能与商业变现能力的理性回归。一、算力产业链:让国产算力“能用、好用”DeepSeek 高效算法助力华为昇腾、寒武纪等国产芯片商用,性能达国际 60%以上,相关企业股价两月涨超 30%。中游:超算及地方平台接入技术,中小企业算力成本降。下游:带 AI 功能手机销量涨 120%。二、资本市场:“砸钱堆参数”转向“解决实际问题”投资逻辑彻底转变,过去资本追捧“万亿参数”的大模型竞赛,如今聚焦“能否落地赚钱”。寒武纪、海光信息等国产算力企业利润涨超 50%,估值从 30 倍跃升至 80 倍,成资本市场新宠。DeepSeek 绩效管理绩效管理实施过程KPI与BSC二、大语言模型技术原理1.语言模型概述2.Transformer结构3.语言模型构建流程人工智能核心要素算法是指解题方案的准确而完整的描述,是一系列解决问题的清晰指令,算法代表着用系统的方法描述解决问题的策略机制。简单来理解,算法就是解决问题的方法和步骤。算力是指计算机的处理的能力,由于深度学习的算法,涉及非常多的参数(不同功能的AI算法参数的个数是不同的),有的AI算法的参数达到几千亿上万亿。数据是用于训练AI的,也就是AI算法通过大量的数据去学习AI中算法的参数与配置,使得AI的预测结果与实际的情况越吻合。这里说的数据是指经过标注的数据,不是杂乱的数据。所谓经过标注的数据是指有准确答案的数据。1、语言模型概述语言是人类与其他动物最重要的区别之一如果人工智能想要获取知识,就必须懂得理解人类使用的不太精确、可能有歧义、混乱的语言。逻辑思维以语言的形式表达 知识以文字的形式记录和传播1、语言模型概述语言模型(Language Model,LM)目标是建模自然语言的概率分布词汇表 V 上的语言模型由函数 P(w1w2.wm)表示,表示词序列w1w2.wm作为一个句子出现的可能性大小。对于任意词串 w1w2.wm V ,则有 P(w1w2.wm)0,并且对于所有词串,函数 P(w1w2.wm)满足归一化条件:由于联合概率 P(w1w2.wm)的参数量十分巨大,直接计算 P(w1w2.wm)非常困难。如果把w1w2.wm看作一个变量,那么它具有|V|m种可能。按照现代汉语词典(第七版)包含7万词条,句子长度按照20个词计算,模型参数量达到7.9792*1096的天文数字。1、语言模型概述为了减少 P(w1w2.wm)模型参数量,可以利用句子序列通常情况下从左至右的生成过程进行分解,使用链式法则得到:由此,w1w2.wm的生成过程可以看作单词逐个生成的过程。首先生成 w1,之后根据 w1生成 w2,再根据 w1和 w2生成 w3,以此类推,根据前 m 1 个单词生成最后一个单词 wm语言模型训练就是要学习词、句内在的语言模式和语言关系,对这种关系进行建模。1、语言模型概述学习语言模式 观察词语顺序:通过大量文本如“我 爱 吃饭”、“他 喜欢 跑步”等,识别出主语通常在句首,动词居中,宾语在句尾的基本句子结构。统计词语搭配:模型统计词语的搭配频率,比如“美丽”常与“花朵”、“风景”相伴,“快速”则常与“奔跑”、“行驶”等词搭配。这一过程帮助模型理解词语间的搭配习惯,从而判断哪些词语组合更为合理,形成对语言模式的认识。学习语义关系 理解词语含义:大模型通过大量文本中的使用场景来理解词语含义。比如,当看到“苹果”一词频繁与水果、食物、红色的圆形物体等描述相关联时,模型就能逐渐明白“苹果”指的是一种具体的水果。分析句子语义:以“猫在桌子上”为例,模型能识别出“猫”是主体,在上”表示位置“关系,“桌子”是位置的对象,从而理解句子所表达的空间关系。学习上下文关系:例如,在“小明生病了,所以他没去学校”这句话中,模型通过“所以”以及前后句子的内容,能够明白生病是没去学校的原因,这是因果关系的一种体现。同时,模型也能理解转折、并列等其他语义关系。句子:我是一名AI工程师。字:我/是/一/名/A/I/工/程/师/。词:我/是/一名/AI/工程师/。Bi-Gram:我是/是一/一名/名A/AI/I工/工程/程师/师。Tri-Gram:我是一/是一名/一名A/名AI/AI工/I工程/工程师/程师。/师。AI 0.70753,0.93948,0.00133,0.70741,0.79584,0.30115,0.28655,0.55261,.工程师0.73236,0.73890,0.64466,0.54484,0.80536,0.46147,0.96903,0.88725,.是0.41284,0.41901,0.37967,0.90657,0.99241,0.05147,0.85335,0.29367,.我0.69308,0.84442,0.21239,0.55487,0.08609,0.52786,0.55209,0.43071,.一名0.54362,0.46765,0.37969,0.55248,0.90865,0.08897,0.34130,0.29651,.WordEmbedding:将词映射成向量Token:自然语言中的最小单元1、语言模型概述多看一个词:我喜欢你概率:0.30.8=0.24我喜欢吃概率:0.30.1=0.03我想你概率:0.40.5=0.2我想去概率:0.40.3=0.12只看下一个词:我喜欢概率:0.3我想概率:0.41、语言模型概述2、Transformer结构语言模型的目标是建模自然语言的概率分布,在自然语言处理研究中具有重要的作用,是自然语言处理的基础任务之一。包括:n元语言模型、神经语言模型、预训练语言模型。随着基于Transformer 的各类语言模型的发展及预训练微调范式在自然语言处理各类任务中取得突破性进展。Transformer 结构是由谷歌在2017 年提出并首先应用于机器翻译Transformer结构完全通过注意力机制完成对源语言序列和目标语言序列全局依赖的建模。如今,几乎全部大语言模型都是基于Transformer 结构的。2、Transformer结构基于Transformer 的编码器和解码器结构如图所示左侧和右侧分别对应着编码器(Encoder)和解码器(Decoder)结构,它们均由若干个基本的Transformer 块(Block)组成(对应图中的灰色框)每个Transformer 块都接收一个向量序列作为输入 ,并输出一个等长的向量序列作为输出yi是当前Transformer 块对输入 xi 进一步整合其上下文语义后对应的输出。词元嵌入表示多头自注意力Add&NormAdd&NormAdd&Norm掩码多头自注意力输出(迭代右移)N输出概率LinearSoftmaxN词元嵌入表示多头自注意力位置感知前馈网络Add&NormAdd&Norm输入位置编码位置编码位置感知前馈网络中国城市规划学会城市规划新技术应用专业委员会中国城市规划学会城市规划新技术应用专业委员会中国城市规划学会城市规划新技术应用专业委员会中国城市规划学会城市规划新技术应用专业委员会中国城市规划学会城市规划新技术应用专业委员会中国城市规划学会城市规划新技术应用专业委员会中国城市规划学会城市规划新技术应用专业委员会中国城市规划学会城市规划新技术应用专业委员会中国城市规划学会城市规划新技术应用专业委员会中国城市规划学会城市规划新技术应用专业委员会中国城市规划学会城市规划新技术应用专业委员会中国城市规划学会城市规划新技术应用专业委员会2、Transformer结构注意力层:使用多头注意力(Multi-Head Attention)机制整合上下文语义,它使得序列中任意两个单词之间的依赖关系可以直接被建模而不基于传统的循环结构,从而更好地解决文本的长程依赖问题。位置感知前馈层(Position-wise FFN):通过全连接层对输入文本序列中的每个单词表示进行更复杂的变换。残差连接:对应图中的Add 部分。它是一条分别作用在上述两个子层中的直连通路,被用于连接两个子层的输入与输出,使信息流动更高效,有利于模型的优化。层归一化:对应图中的Norm 部分。它作用于上述两个子层的输出表示序列,对表示序列进行层归一化操作,同样起到稳定优化的作用。词元嵌入表示多头自注意力Add&NormAdd&NormAdd&Norm掩码多头自注意力输出(迭代右移)N输出概率LinearSoftmaxN词元嵌入表示多头自注意力位置感知前馈网络Add&NormAdd&Norm输入位置编码位置编码位置感知前馈网络3、语言模型构建流程原始数据数千亿单词:图书、百科、网页等语言模型预训练基础模型预训练阶段数据集合算法模型资源需求1000 GPU月级别训练时间GPT 3.0、DeepSeek、,qwen标注用户指令数万用户指令和对应的答案语言模型预训练SFT 模型1-100GPU天级别训练时间MOSS、ChatGLM6b、Vicuna-13B等指令微调标注对比对百万标注对比对二分类模型RM 模型1-100GPU天级别训练时间奖励函数用户指令十万用户指令强化学习方法RL 模型1-100GPU天级别训练时间ChatGPT、Claude强化学习24预训练(Pretraining)阶段需要利用海量的训练数据,数据来自互联网网页、维基百科、书籍、GitHub、论文、问答网站等,构建包含数千亿甚至数万亿单词的具有多样性的内容。利用由数千块高性能GPU 和高速网络组成超级计算机,花费数十天完成深度神经网络参数训练,构建基础语言模型(Base Model)词元嵌入表示多头自注意力Add&NormAdd&NormAdd&Norm掩码多头自注意力输出(迭代右移)N输出概率LinearSoftmaxN词元嵌入表示多头自注意力位置感知前馈网络Add&NormAdd&Norm输入位置编码位置编码位置感知前馈网络3.1、预训练阶段3.2、有监督微调阶段有监督微调(Supervised Finetuning),也称为指令微调,利用少量高质量数据集合,包含用户输入的提示词和对应的理想输出结果。用户输入包括问题、闲聊对话、任务指令等多种形式和任务。例如:提示词(Prompt):中山大学有几个校区?理想输出:中山大学现有5 个校区,分别是广州校区南校园、广州校区北校园、广州校区东校园、珠海校区和深圳校区。其广州校区南校园是中山大学的主校区,广州校区北校园原为中山医科大学所在地,广州校区东校园位于广州市番禺区大学城外环东路132号,是中山大学较为年轻的校区之一。奖励建模(Reward Modeling)阶段的目标是构建一个文本质量对比模型,对于同一个提示词,SFT 模型给出的多个不同输出结果的质量进行排序。奖励模型(RM模型)可以通过二分类模型,对输入的两个结果之间的优劣进行判断。RM 模型与基础语言模型和SFT 模型不同,RM 模型本身并不能单独提供给用户使用。3.3、奖励建模阶段强化学习(Reinforcement Learning)阶段根据数十万用户给出的提示词,利用前一阶段训练的RM模型,给出SFT模型对用户提示词补全结果的质量评估,并与语言模型建模目标综合得到更好的效果。使用强化学习,在SFT 模型基础上调整参数,使得最终生成的文本可以获得更高的奖励(Reward)。该阶段需要的计算量相较预训练阶段也少很多,通常仅需要数十块GPU,数天即可完成训练。3.4、强化学习阶段例如:机器人一开始并不知道如何保持平衡和移动,它会尝试不同的步伐、姿势和动作(采取各种行动)。如果某一次尝试让它向前移动了一段距离并且没有摔倒,它就会得到一个“奖励”信号(比如数值为正的奖励分数),意味着这个动作是朝着目标(学会走路)前进的好行为;要是它摔倒了或者动作很不协调,就会得到一个“惩罚”信号(比如数值为负的分数)。机器人基于这些奖励和惩罚的反馈,不断调整自己的动作,尝试不同的变化。经过多次尝试和调整,它逐渐学会保持平衡、协调动作,最终能够成功地行走。绩效管理绩效管理实施过程KPI与BSC三、四横三纵应对策略路径1.智才筑基AI 素养提升工程2.算力赋能 基础设施升级3.基座选型 核心模型构建4.安全筑盾 防护体系建设5.场景深耕 业务痛点突破6.知识聚库本地知识库建设7.智能铸魂 AI Agent 构建应对DeepSeek浪潮的策略路径基座选型智才筑基算力赋能安全筑盾场景深耕知识聚库智能铸魂 四横三纵七步谋,智算筑基夯根基。筑牢安全破瓶颈,智识赋能启新章。智绘之路deepseek1、智才筑基AI 素养提升工程在规划和自然资源行业普及AI并提升行业人员的AI素养,是推动AI技术在该领域广泛应用的关键。思维转变能力构建习惯养成文化重塑得让全行业人员对AI感兴趣,别抵触,要主动拥抱它有使用场景就想用AI,AI效果好,就会越用越多,越用越熟练,然后就更想用不断使用AI,慢慢就养成习惯了,这就是“第一念原理”先进的带动后进的养成使用AI的习惯,组织文化就重塑了,贴上了AI的标签1、智才筑基AI 素养提升工程在当今数字化浪潮以迅猛之势席卷全球的时代,倡导全行业积极运用AI大模型,绝非毫无根据的盲目之举。AI大模型凭借其强大的数据处理、分析和学习能力,对日常工作产生了不可忽视且极为显著的推动作用。图片来源互联网1、智才筑基AI 素养提升工程样例数据样例数据1、智才筑基AI 素养提升工程2、算力赋能 基础设施升级部署DeepSeek大模型时,算力配置需根据模型规模(参数量)、应用场景(推理/训练)、并发需求及性能目标综合规划。模型规模显存需求(推理)显存需求(训练)推荐GPU数量量化技术支持7B10-16GB24-32GB1-2FP16/INT813B20-24GB48-64GB2-4FP16/INT432B 40GB 80GB 4 FP8/QLoRA模型规模与硬件需求关系注:显存需求基于FP32精度,使用量化技术(如FP16/INT8)可降低显存占用30-50%。2、算力赋能 基础设施升级核心硬件推荐部署说明GPUNVIDIA A100 80GB/H100 80GB大显存、高带宽,支持NVLink多卡互联(推荐训练场景)RTX 4090 24GB/RTX 6000 Ada 48GB性价比选择(适合中小规模推理/微调)CPUAMD EPYC 7xx3/Intel Xeon Scalable多核(64 核心)支持PCIe 5.0,保障数据预处理与多GPU通信内存显存容量 2(最低)例如:单卡A100 80GB需至少160GB内存存储NVMe SSD RAID 0(2TB,读速7GB/s )高速存储减少模型加载和数据集读取延迟网络多卡NVLink(600GB/s)/PCIe 4.0 x16多GPU场景需避免通信瓶颈电源冗余电源(1200W)支持多卡高功耗场景(如4卡A100需2000W)核心硬件配置方案注:昇腾910B八卡一台,标准级推理版本32B/70B;四台昇腾910B,满血671B2、算力赋能 基础设施升级配置层级硬件成本(万元)年运维(万元)使用场景轻量级(1.5-7B)0.8-1.50.2-0.5单机知识库企业级(13-32B)8-153-8全部门部门应用、推理超大规模(70-671B)50-12020-50全部门部门应用、推理、微调成本效益对比表不同配置在硬件成本、年运维成本和使用场景上各有特点,用户可以根据自身需求和预算选择合适的配置,供参考。3、基座选型 核心模型构建维度DeepSeekQwenChatGLM核心优势推理能力顶尖,本地化部署成本低多模态、中文理解、开源生态轻量化、垂直领域适配适用场景政务审批、灾害预警、矿产勘探矿业分析、水环境监测、空间规划政策问答、数据核验、报告生成硬件需求中等(支持CPU/GPU部署)较高(需多卡GPU,尤其72B版本)低(轻量化,支持边缘设备)开源支持完全开源,支持商用开源(Apache 2.0),生态活跃开源(MIT),但生态较弱推理速度快(优化架构 量化技术)中等(依赖硬件配置)快(轻量化设计)在选择基座模型时,应综合考虑业务场景和安全合规要求,评估模型的多模态处理能力、长文本分析性能以及安全合规性。同时,结合项目规模、预算,选择最适合的基座模型。4、安全筑盾 防护体系建设根据奇安信等安全机构的监测,近九成部署DeepSeek的服务器存在严重的安全隐患,处于“裸奔”状态,极易成为攻击目标。关闭高危端口防火墙 更新补丁数据分级分类备份 应急响应严格权限控制监控日志 防钓鱼修改默认端口(如11434),禁止公网暴露,仅允许内网访问(像“关紧门窗“)按需分配用户权限,禁用危险接口(如删除/下载模型功能),避免“钥匙随便给“。行业需根据数据的安全级别重新梳理,综合考虑成本、整理难度和业务需求,重新定义安全级别。部署防火墙拦截异常流量,及时更新模型工具(如Ollama),堵住已知漏洞。每天检查运行日志,警惕高频调用;团队培训防钓鱼链接(如假冒付费插件)。定期备份模型数据到独立存储,遇攻击立刻断网隔离,联系专业团队处理。5、场景深耕 业务痛点突破统一行使全民所有自然资源资产所有者职责统一行使所有国土空间用途管制和生态保护修复职责两统一自然资源部门工作定位严守资源安全底线、优化国土空间格局促进绿色低碳发展、维护资源资产权益调查规划开发保护5、场景深耕 业务痛点突破DeepSeek被集成至规划和自然资源政务系统,用于智能问答、政策解读、公文起草、智能校对等政务服务场景。5、场景深耕 业务痛点突破内蒙古、江苏、湖北、湖南、广东、广西等地不动产登记机构接入DeepSeek,通过深度整合政策法规、业务流程及高频问题库,推动构建不动产登记全周期知识图谱。5、场景深耕 业务痛点突破规划编制中产生大量隐性知识(如专家论证、技术审查、实施评估),长期分散于纸质文档,缺乏系统整合;空间布局经验、政策适配策略等核心知识未有效转化为规划知识,造成知识资产利用低效与传承断层。规划查谋评助5、场景深耕 业务痛点突破智能判断重大项目地块“前世今生”,快速梳理历史沿革、性质变化,分析历史数据、实时数据等,助力决策者提前谋划、优化管理效率,为重大项目快落地、快建设、快投产“保驾护航”。5、场景深耕 业务痛点突破全国两会期间,代表委员们对耕地数量、质量、生态保护的关注热度不减,尤其对耕地“非农化”“非粮化”等相关话题给予了高度关注。当耕地保护遇上DeepSeek,耕地智能监管便成为“把饭碗端得更牢”的新希望。5、场景深耕 业务痛点突破规资部门业务系统涉及的领域广泛,土地、矿产、林业等部门原分属不同体系,如林业与国土规划长期分治,导致流程割裂、数据孤岛。DeepSeek AI Agent把分散系统有机整合起来。需强大推理分析数据密集规则明确需强大推理分析6、知识聚库本地知识库建设根据当前公开信息,企事业单位应用DeepSeek大模型时,本地知识库的构建与应用已成为核心部署策略。DeepSeek提升回答准确性,对抗大模型幻觉。保护数据安全,防止信息外泄。提高信息可追溯性和透明度。支持动态更新和,保持知识时效性。6、知识聚库本地知识库建设提升本地知识库效能,需紧抓入库源头优化这一关键。聚焦数据质量提升,严格把控数据准确性、完整性;强化语义对齐,消除多源数据歧义数据治理。清洗去重脱敏统一使用正则表达式去除特殊符号(如x00)、乱码等等噪音数据计算文本相似度,合并相似度90%的内容,对低频术语建立同义词表,减少稀疏向量干扰。标准化日期(YYYY-MM-DD)、单位(如“5kg”“5千克”)、标点(中文全角标点),法律文档中“不可抗力”与“不可抗拒因素”合并为统一表述。在自然资源领域,敏感信息包括地理位置数据、资源储量、环境监测数据等,需要进行处理。6、知识聚库本地知识库建设在识别文档的过程常遇难题:复杂布局与格式易使文本错乱、乱码;特殊字符与专业内容误识别率高;多模态数据整合困难,扫描质量差致文字错漏,后处理需大量人工校正,成本高。痛点分类具体问题解决方案工具/技术图文不一致图文数据存在着差异文档解析、文本块分类和文本生成文本分类与输出复杂排版干扰多栏文本、跨页表格断裂,信息错乱智能分块识别(区分文字和表格) 表格结构还原算法PaddleOCR 表 格 识 别、LayoutLM语义分割模型用地类型差异不同的源文件里面对于同种用地类型的表述不一致将不同的用地类型的表达差异进行统一,解决类型差异问题提示词 大模型多模态数据整合图片、CAD图纸与文字无法关联存储空间坐标与文本自动绑定 统一格式转换ArcGIS地理系统、Python脚本自动化处理人工校正成本高扫描后需手动补全缺失内容,费时费力AI自动纠错(语义补全) 规则过滤冗余内容BERT语义修复模型、正则表达式清洗引擎6、知识聚库本地知识库建设完成文本提取后,需对大段文本实施分块处理(chunking),将其拆解为更小的段落单元,以此增强文本数据的可处理性。这种分块操作能够让内容嵌入(embedding)过程更加高效,同时大幅提高从向量数据库中检索内容时的相关性与精准度。原则语义完整动态粒度协同处理分块需保留完整的语义单元(如段落、表格或章节),避免切割关键上下文。例如,对跨页表格采用递归分块策略,先按章节拆分再细分段落,确保逻辑连贯性。根据内容类型调整分块粒度:短文本(如摘要):固定长度分块;长文本(如报告):混合分块(规则 语义);表格/图像:专用规则(JSON结构化存储)。文本、图像、表格需统一分块逻辑。例如,通过版面分析模型(如LayoutLM)分割图文区域,将规划图坐标与描述文本绑定存储,或通过XML标签关联表格与文本块。6、知识聚库本地知识库建设问题分类具体问题解决方案相关工具/技术语义断裂 问答对被拆分,检索结果不完整动态分块策略(语义相似度合并);人工规则标记(如“#Q/A”标识符)Sentence-BERT、正则表达式专业术语割裂术语跨块(国土空间开发适宜性评价)-术语库预扫描 强制保护-分块后术语完整性校验FlashText、spaCy NER模型多模态割裂文本描述与关联图表/坐标分离空间坐标/图表标题绑定文本-多模态联合分块(文本 图片哈希)LayoutLM、Nougat多模态框架分块粒度难统一长短差异大(50字 vs.2000字)增量分块 索引更新-版本化分块管理(如时间戳标记)Apache Kafka、Milvus增量索引人工校正成本高新数据分块需全量重建索引分层分块(粗粒度目录 细粒度内容)-业务规则分类(法律/技术/行政差异化)LangChain智能分块器分块阶段常见问题与应对策略表分块处理的核心在于平衡语义保留与计算效率,需结合领域特性(如自然资源文档的跨页表格)动态优化6、知识聚库本地知识库建设6、知识聚库本地知识库建设针对海量数据检索延迟问题,结合分层索引、元数据过滤与分布式部署的解决方案。分层索引:对高频数据使用HNSW,长尾数据用IVF-PQ(Faiss或Milvus)。元数据过滤:为数据添加标签(如时间、类别、是否有效),加速粗筛过程。分布式部署:按数据热度分片,结合缓存机制(如Redis)提升响应速度。将数据整理成问答对(QA Pair)形式是一种优化策略,而非必要步骤。但这种方式在特定场景下能显著提升检索和生成的效果。Q:规划如何控制人口与土地利用?A:实施严格管控措施:1、人口规模:2035年常住人口控制在2200万以内,城镇化率达88.5%;2、土地红线:耕地保有量68.03万亩,生态保护红线1429.15平方公里,城镇开发边界2135平方公里;3、存量更新:十五五期间推进超100平方公里城市更新,80%建设用地通过存量改造释放。7、智能铸魂 AI Agent 构建大模型虽然在自然语言理解和生成方面表现出色,但其能力受限于训练数据的规模、知识边界和时效性等问题。AI Agent通过获取外部工具的使用权,可以突破这些限制,实现更复杂的任务。控制端(Brain)作为控制中心的大脑(Brain)模块负责处理信息,以及记忆和知识的存储处理活动,如思考、决策和操作。感知端(Perception)接收多模态的感知、信息。行动端(Action)行动端接收大脑端发送的动作序列,并执行动作与环境进行交互。7、智能铸魂 AI Agent 构建Manus定位为“自主执行体”,突破传统AI仅提供建议的局限,通过“规划-执行-验证”全闭环架构,实现复杂任务的自动拆解与成果交付。7、智能铸魂 AI Agent 构建Agent实际应用中各类API和数据源差异大,需单独开发适配接口,导致开发周期长、成本高,后期维护难。同时AI工具跨系统执行复杂任务困难。MCP协议可衔接API与数据源,打破壁垒,提升AI Agent效能。绩效管理绩效管理实施过程KPI与BSC四、未来展望与思考一、模型架构升级提升模型的处理能力和效率,使其能够更好地应对复杂的任务和大规模的数据处理。二、推理效率提升降低能耗,同时提升响应速度三、多模态融合通过将文本、图像、音频和视频数据一体化处理,DeepSeek将能够实现更广泛的应用场景和更强大的功能。DeepSeek:功能愈强,智能再升突破技术瓶颈,共筑智能未来一方面,行业应主动寻求与计算机领域的深度合作,通过引入先进的算法模型、数据处理技术,提升自然资源管理与规划中的智能化水平。另一方面,行业需推动数据共享与标准化,打破数据孤岛,为AI提供充足且高质量的训练数据。谢谢

    发布时间2025-08-11 62页 推荐指数推荐指数推荐指数推荐指数推荐指数5星级
  • AI行业北交所AI产业链深度报告系列:消费电子-250808(35页).pdf

    北交所AI产业链深度报告系列消费电子证券分析师:朱洁羽执业证书编号:S0600520090004 联系邮箱: 证券分析师:易申申执业证书编号:S0600522100003 联系邮箱:二零二五年八月八日.

    发布时间2025-08-11 35页 推荐指数推荐指数推荐指数推荐指数推荐指数5星级
  • 安远AI&天津大学:2025人工智能x生命科学的负责任创新报告(82页)(81页).pdf

    执摘要 执摘要 智能的快速发展正在深刻重塑命科学研究范式,为类健康、经济发展与态可持续性带来前所未有的机遇。从基础研究到临床应,从物制造到环境治理,AI正逐步成为命科学的重要具与变量。但与此同时,AI的赋能也引发了有关物安全的新兴挑战。如何在推动技术融合和价值创造的同时,妥善应对潜在险,已成为全球治理的重要课题。1.智能赋能命科学的积极潜 科技进步推动21世纪的物技术命。1命科学以及智能、动化和机器等技术的快速发展提了科学家出于多种的设计命系统的能。这些进步对于构建更效、更可持续和更健康的未来关重要。智能正成为推动命科学研究范式转变与物经济加速发展的关键量。基础研究层,AI赋能结构物学、合成物学和基因编辑等领域,加快了从靶点发现到分设计的全过程;产业转化层,AI助疫苗与药物的效开发、物制造流程的优化与动化,显著提升了效率与可及性。例如,2024年诺尔化学奖的得主中,David Baker因在蛋质设计的开创性作获奖,他期将计算法与机器学习结合,开发蛋质结构与功能设计具,推动了物程的发展;Demis Hassabis和John Jumper则因AlphaFold系统实现精度蛋质结构预测,攻克结构物学难题。这些成果凸显了智能与命科学融合的巨潜。此外,AI也在助构建可持续发展的未来。在合成物学、农业基因改造、物能源与环境治理等领域,AI正帮助类更系统地理解和重构然,为应对候变化、实现碳中和等标提供具。AI与命科学的融合不是抽象的远景,是现实中正在进的深刻变。2.智能和物技术的“双刃剑”效应 新轮科技命“双刃剑”效应突显。智能、量技术、物技术等前沿技术加速发展,在促进类认识和改造世界的同时,也带来系列难以预知的险挑战,对各国安全和稳定产深远影响,甚将重塑全球安全格局。2智能和物技术的融合,加速了命科学的认知进程与技术跃迁;另也可能被误或滥,带来难以预测的物险。随着AI在蛋质结构预测、基因合成设计、病原体程化等领域能的增强,其赋能效应正向命系统的更深层次延展。在科研和产业实践中,AI可于动成DNA序列、优化病原2 国务院新闻办公室,“新时代的中国国家安全,”2025-05-12,http:/ 1 NTI,The Convergence of Artificial Intelligence and the Life Sciences,”2023-10-30,https:/www.nti.org/wp-content/uploads/2023/10/NTIBIO_AI_FINAL.pdf 1 智能 x 命科学的负责任创新 体传播模型、加速疫苗设计和疾病机理建模,显著提研发效率与响应速度。然,在缺乏明确边界与配套防护机制的情境下,这些能也可能被于合成更具致病性的病毒株,或规避现有的检测与防御系统,进被于物攻击、恐怖活动,或造成预期的公共健康危害。部分具备物设计潜的前沿AI模型在未经充分险评估和实施缓解措施的前提下以开源或开放权重的形式发布,其获取槛低、适范围,因此可能被于构建毒性蛋、规避核酸序列筛查,甚突破现物实验室的安全规范。这能扩散趋势加剧了智能与物险耦合所带来的挑战。3.物安全是国家安全和类未来的关键议题 物安全3不仅是科技议题,更是国家安全的重要组成部分。2020年2,习近平总书记在中央全深化改委员会第次会议上指出:“要把物安全纳国家安全体系,系统规划国家物安全险防控和治理体系建设,全提国家物安全治理能”4。同年10,第三届全国常委会第次会议于2020年1017表决通过了中华共和国物安全法(以下简称物安全法),确了各项物安全险防控的基本制度。更义上,物安全还关联到全球灾难性险。1918年流感流导致全球约5000万1亿死亡,占当时世界的2.5%-5%。5根据2021年全球灾难险评估,由物因素引发的灾难性险(如然疫情或物武器攻击)年均发概率约为0.1%-0.5%。6虽然这概率看似不,但后果可能极其严重。兰德公司2024年的报告新兴技术与险分析:合成流病进步警告,未来510年合成流病险位列最等级,亟需全球度重视。7 4.智能诱发物安全险的治理挑战 近年来,智能对物安全带来的潜在威胁引发了各界度警惕。在2025年原科学家公报发布的“末时钟”声明中,智能与物险的交叉威胁1947年以来次成为讨论重点。声明指出:“智能的快速进步加剧了以下险:恐怖分或某些国家可能具备研发出前尚应对段的物武器的能”,“尽管智能与物研究结合带来的威7 Daniel M.Gerstein et al.,“Emerging Technology and Risk Analysis-Synthetic Pandemics,”2024-02-15,https:/www.rand.org/pubs/research_reports/RRA2882-1.html 6 Global Challenge Foundation,“Global Catastrophic Risks 2021:Navigating the Complex Intersections,”2021,http:/globalchallenges.org/app/uploads/2023/06/Global-Catastrophic-Risks-2021-Navigating-the-Complex-Intersections.pdf 5 Cdric Cotter,“From the Spanish Flu to COVID-19,”2020-04-23,https:/blogs.icrc.org/law-and-policy/2020/04/23/spanish-flu-covid-19-1918-pandemic-first-world-war/4 新华社,“习近平:完善重疫情防控体制机制健全国家公共卫应急管理体系,”2020-02-14,http:/ 3 以英语为语的国家提及物安全通常将“biosafety”与“biosecurity”作区分,翻译成中分别为“物安全”和“物安保”。前者源于故意的类为,可能由物实验室中不恰当接触危险成分或意外释放引起。后者则是指未经授权的获取、丢失、盗窃、滥、转移或故意释放等为。鉴于我国物安全法亦已涵盖者的主要内容,且国际实践中两者界限并不总是严格区分,故本报告统使“物安全”词指代两类险 2 执摘要 胁已受关注,但各国政府及相关科学界仍对限制智能介物研究犹豫不决,唯恐此举会阻碍重科学突破”。8 2025年7,超过35位来AI模型开发、物科学研究以及国际和平与安全领域的领先专家,共同发布公开声明。他们强调了AI与命科学融合快速发展的潜在险,并呼吁政府、业、科学界和资助者采取紧急动,以保障这项技术的发展,防滥的同时实现社会益处。参与声明的专家包括图灵奖得主姚期智和Yoshua Bengio,以及被誉为“合成物学之”的George Church等。9 多位智能领域的专家发出了类似警告。Anthropic席执官Dario Amodei曾在2023年指出,未来23年内AI模型可能具备动成物攻击段的能,若缺乏有效防护机制,险将显著上升。10 2025年5,Anthropic推出了其新模型Claude Opus 4,该模型次预防性启动了公司设定的“AI安全级别3(ASL-3)”标准,11正是基于对模型可能具备物攻击能的担忧,也部分印证了Dario Amodei此前的判断。歌前席执官、曾任美国国家智能安全委员会联合主席Eric Schmidt也指出AI可于扩病毒数据库、合成新型化学物质,增加物威胁的可能性。12 命科学领域的专家也提出了同样的担忧。蛋质设计先驱David Baker教授和George Church教授在科学期刊发表了题为:蛋质设计遇物安全的章,DNA合成在设计蛋的实体化过程中发挥着关键作。然,与所有重的命性变化样,这项技术很容易被滥以及于产危险的物制剂。13已有180多位学者与业领袖签署负责任的智能蛋质设计声明指出:尽管当前AI在蛋质设计中的益处远超潜在险,但随着该领域持续发展,有必要引种新的主动险管理法,以防AI技术在有意或意间被滥并造成危害。14 这些声共同传达出个信号:随着智能赋能命科学的能益增强,建前瞻性的模型防护标准、国内监管机制和跨国合作框架,已成为全球科技治理的迫切任务。14 Responsible AI x Biodesign,“Community Values,Guiding Principles,and Commitments for the Responsible Development of AI for Protein Design”2024-03-08,https:/responsiblebiodesign.ai/13 David Baker&George Church,“Protein design meets biosecurity,”2024-01-25,https:/www.science.org/doi/10.1126/science.ado1671 12 Amanda Miller,“Bioweapons Designed by AI:a Very Near-Term Concern,Schmidt Says,”2022-09-12,https:/ Anthropic,“Activating AI Safety Level 3 Protections,”2025-05-23,https:/ 10 Dario Amodel,“For a hearing on Oversight of A.I.:Principles for Regulation,”2023-07-25,https:/www.judiciary.senate.gov/imo/media/doc/2023-07-26_-_testimony_-_amodei.pdf 9 AIxBio Global Forum,Statement on Biosecurity Risks at the Convergence of AI and the Life Sciences,2025-07-17 https:/www.nti.org/analysis/articles/statement-on-biosecurity-risks-at-the-convergence-of-ai-and-the-life-sciences/8 John Mecklin,“2025 Doomsday Clock Statement,”2025-01-28,https:/thebulletin.org/doomsday-clock/2025-statement/3 智能 x 命科学的负责任创新 5.本报告求促进智能命科学负责任创新的中国案和实践落地 1)本报告的讨论范围 本报告聚焦智能 命科学交叉领域的正向应前景与潜在物险,特别关注前沿智能与物技术的交集,包括基础模型、物设计具和动化科学,在赋能命科学过程中所展现出的新兴能及其治理挑战。报告通过对代表性技术融合趋势、正向价值、险识别、险分析、险治理实践的系统梳理,提出具有前瞻性险缓解和治理路径和动推进建议,旨在为科技界、政策界和产业界提供实参考与对话基础。报告内容基于泛献综述、前沿实践观察以及多观点整合,求在快速演进的技术背景下保持前沿性与动态适应性。2)本报告的适对象 本报告向五类关键动,旨在为不同主体提供具有针对性的参考建议与实践指引:政府监管机构:可参考本报告识别新兴物险类型,优化智能与物技术交叉领域的监管边界、数据合规与责任划分机制,提升国家物安全治理能。智能研发机构:尤其是基础模型和智能具的开发,可据此报告建内嵌式防护机制、开展能红队测试、预设能边界与途限制,落实开发阶段的险预防责任。命科学产学研机构:包括校实验室、物制造企业等机构,可借助本报告识别智能具的适范围与使险,引导智能在设计、构建、测试、学习等环节的负责任部署。安全与治理研究机构:可参考报告中的险分类、分析法与治理路径建议,开展智能与物技术交叉下的政策研究、伦理评估与制度设计,促进科学、安全与公共利益的系统性协同。国际组织与平台:如多边治理平台、业联盟等,可参考本报告推动建跨境险识别标准、信息共享框架与能准规则,助构建智能与物技术融合场景下的全球治理共识。3)本报告的主要章节 第1章:技术融合趋势。本章聚焦三类对命科学影响显著的AI能路径:语/多模态基础模型、物设计具、动化科学。我们梳理了其近期发展动态、代表性模型与具,分析其赋能药物研发、合成路径设计、功能蛋预测等场景的价值,也指出这些能的可组合性、可迁移性和普适性正在降低误槛,带来模型扩散与能滥的现实险。4 执摘要 第2章:正向价值。本章介绍AI在命科学领域可带来的社会正向价值。AI具已在药物发现、疾病预测、精准诊疗、疫苗开发、物制造等场景中显著提升效率与创新能。与此同时,AI也正被于优化物安全治理本,例如于异常实验监测、物数据审计、政策辅助评估等向。合理使AI可显著提升命科学研究能与物险响应能。第3章:险识别。本章将智能与命科学融合的险划分为三类:是事故险,指模型能误、实验失控、结果不可预测等恶意后果;是滥险,即被恶意为体利AI具从事合成病毒、逃逸突变等危为;三是结构性险,如削弱物安全防护体系、放物技术的两险、引发新兴物安全挑战等。在此基础上,本章亦讨论了当前险判断的争议,指出险认知应平衡技术潜与现实可性,避免估或忽视潜在威胁。第4章:险分析。本章梳理针对智能是否显著提升物险的研究与分析法。代表性的分析法包括问答数据集与动基准测试、领域专家红队测试、主智能体与具使评估、能提升实验与类在环评估等。这些评估有助于理解模型能边界、训练数据险,交互可能引发的下游滥意图。总体,当前围绕智能与物险的研究仍处于早期阶段,理论模型多具推测性,实证法的系统性与透明度亦有限,尚难撑科学严谨的险评估与预框架。第5章:险治理实践。本章对国内外五类关键动的实践进总结:政府监管机构、智能研发机构、命科学产学研机构、安全与治理研究机构,以及国际治理机构。总结其在模型红队测试、物信息安全、伦理审查机制、国际对话机制等的治理探索,指出现有实践在跨学科联动、职责边界、险级别划分等仍然不充分,为各国建有效责任体系提供参考。第6章:前瞻性险缓解和治理路径。本章提出应对险的四类缓解路径。是应为智能-物能建技术护栏,包括模型能阈值控制、途限制、训练数据审计等,防危险能被滥。是需加强数字-物理界的物安全,通过合成订单筛查、为记录与AI成序列的功能预测,阻断模型能向现实危害的转化路径。三是应将相关险纳流病防范体系,强化预警、备案和响应机制,融国家物安全治理架构。四是强化物科研的安全伦理建设,通过伦理审查、安全培训与责任机制,推动技术创新与规范共进。第7章:动推动建议。本章基于第6章提出的险缓解与治理路径,围绕政府监管机构、智能研发机构、命科学产学研机构、安全与治理研究机构、国际组织及平台五类关键动,构建“策略路径 动职责矩阵”,明确各在不同策略路径下的主要与次要责任分。本报告并成熟的治理框架或操作性指南,是份推动智能 命科学的负责任创新的路径探索。我们希望它能为智能、命科学与物安全等领域之间建系统性对话提供助,也诚挚期待来科研、产业与政策领域的批评指正与共同完善。5 智能 x 命科学的负责任创新 术语定义 物研发和物安全相关术语,主要参考天津学物安全战略研究中、核威胁倡议组织:设计-构建-测试-学习(Design-Build-Test-Learn,DBTL)循环:是种迭代式科学法,泛应于合成物学、物程、药物开发等领域,其核在于通过快速实验与反馈,不断循环优化设计,逐步完善标物系统或产品,最终实现预期功能。数字-物理界(Digital-Physical Interface):指物学中将智能模型成的数字设计转化成物现实的关键环节。这转化过程为监管提供了重要切点:除了为智能模型本建技术护栏外,还需重点管控数字设计向物制剂的实现路径。物安全(Biosafety)险:源于故意的类为,可能由物实验室中不恰当接触危险成分或意外释放引起。物安保(Biosecurity)险:指未经授权的获取、丢失、盗窃、滥、转移或故意释放等为。鉴于我国物安全法亦已涵盖者的主要内容,且国际实践中两者界限并不总是严格区分,故本报告统使“物安全”险词指代两类险。物武器(Biological weapon):是指和平途的微物剂、物毒素或其他物剂,或将相关物剂改造成为于敌对的或者武装冲突设计的武器。物攻击(Biological attack):是指出于敌意的,蓄意使病原体、毒素或其他物制剂,对类、动植物或态系统造成伤害、扰乱或破坏的为。物险链(Biorisk chain):是个概念模型,于系统性地描述从意图到物危害发之间所需经过的各个关键步骤,尤其适于理解物武器研发、误或意外事件中,哪些环节可能受到智能等技术影响、哪些节点可以进预以降低险。两科学(Dual-use science):可应于有益的(如医学或环境解决案),但也可能被滥造成伤害(如物或化学武器研发)的研究和技术。智能相关术语,主要参考斯坦福学、智源研究院、核威胁倡议组织:基础模型(Foundation Model):在规模泛数据上训练的模型,使其可以适应泛的下游任务;国内学界外的主流表述通常简称为“模型”。语模型(Large Language Model,LLM):最成熟和泛部署的基础模型类型,专注于处理然语任务。型X模型(Large X Model,LxM):基础模型正逐步扩展其数据处理范围,涵盖图像、视频和频等,朝着多模态向发展,形成义模型体系。6 术语定义 通型智能(General Purpose AI,GPAI):通常基于深度学习等法构建,可执并帮助完成多种任务,例如为数据成本、图像、视频、频、动作或注释。与AGI(通智能)不同,GPAI更强调实际途的泛性,类平智能。在欧盟智能法等国际规范中,GPAI应根据其能及途受相应监管。物通型智能(Biological general-purpose AI):因AlphaFold 3已能完成物领域多种预测任务,甚需微调,国际智能安全报告提出将其定义为物通型智能,该定义尚处于探索阶段。物设计具(Biological design tool或Biodesign tool,BDT):指通过对物序列数据(如 DNA、RNA、蛋质序列)进训练,具备成新型物分、系统或特性所需序列或结构能的 AI 模型与具。与仅于预测的具不同,BDT强调设计导向和可实验实现性。AI赋能的物具(AI-enabled biological tool,BT):指基于物数据开发,并通过机器学习技术训练的AI具,虽不定具备成新型分的能,但可于结构预测、功能识别、实验优化等辅助性任务。例如,基于DNA序列训练的语模型,或于蛋质结构预测的AI具,常被集成于物科研与程流程中。为了避免使过于严格的术语,本报告将此类具备数据驱动推理能、服务于物研发的具统称为“AI赋能的物具”。动化科学(Automated Science):指通过AI实现科学发现流程的动化,或将完整过程交由AI主执。7 智能 x 命科学的负责任创新 贡献与致谢 本报告的主要贡献者 安远AI:亮(主要撰写)、谢旻希、段雅、王伟冰、程远 天津学物安全战略研究中:王忠、薛杨、韩义平 致谢 衷感谢天津学教育部物安全战略研究中主任、北洋讲席教授张卫,天津学法学院副教授、物安全战略研究中研究员王蕾凡,外交学院全球物安全治理研究中副主任李福建,外交学院国际关系研究所教授望来,在报告撰写过程中给予的悉指导与宝贵建议。同时感谢国际基因程机器赛(iGEM)协调官包堉含,外交学院全球物安全治理研究中年研究员陈博凯,安远AI伙伴张玲、褚艾霖、周卓然、罗景星、王润、丽儒、刘顺昌、徐淼等对报告的建议与贡献。如何引本报告 安远AI,天津学物安全战略研究中,智能 x 命科学的负责任创新,2025 8 录 录 执摘要.1 1 技术融合趋势.1 1.1 基础模型(Foundation Models).1 1.2 物设计具(Biological Design Tools,BDT).2 1.3 动化科学(Automated Science).3 1.4 需要监测的关键能领域.4 2 正向价值.6 2.1 AI赋能命科学的研究与应.7 2.1.1 改进科学发现流程:赋能DBTL循环(AI).7 2.1.2 加速应转化过程:从科研到产业.9 2.2 AI赋能物安全治理的防御体系.11 2.2.1 预测(Prediction).12 2.2.2 检测(Detection).12 2.2.3 预防(Prevention).13 2.2.4 应对(Response).13 3 险识别.15 3.1 事故险.16 3.1.1 步骤:研究设计与信息收集.16 3.1.2 步骤:材料采购与准备.16 3.1.3 步骤:实验操作与处理.17 3.1.4 结果:意外泄漏.18 3.1.5 结果:潜在传播.19 3.2 滥险.19 3.2.1 步骤:研究设计与信息收集.19 3.2.2 步骤:材料采购与准备.21 3.2.3 步骤:实验操作与处理.22 3.2.4 结果:故意部署.23 3.2.5 结果:潜在传播.23 3.3 结构性险.23 3.3.1 智能削弱物安全防护体系.23 3.3.2 智能放物技术的两险.25 3.3.3 智能引发新兴物安全挑战.26 3.3.4 智能和物竞赛引发制度性险.28 3.4 险判断的争议与局限.29 3.4.1“现实部署执难”.29 9 智能 x 命科学的负责任创新 3.4.2“边际险证据弱”.30 3.4.3“致命物质已够多”.30 4 险分析.31 4.1 获取物信息并进策划(针对通型基础模型).32 4.1.1 分析法.32 4.1.2 评估基准.32 4.1.3 研究综述.34 4.1.4 归纳与展望.38 4.2 合成有害物制品(针对专型AI赋能的物具).38 4.2.1 分析法.38 4.2.2 评估基准.38 4.2.3 研究综述.39 4.2.4 归纳与展望.41 4.3 其他险模型.42 5 险治理实践.44 5.1 政府监管机构.44 5.1.1 中国:已形成物安全管理法律制度顶层设计.44 5.1.2 美国:认为物威胁是本国的最威胁.45 5.1.3 英国:将物武器列为级险.47 5.1.4 欧盟:寻求“更美好世界中的欧洲安全”.49 5.2 智能研发机构.50 5.3 命科学产学研机构.51 5.4 安全与治理研究机构.52 5.5 国际组织与平台.55 6 前瞻性险缓解和治理路径.57 6.1 为智能-物能建护栏.57 6.1.1 技术防护措施.58 6.1.2 险监测预警.59 6.1.3 治理机制建设.60 6.2 加强数字-物理界的物安全.62 6.3 推进流病防范.64 6.4 强化物科研的安全伦理建设.65 7 动推动建议.68 7.1 策略路径与动职责矩阵.68 7.2 各和职责简要总结.70 10 1 融合趋势 1 技术融合趋势 o3(由OpenAI发布的成式预训练模型)所体现的发展趋势可能对智能险产深远影响。科学和编程能的提升此前已为络攻击和物威胁等险提供了更多证据。图灵奖得主 约书亚本吉奥(Yoshua Bengio)15 智能与物技术的交集包括为多种的开发的具,包括基础模型、物设计具和动化科学,这些技术融合可能会以多种式加速命科学的进步,从促进科学培训到帮助科学家设计新的物系统。智能的快速进步已经降低了程物学的障碍,但这些具的未来能、演进速度以及何时会出现突破,仍然存在巨的不确定性。1.1 基础模型(Foundation Models)基础模型是类基于海量数据训练的规模机器学习模型,具备执然语处理、图像识别等多种任务的通能。这些通模型为进步的机器学习研究奠定了基础,并可针对特定应进微调。基础模型益成为智能与物学交叉的重要驱动。尽管基础模型并专为命科学设计,但它们已在物信息提取、实验设计、教育培训等显出显著潜。当前,语模型(Large Language Model,LLM)是最为成熟和泛部署的基础模型,专注于处理然语任务。它们能整合来科学献、络论坛和数据库等多源异构信息,并以清晰、结构化的语成式进输出,从显著提升科研信息的获取效率和可读性。这能使得专业也能理解复杂的命科学概念,甚具备初步设计分物学实验的能。些向特定领域优化的语模型,如BioGPT已在专业术语处理、实验流程建模等实现进步突破,为科研提供更具针对性的持。与此同时,基础模型正逐步扩展其数据处理范围,涵盖图像、视频和频等,朝向多模态发展,形成被称为型X模型(Large X Model,LxM)的义模型体系。多模态基础模型有望在物实验实时指导、复杂实验流程优化等发挥更作。例如结合视频数据的基础模型可在实验过程中提供动态反馈,辅助排查故障或改进操作流程。借助与科学具和实验室机器平台的集成,部分模型甚能够编写实验协议,指导动化实验执,降低科研槛。然,基础模型在物领域的应也临关键挑战。先,它们所传递的知识多源已有公开材料,因此在创新性、关于实验室作的隐性知识的持存在局限。其次,基础模型容易“产幻觉”即成看似合理但实际上错误的信息,尤其在多步骤推理或复杂逻辑15“The trends evidenced by o3 could have profound implications for AI risks.Advances in science and programming capabilities have previously generated more evidence for risks such as cyber and biological attacks.”Yoshua Bengio et al.,“International AI Safety Report 2025,”2025-01-29,https:/www.gov.uk/government/publications/international-ai-safety-report-2025 1 智能 x 命科学的负责任创新 跳跃等任务中,错误率显著上升。这问题对缺乏科学背景的尤其具有险,可能导致实验失败或误解关键机制。尽管当前已有诸如“思维链”等技术于提升模型推理能,以微软等公司为代表的开发者也在减少幻觉投了量研发作并取得定进展,但这问题尚未得到根本性解决。总的来看,基础模型正逐步成为命科学领域的重要具,尤其是在信息整合、学习辅助和实验动化展现出巨潜。未来,随着多模态能增强、推理性能提升以及错误成率降低,其在物学中的有望从辅助性具向深层次知识产与科学协作平台转变。16,17 1.2 物设计具(Biological Design Tools,BDT)物设计具是智能在命科学和合成物学中的重要应形态,义上属于AI赋能的物具(AI-enabled Biological Tools,BT)的核组成部分。BDT主要指通过对物序列数据(如DNA、RNA、蛋质序列)进训练,成具有预期功能的新型物分或特性的AI模型与具。这类具已被于蛋质结构预测、新型蛋设计、DNA和细胞设计等任务,代表性具包括AlphaFold、RFDiffusion、ProteinMPNN、ProGen2、Ankh,以及专于DNA调控序列设计的ExpressionGAN等。18 与通语模型处理然语不同,BDT直接输出的是具有功能意义的物序列,具备更强的“功能导向性”。例如,科学家可借助BDT设计具有特定三维结构或结合能的新型蛋质,于开发疫苗、抗体、物酶、功能材料或治疗法。这种从标功能出发的设计式,尽管成的序列仍需依赖实验验证,但显著提升了分设计的效率与成功概率,也使结构物学背景的研究员更容易参与分程流程,降低了专业槛、拓展了设计主体。多数BDT在架构上借鉴LLM,但其物数据的建模式使模型得以捕捉分层级的结构与功能规律。例如,AlphaFold 2展了通过深度学习预测蛋质结构的命性潜。DNA折纸术、蛋质表达调控、细胞为控制等复杂任务,也开始受益于这类模型。与此同时,未来可能出现将BDT与通基础模型融合的趋势,借助然语提实现更直观的设计交互。19 尽管BDT前景阔,但仍受限于若技术和实践瓶颈:先,物系统本的复杂性,以及将物序列与物功能对应关系的理解尚不充分,使得模型预测准确性受到限制。其次,当前只有在蛋质结构等存在质量标注数据的领域内,模型才能展现较强性能。第三,设计结果的实际可性仍依赖实验室验证与专知识,尤其是在输提阶段,需要具备对分结构和功能的深理解。20 20 同注1(NTI,2023)19 因AlphaFold 3已能完成物领域多种预测任务,甚需微调,国际智能安全报告已将其定义为物通型智能(biological general-purpose AI)。18 同注16(Sandbrink,2023)17 同注1(NTI,2023)16 Jonas B.Sandbrink,“Artificial intelligence and biological misuse:Differentiating risks of language models and biological design tools,”2023-06-24,https:/arxiv.org/abs/2306.13952 2 1 融合趋势 展望未来,随着通量实验平台、动化测量系统和闭环数据的发展,BDT将在“设计-构建-测试-学习”(DBTL)循环中扮演更核的。值得指出的是,BDT是当前最具代表性的AI赋能物具(BT)类,但并BT的全部。BT还包括其他不直接从事分设计但同样可能影响物研发过程的具,例如毒性预测、病原体特性识别、实验动化平台等。专家们普遍认为,BT将突破物学的可能性边界,不过对其实现时间存在分歧。21多数专家预测,在获得充资持且能快速成数据的重点领域,未来五年内将取得显著突破,极加速新分与系统的发现效率。22 1.3 动化科学(Automated Science)动化科学指通过AI实现科学发现流程的动化,或将完整过程交由AI主执。其核在于解决传统科学研究对海量可能的实验路径,类难以系统化探索所有选项的局限性。AI具已被应于科学研究过程的各个环节:献检索、假设成、实验设计、软件编写、机器平台指令编程、数据收集以及结果分析等。23预计在不久的将来,更多步骤将实现动化。动化科学的突出优势在于其处理复杂性和规模的能。AI模型可模拟远超类认知负荷的系统(如百万级粒相互作),并加速实验迭代。例如,2009年机器科学家“亚当”主发现酵基因功能,2015年“夏娃”实现药物研发动化,2020年利物浦学的移动实验室机器则能主搜索化学反应催化剂。这些案例证明AI可显著提升科研效率,尤其在需要通量测试的领域。近年来,动化科学正从“单具”转向“多AI协同的主智能体系统”。例如,AutoGPT通过连接LLM的推理能,联动互联搜索与专业具完成复杂标;ChemCrow能解析然语指令设计化学流程。近期研究亦指出未来的科研流程或将由多智能体系统与主实验平台协同完成,从确定研究标、规划实验路径到动执和优化策略,均可由AI系统主决策与反馈闭环实现。24更前沿的尝试中,ChatGPT已能基于数据集主提出假设、编写分析代码,并撰写论初稿,尽管仍需纠错;Google DeepMind的AlphaEvolve系统则融合进化搜索与科学推理法,可动成并验证假设,展现出“科学直觉”的雏形,这类系统已初步展现出实现端到端科研动化的潜。然,当前动化科研系统主要依赖显性知识的建模与推理能,对隐性知识的感知与模拟仍存在显著挑战,动化科学临的另个核挑战在于AI模型的可解释性。多数缺乏对AI底层逻辑的理解,易导致能估或盲信任。模型“盒”般的决策过程可能导致24 ZJU,“Integrating protein language models and automatic biofoundry for enhanced protein evolution,”2025-02-11,https:/ 23 同注1(NTI,2023)22 Christopher J.et al.,“Dynamic control in metabolic engineering:Theories,tools,and applications,”2021-01,https:/ 21 同注1(NTI,2023)3 智能 x 命科学的负责任创新 成虚假信息或编码错误,从引发科学严谨性问题。此外,AI与类认知模式的差异可能产难以预的错误,这对验证科学发现的可靠性提出更要求。尽管临挑战,动化科学仍被泛视为科研范式演化的重要向。随着多模态AI、主智能体与动化实验平台的持续进展,机协作将可能成为未来科研的基础配置。其最终潜在于拓展类认知边界,在度复杂系统建模、规模实验路径探索等向开辟新范式,实现从“类主导”向“智能增强”的根本跃迁。1.4 需要监测的关键能领域 鉴于智能与物技术交叉领域的科学进步具有度不确定性,难以预测特定险的出现时间及条件。以下领域对智能相关的灾难性险均可能产显著影响,值得重点关注:1.基础模型为先进物应提供有效实验指导的能;2.云实验室和实验室动化在降低物技术实验专业知识需求的进展;3.宿主遗传易感性对传染病研究的两进展;4.病毒病原体精准程的两进展。25 上述能向可通过多个具体评估任务加以测量。已有专家对其中的5项代表性能(病毒学实验故障排查、物威胁设计问答、专家在AI辅助下合成流感病毒、物武器攻击策划、两DNA获取)的实现时间进了预测,结果显:图1:各预测评估能实现的中位数年份。点表组中位数,线表组中位数的95%置信区间 25 CNAS,“AI and the Evolution of Biological National Security Risks Capabilities,Thresholds,and Interventions,”2024-08-13,https:/as.org/publications/reports/ai-and-the-evolution-of-biological-national-security-risks 4 1 融合趋势 专家可能低估了当前语模型的能。尽管多数专家认为这些能可能要到2030年2040年之间才会实现,但与SecureBio的联合研究显,OpenAI的o3模型已在病毒学实验故障排查测试(Virology Capabilities Test,VCT)中表现出与顶尖病毒学专家相当的平26,这项能原本被专家预测将在2030年之后才能达成。另项能即模型在应对篇(long-form)物威胁设计问题的强表现很可能也已经实现。27 随着智能技术的持续进步,密切跟踪这些领域的能演进、评估潜在物安全险,对制定有效防控的政策和措施关重要。27 Bridget Williams et al.,“Forecasting LLM-enabled biorisk and the efficacy of safeguards,”2025-07-01,https:/forecastingresearch.org/ai-enabled-biorisk 26 SecureBio etc.,“Virology Capabilities Test,”2025-04,https:/www.virologytest.ai/5 智能 x 命科学的负责任创新 2 正向价值 我直在思考智能如何减少世界上些最严重的不平等现象。我认为智能将以多种式改善医疗保健和医疗领域,加快医学突破的速度。美国企业家、慈善家,微软公司联合创始 尔盖茨(Bill Gates)28 智能与物技术的融合已成为科研与产业的战略赛道,其应潜正迅速显现,相关效益与险的评估主要取决于数据质量、物学的科学基础以及智能模型的技术能。利计算法理解和应物学并新鲜事物,其历史可追溯近四年前29。随着物数据的泛积累、多组学测序技术的发展以及先进计算能的提升,智能有望显著增强并加速类对复杂物系统的研究能。智能与命科学的深度融合是近年来的新兴趋势。现代智能的基础“深度学习”诞于2012年,其在命科学领域的泛应则滞后数年。早期研究虽已取得初步成果,但真正引发全球关注的是2021年由DeepMind团队研发的AlphaFold,以及华盛顿学Baker实验室研发的RoseTTAFold。这两项具通过深度学习法成功解决了达50年的根据氨基酸序列预测蛋质三维结构的科学难题。2024年,诺尔化学奖半授予David Baker,以表彰其在计算蛋质设计的贡献;另半则共同授予Demis Hassabis和John Jumper,以表彰他们在蛋质结构预测的成就。进步彰显了智能在物科学中的突破性价值。Demis Hassabis曾指出,DeepMind利AI在年内完成了相当于“亿年博研究作量”的蛋质结构预测任务。智能正在成为研究命系统的新具,并在多个命科学领域中快速扩展。例如,清华学智能产业研究院和分共同推出的全球个命科学与制药智能体开源平台OpenBioMed30,打破了类语与物分语之间的壁垒,使科研员仅凭然语指令即可在时级时间内完成从靶点发现到候选药物设计的流程,显著缩短了传统需耗时数年的研发周期。根据中国科学技术信息研究所发布的AI for Science创新图谱31,命科学是前AI for Science应最为丰富、潜最的向之,中美两国已成为该领域的领先国家。31 中国科学技术信息研究所,“AI for Science创新图谱,”2025-03-11,https:/ 30 清华学AIR和分,“OpenBioMed开源平台,”2025-03,https:/ 29 Dhrithi Deshpande,“The evolution of computational research in a data-centric world,”2024-08-22,https:/doi.org/10.1016/j.cell.2024.07.045 28“Ive been thinking a lot about how AI can reduce some of the worlds worst inequities.I see several ways in which AIs will improve health care and the medical field.AIs will dramatically accelerate the rate of medical breakthroughs.”Bill Gates.,“Heres what the age of AI means for the world,according to Bill Gates,”2023-03-28,https:/www.weforum.org/stories/2023/03/heres-what-the-age-of-ai-means-for-the-world-according-to-bill-gates 6 2 正向价值 2.1 AI赋能命科学的研究与应 2.1.1 改进科学发现流程:赋能DBTL循环(AI)在合成物学中,“设计-构建-测试-学习”(DBTL)循环是种于设计、构建和评估物系统的迭代法,它具有内置的反馈回路,可根据实验数据改进设计。构思或假设的成通常先于设计。设计阶段定义概念案,描述如何实现预期输出,并可利计算建模具。AI赋能的物具能够提供数据驱动的洞察,在型数据集中发现模式,并成新颖的想法和设计,从显著加速构思和设计。例如,在药物研发应中,此类具可以在天内成数千个潜在候选分32,这对于研究员来说可能需要数年时间才能实现。构建阶段是DBTL周期的关键点,在此阶段,数字输出将转化为物理实现。在测试阶段,将评估设计的代理是否按预期运。在这些阶段,动化实验室可以显著提效率和吞吐量,但也存在些挑战。从构建和测试中提取数据,在学习阶段完善和优化设计,可以实现持续改进和知识成。DBTL的迭代过程考虑了物系统本的复杂性和变异性,并强调了将AI驱动的设计或建模与实验验证相结合的必要性。图2:AI赋能的物具对合成物学数字-物理任务的影响,前最的能提升(AI)体现在构思和设计阶段33 AI赋能的物具可以通过提供数据驱动的实验验证指导、成新的假设和想法以及在型数据集中发现模式,来加速和优化研究设计和发现。此外,AI可以促进数据分析,并增强在DBTL循环学习阶段从实验数据中获得的洞察,从在反馈回路中不断完善DBTL循环并成33 NASEM,“The Age of AI in the Life Sciences:Benefits and Biosecurity Considerations,”2025,https:/doi.org/10.17226/28868 32 Feng Ren et al.,“A small-molecule TNIK inhibitor targets fibrosis in preclinical and clinical models,”2024-03-08,https:/doi.org/10.1038/s41587-024-02143-0 7 智能 x 命科学的负责任创新 知识。重要的是,AI赋能的设计并取代实验验证的需要;相反,它可以通过将计算机模拟与实验法相结合来增强这过程。1)构思(Ideas)和设计(Design):语模型和基础模型 得益于可扩展性和上下学习能,语模型已成为然语理解与成的关键具,在多个基准任务中表现优异。尽管存在幻觉与推理能有限,LLM仍在创意成中展现潜。另有类“科学语模型”正在快速发展,辅助科研员进知识提取、数据解读与假设成,如CRISPR-GPT34和ChemCrow35。此外,基础模型可通过预训练与微调适应特定任务,进步拓展其在科学发现中的作。除本成外,基础模型正延伸多模态向,结合本、图像、视频等模态提升研究能。例如,IsoFormer可预测不同组织的转录表达36,医学影像领域的多模态模型正于精准治疗。Transformer架构如Mamba37等也在探索中,以降低训练与推理成本。多模态基础模型有望成为科学构思与设计的体化平台,但前仍临数据规模、模态融合等挑战。2)构建(Build)与测试(Test):动化实验室 当前的物程应通常需要多轮DBTL循环,才能实现满预期性能标的物设计。为提升成功率、缩短开发周期并降低成本,动化技术已泛应于构建与测试环节。此类实现合成物学DBTL流程动化的设施通常被称为“物制造”。虽然物制造的动化平显著提升,但其功能各异,通常向特定途,例如规模DNA组装、微物程或哺乳动物细胞程等。近年来,物制造开始于成AI训练所需的数据集,从以实验室在环(lab in the loop)式加速AI模型迭代,减少DBTL所需的循环次数。这法强调将AI驱动的实验设计与实验室动化相结合,使实验产的数据进步于优化AI模型。在具备强实验动化能的前提下,该法有望撑规模成物数据。然,也引发了对潜在滥的担忧,例如恶意为者可能借助全动实验室开发险产品。尽管如此,“完全动运”的实验室仍处于探索阶段,相关建设临巨挑战。前的物制造依然度依赖和资投,且多为任务专、资源密集型系统。38 38 Hector Martin et al.,“Perspectives for self-driving labs in synthetic biology,”2023-02,https:/doi.org/10.1016/j.copbio.2022.102881 37 Albert Gu,Tri Dao,“Mamba:Linear-Time Sequence Modeling with Selective State Spaces,”2023-12-01,https:/arxiv.org/abs/2312.00752 36Juan Jose Garau-Luis et al.,“Multi-modal Transfer Learning between Biological Foundation Models,”2024-06-20,https:/arxiv.org/abs/2406.14150 35 Andres M.Bran et al.,“Augmenting large language models with chemistry tools,”2024-05-08.https:/doi.org/10.1038/s42256-024-00832-8 34 Yuanhao Qu et al.,“CRISPR-GPT:An LLM agent for automated design of gene-editing experiments,”2024-10-15,https:/doi.org/10.1101/2024.04.25.591003 8 2 正向价值 3)学习(Learn):合成数据 在医疗健康、物程等数据敏感且样本稀缺的领域,合成数据正成为关键替代资源。相较于获取质量真实数据的昂成本和伦理限制,合成数据不仅能以更低代价扩充训练集,还可增强数据多样性、平衡性与代表性。合成数据可通过规则、统计建模或成模型成。尤其是在训练数据可公开的场景下,成模型可以在保证隐私前提下提供功能强的训练持。例如在医学影像领域,通过合成数据扩充罕病样本已显著改善模型性能。在蛋质、分等结构预测任务中,合成数据也帮助模型克服实验数据匮乏的问题。不过,合成数据的有效性仍需谨慎评估。若成法不合理,可能引偏差、错误或不具代表性的样本,反损害模型性能。此外,训练数据分布的偏差可能会被合成数据进步放。建议未来研究需关注成质量控制、评估标准制定以及成模型的可控性与可解释性。39 2.1.2 加速应转化过程:从科研到产业 智能正在深刻改变命科学的研究范式,其影响不仅体现在基础研究效率的提升,也益成为科研成果实现应和产业价值的关键推动。在药物研发、精准医疗、物制造等多个领域,AI技术正显著缩短从实验室到市场的周期,提成果转化效率与可性。1)精准医疗:机制建模、多组学解析、靶点发现 机制建模,AI正被于构建疾病发展的动态模型,帮助理解分层的病理机制。例如,图神经络与深度成模型可于模拟信号通路失调、免疫逃逸等物过程,从揭如肿瘤发、免疫疾病等复杂疾病的本质。部分模型如基于物理约束的PINN框架,还可将理参数融神经络,提预测的可解释性和临床价值。通过“机制建模 数据驱动”的融合策略,AI不仅能持病因研究,也为预机制提供参考路径。多组学解析,AI显著提升了从基因组、表观组、蛋组、代谢组等多源数据中提取规律的能。预训练模型如xTrimo V3和Uni-RNA通过统嵌不同模态的数据,使模型具备跨组学关联分析与特征提取能。这种能可于识别疾病亚型、构建分分型标签,并通过图谱学习等技术整合多模态特征,挖掘疾病发发展的关键路径与节点,为精准诊疗提供更系统的持。靶点发现,AI通过整合组学数据与海量献信息构建疾病与靶点的知识络,帮助药企识别潜在“可成药”靶点。例如,BenevolentAI和Insilico Medicine等企业构建了靶点优选39 Ilia Shumailov et al.,“AI models collapse when trained on recursively generated data,”2024-07-24,https:/ 9 智能 x 命科学的负责任创新 平台,结合然语处理、因果推理、蛋结构预测等法,实现效靶点筛选与验证。在中国,智谱AI等公司也在推动AI模型在靶点优选、药物再定位等场景的实际部署。在2024年,百图科发布全新命科学基础模型xTrimo V3,拥有2100亿参数,是当时全球规模最的命科学领域AI基础模型,覆盖蛋质、DNA、RNA 等七命科学主流模态;在蛋质领域,实现全球个混合专家(MoE)架构;DNA序列度突破128K,为基因组学、遗传病预测和精准医疗领域提供更的准确性。40 2)药物研发:靶点设计、分设计、筛选与优化 靶点设计,AI可基于疾病机制模型与多源数据,辅助构建和优化靶点分结构与功能特性,推动靶点的理性设计与程改造。通过献挖掘、图谱推理及蛋质结构预测(如AlphaFold),AI能够揭关键驱动基因与蛋的活性位点和构象多样性,指导设计更具成药潜的靶点分结构。例如,融合组学数据与物络信息,有助于优化靶点的结构特征和药效关联,提后续药物设计的针对性与成功率。分设计,AI正推动“先导化合物从零设计”成为现实。成式模型能够根据靶点结构与构象,成具有理想药理属性的新分。David Baker团队提出的RFDiffusion就是这向的代表作,可动成符合空间位形限制的蛋结合配体。在实际中,这种法也被应于分药物、抗体药和mRNA疫苗设计中。筛选与优化,AI正在替代传统的通量筛选与经验优化。通过分动学模拟、由能计算与ADME/T预测,AI模型可在候选分中评估药代动学、毒性与代谢稳定性,并多标优化其结构。例如,晶泰科技结合AI 物理仿真加速晶型预测和构象筛选,助药企在数内推进数个分进临床前验证阶段。此外,AI也可于预测合成路径,提升化合物实际可得性。据IDC统计,到2025年AI应市场总值将达到1270亿美元,其中健康业将占市场规模的五分之。在制药领域,中国公司是全球AI 制药不可忽视的量。截2023年底,全球AI研发新药已有超过100项成功进临床阶段,其中II、III期临床试验占达45%,有约1/5来中国公司。41 3)农业技:科学育种、化肥研发、植保研究 科学育种,AI通过对遗传、表型、环境数据的整合分析,建作物性状的预测模型,显著提升育种效率。中科院遗传发育所与阿达摩院联合开发的智能育种平台,基于通量表型识别、基因关联分析与候预测建模,已应于稻、等主粮作物的抗性筛选。国外企41 新浪医药,“对话百图科:解码命语,AI模型让药物研发更快、更准,”2024-11-04,https:/ 40 钛媒体AGI,“对话百图科:融资超14亿元、订单超142亿元,下步要做命科学AI模型提供商,”2024-11-06,https:/ 10 2 正向价值 业如Benson Hill则利AI构建“基因-性状-候”多维数据库,推进耐逆种质资源的发掘与重组。化肥研发,AI正被于开发绿、效的肥料产品与施肥策略。模型可对作物养分吸收机制进建模,预测不同施肥案对产量与环境的期影响。在施层,结合遥感、象、壤检测与农机设备数据,AI可动态调整施肥强度与时机,实现精准农业。如伦敦帝国理的AI施肥模型已在洲和南亚部分地区取得显著增产与减碳效果。植保研究,AI通过图像识别与时间序列建模等段提升病害监测、预测与响应能。部分AI平台结合遥感卫星与地传感器,可在病害初发期精准识别、定位并建议预策略。此外,AI也正推动绿农药的发现与设计,例如基于成模型优化农药成分、预测靶标相容性与毒性,提升环境友好性与农产品安全性。4)业技:线路设计、代谢优化、构建 线路设计,AI推动合成物学从“调参”向“动编程”。AI模型可分析已有元件序列与表达数据,设计出最优的启动、增强组合与调控逻辑,实现效稳定的表达。结合模型的序列功能映射能,如蛋语模型、蛋结构预测具,可进步在酶程等场景中持通量设计与筛选。代谢优化,AI可构建规模代谢络模型,通过路径分析与通量平衡计算识别关键瓶颈并提出调控建议。以Ginkgo Bioworks为代表的公司已实现结合通量筛选与机器学习优化微物代谢路径,开发多种业化程菌株于物燃料、料、药物合成等。中国多家企业也在通过“AI 动化”进透明质酸、重组蛋等产品的发酵优化。构建,AI正在推动物制造由“项制”向“平台化”过渡。在DBTL闭环中,AI可对每轮实验结果建模反馈,提升迭代效率。结合数字孪、机器实验室、实时过程模拟等技术,未来的“细胞”将具备动诊断、故障预警与优化建议能。例如,天津学与清华学正在开展AI驱动的酶程建模、代谢络重构与菌株调控的集成研究,形成完整物制造作流。2.2 AI赋能物安全治理的防御体系 AI在物安全治理体系中具备双重:AI既是物安全治理的具,也是物安全治理的对象。本节着重探讨对AI作为物安全治理具的有益应,通过改进预测、检测、预防和应对四来增强物安全并减轻物威胁。42,43AI作为物安全治理的对象,将在后续的“险识别”和“险缓解和治理”章节详细探讨。43 Aurelia Attal-Juncqua et al.,“AIxBio:Opportunities to Strengthen Health Security,”2024-06-30,https:/ 42 同注33,(NASEM,2025)11 智能 x 命科学的负责任创新 2.2.1 预测(Prediction)AI在预测的能正快速增强,成为整个物安全治理链条的前置环节。其关键作是通过对病毒序列、环境数据、传播趋势等的建模,提前识别潜在的物威胁,从为检测、预防与应对提供早期输。在疾病防控中,AI可预测病毒如何变异以逃避免疫系统攻击,或在未来成为主导变异株。EVEscape等具可快速识别险突变,并预测疫苗与抗体疗法的有效性变化。这预测能已扩展HIV、流感等病毒,有望变疫苗更新与接种策略。例如,发表于细胞的基于智能探索和记录隐藏的RNA病毒世界研究,利云计算与AI技术发现超16万种新RNA病毒,是已知种类的近30倍。来阿云与中学的科研团队表,基于AI 病毒学的新研究框架刷新了类对病毒圈的认识,将有助于类对未来可能发的流进预警,以及进步推动RNA病毒疫苗的研发。44 在基因变异功能预测,AI模型也开始成为识别潜在致病突变的重要具。例如,来美国弧形研究所、英伟达公司和斯坦福学的研究员开发的Evo 2模型,基于超过12.8万个基因组数据、9.3万亿个核苷酸进训练,在预测良性或致病性突变达到了90%以上的准确率。该模型有望替代部分细胞或动物实验,幅节省时间和成本,加速疾病机制研究与新药研发。这类精度模型在传染病、罕病和病毒变异险筛查等领域均具备应前景。45 预测的能不于疾病本,也涵盖其传播险与态适应性。AI可通过融合地利变化、野动物活动、候数据等,识别畜共患病的险区域与潜在病原体储存库,持多点布控与跨物种传播预警机制的建。AI还可持续分析环境数据,如空与质,识别潜在物剂释放迹象,辅助构建国家级监测与预警体系。综上所述,AI赋能下的预测能不仅提升了类“看未来险”的能,也为政策制定者、科研机构和医疗系统在威胁真正到来之前提供了更为有效的准备窗。2.2.2 检测(Detection)检测是及时识别物安全威胁、实现早期预的关键环节。AI通过处理多源异构数据,显著提升了检测的速度、精度与覆盖,推动了新代物威胁预警系统的发展。AI不仅能分析传统物医学数据,还可挖掘社交媒体、新闻报道、交通趋势等传统数据源,捕捉类分析难以察觉的传播信号和险模式。例如,新南威尔学的EPIWATCH项使AI算法实时分析社交媒体、新闻报道和官健康预警等信息。研究表明,该系统本可在2013年12即检测到西埃博拉疫情的爆发,45 新华,“美研究机构发布物学领域最AI模型Evo2,”2025-02-20,https:/ 44 雷锋,“AI发现16万种新RNA病毒成果登上Cell后,我们和阿云算法专家贺勇聊了聊,”2024-10-15,https:/ 12 2 正向价值 WHO正式宣布疫情时间早了数。类似法在新冠疫情中也显出可性,能在病例尚未正式上报前就发出预警。在医学检测,AI也可于辅助诊断。美国物医学级研究与发展局(BARDA)与Virufy、VisualDx合作开发的AI具,分别可通过咳嗽频或肤图像识别感染险,未来有望集成智能机应,提升众我筛查能。AI还泛应于医学影像分析,如肺结核、肺炎及癌症的X光和CT影像识别,特别适于实验室资源有限的地区。AI驱动的便携诊断具有望将检测能延伸边远地区或医疗服务匮乏地区,实现更早期、更普及的疾病发现。2.2.3 预防(Prevention)预防的标是在检测到潜在险后,及时采取控制与遏制措施,以防危害扩或向更险阶段演化。AI在物安全预防的应可体现在“提前部署”与“系统保障”两:前者指根据预测与检测结果采取精准预,后者则聚焦实验室与物设计具的安全管理。在疫苗预防,AI驱动的结构建模和抗原设计已成为主流。例如,AI辅助结构物学使Moderna和Pfizer疫苗能在疫情初期迅速完成抗原稳定化设计。同时,基于主导株预测结果,医疗资源可实现更精准的投放,提疫苗和药物使效益。AI还将促进快速成单克隆抗体,于被动免疫与早期治疗。未来,免疫分可直接由AI设计依赖康复者样,显著缩短开发周期。在合成物安全,尽管尚处于发展早期,表型预测模型未来可能被于增强DNA筛查机制。根据2024年美国宫科技政策办公室(OSTP)发布的核酸合成筛查框架46,这类具将被于识别出表型度可疑但基因序列不同的合成DNA,防其绕过现有筛查系统进实际操作流程。此外,还可发展“意图识别”与“设计具内嵌安全机制”,例如嵌式筛查模块与志记录,防AI设计具被于成危险病原体。虽然前仍存在误判与滥险,但这类“前置控制”机制可能是未来预防性治理的重要向。2.2.4 应对(Response)应对往往发在危害出现后,强调迅速有效地采取动来使其危害最化。AI有望改变类应对物威胁和流病的式,可泛应于病原体检测、临床决策持、医学对策研发,以及资源调配等多个环节。AI技术可显著加快治疗法和疫苗等医学对策的研发进程,降低成本并提效率,从提升对新发物威胁的快速响应能。例如,流病防范创新联盟(CEPI)推出的Disease X项46 OSTP,“Framework for Nucleic Acid Synthesis Screening,”2024-04-29,https:/bidenwhitehouse.archives.gov/ostp/news-updates/2024/04/29/framework-for-nucleic-acid-synthesis-screening 13 智能 x 命科学的负责任创新 正利AI设计候选抗原靶点,加快针对潜在流病毒的疫苗开发。通过识别并验证具有潜的表位,该法能够加速候选疫苗的开发,使其在新病原体出现时迅速进临床测试阶段。AI还可加快抗病毒药物与抗素的研发进程。AI模型可以效筛选庞的化合物库,预测候选药物的疗效与安全性,从缩短传统药物发现的时间与成本。尽管该领域仍处发展初期,以AlphaFold 3为代表的蛋质结构预测具已在揭病原体物机制展现出巨潜。此外,AI还可优化临床试验设计,通过筛选合适的试验参与者、预测副作险、按反应概率对患者进分层,从提升试验效率与成功率,加快新疗法的上市速度。在医学对策研发之外,AI还可应于疫情期间的接触者追踪。例如可分析位置信息、社交媒体活动及其他数字痕迹,识别可能接触感染者的个体,从实现更有针对性的检测与隔离,遏制疫情扩散。同时,AI对社交媒体趋势的分析还能帮助公共卫部掌握舆情动态、识别虚假信息与误导性叙事,并据此调整宣传策略、增强众信任,从提升应对效果。在公共卫危机期间,AI也能协助医护员预测患者的病程发展,制定更精准的治疗案。通过分析量临床数据,AI模型可识别影响治疗反应、不良反应及期预后的关键因素。例如,AI已被于预测呼吸道重症险,考虑的变量包括年龄、基础疾病与物标志物等,未来可拓展于制定有针对性的预措施。AI融临床决策持系统,可提供基于证据的实时建议,从提升医疗服务质量与效率。最后,在公共卫紧急状态下,AI还可在资源配置与供应链优化中发挥关键作。AI模型可基于疫情传播趋势与医疗系统承载预测关键物资的需求,帮助将资源优先调配最紧迫的地区,从提整体应急响应的效率与成效。14 3 险识别 3 险识别 我们保护的第步,就是了解物武器的本质及其作机制。美国微物学家、物武器专家及物战政管理专家 肯阿利克(Ken Alibek)47 智能可能如何提升物安全险?这议题已出现在公众和政策讨论中,当前的讨论主要聚焦于两类潜在机制:降低滥槛:AI具可能使原本复杂的物程流程更易被专业掌握,例如通过动成实验步骤、查找替代品、提供误指导等式。提升危害程度:AI具或能够辅助研发出更加致命或更难防范的新型病原体或毒素,例如通过改良传播、逃避免疫系统识别或抗药性增强等式。这两个维度构成了AI增强物险的基本框架,分别对应险的可能性和后果的严重性。图3:基础模型和物设计具可能会改变意外或故意滥物学的险格局48 基于这险格局,本报告进步从事故险、滥险与结构性险三个险来源,以及规划设计阶段与物理执阶段两个时间节点,对潜在险进系统梳理。图4:物险简化视图:区分故意滥与科研活动的事故险以及相关政策预点,参考CSET报告49进了修改 49 CSET,“Anticipating Biological Risk:A Toolkit for Strategic Biosecurity Policy,”2024-12,https:/cset.georgetown.edu/publication/anticipating-biological-risk-a-toolkit-for-strategic-biosecurity-policy/48 同注1(NTI,2023)47“The first step we must take to protect ourselves is to understand what biological weapons are and how they work.”Ken Alibek,“Biohazard,”1999,https:/www.nlm.nih.gov/nichsr/esmallpox/biohazard_alibek.pdf 15 智能 x 命科学的负责任创新 3.1 事故险 事故险,是指由于为错误、程序缺陷等恶意因素,意外导致有害物后果的险。3.1.1 步骤:研究设计与信息收集 在研究最初阶段,事故险主要源对潜在两信息的评估不。若研究设计涉及增强病原体毒性、传播性或其他险特性,却缺乏充分的险识别与安全规划,便可能为后续实验埋下隐患。同时,物设计具的可及性不断提,使得专业员亦可成危序列、毒素或传播机制。旦研究者缺乏安全意识或未设技术边界,就难以对模型的使和输出进有效管控,从使研究设计本成为潜在信息危害源。50 在这过程中,AI具的使进步加剧了险复杂性。,AI系统在研究设计中若缺乏伦理限制,可能会意成险或不符合伦理的实验案,例如攻击性病原体或合成毒素。51另,若模型本训练数据存在偏差、缺少安全评估机制,或未设置明确的输出边界,也可能意外推荐危险实验法造成事故。多项研究已指出,数据偏差可能导致模型系统性误判某些蛋质或病原体的险等级,从促成危险设计。此外,若AI被授权在设计阶段主优化实验标,却未设置够的监督机制,就存在“主设计失控”的险。52 AI可能在未被察觉的前提下,因追求新颖性或效性成危险性的实验案,例如具备传播性的新型病毒。这些设计旦外泄或流后续实验流程,将为系统性险打开。3.1.2 步骤:材料采购与准备 在材料采购与准备环节,亦存在不可忽视的事故险。先,试剂或物材料在采购、分装或运输过程中可能因标签错误、语误译或信息不全被误,进引发预期实验反应或病原体暴露。其次,储存运输不当可能导致材料泄漏、变质或污染,影响员安全与实验可靠性。此外,试剂污染或交叉污染亦是常隐患,尤其在缺乏严格管理的型实验室或业余环境中。低质量、过期或制材料亦可能在实验中引发异常反应,如爆炸或毒释放。另有情况则涉及误采购险材料,如因专业能不意获取受控病原体或有毒物质,造成违规与泄漏险。这些事故多因管理流程不完善、质量控制缺失或员培训不所致,虽恶意,但旦发,后果依然可能严重。52 同注51(Sakana AI,2024)51 Sakana AI,“The AI Scientist:Towards Fully Automated Open-Ended Scientific Discovery,”2024-08-13,https:/sakana.ai/ai-scientist/50 同注49(CSET,2024)16 3 险识别 尽管这些险源传统操作流程,但在部分实验场景中,AI系统正逐步介材料管理与险控制环节,如采购审核、标签识别与运输监控等。旦AI系统出现误判或设计不当,亦可能加剧上述事故险。3.1.3 步骤:实验操作与处理 在实验操作过程中,程序失误、溅洒或溢出、意外针刺、实验动物咬伤及设备程故障等意外时有发,均可能导致研究员暴露于病原体或毒素之下。53若未严格遵循相应物安全等级要求或操作员培训不,便易引发实验室获得性感染,甚触发病原体的预期泄漏。随着实验动化程度的提,新型险也不断浮现。在依赖AI系统的实验室中,研究员若对AI界信息理解偏差或误操作,可能导致实验参数配置错误、危险步骤未被屏蔽,进引发事故。若系统设计未充分考虑类操作员的为模型、注意限制与容错机制,事故的可预防性将打折扣。机器平台在湿实验环境中的泛应,也使事故险具备动放的可能性。AI若未经充分监控便直接控制液体处理、样本培养与分析环节,便可能在预下执超量反应、混淆样本甚成新型物材料。甚在封闭系统内意外合成出的危物材料,事故发后也难以及时检测与中。相关历史事件为上述险提供了现实警。2014年,美国疾病控制与预防中(CDC)在处理炭疽菌样本时未遵循标准操作程序,导致未灭活样本流低安全等级实验室,造成多接触病菌;54 2015年,北卡罗来纳学教堂分校实验室在处理基因程冠状病毒时发操作失误,致研究员暴露于MERS病毒,引发公众对实验室透明度与安全性的泛担忧。55 随着合成物学快速发展,越来越多关键实验环节被外包云实验室、合同研究组织或动化平台。这些系统极地提升了效率、降低了技术槛,却也带来了险隐患。前云实验室并强制性物安全要求56,若缺乏对实验案的审核、客份与资质的严格验证,以及完整的操作志和归因机制,就可能被恶意利来执敏感或险操作。57旦发事故且法溯源,将严重阻碍责任追查,并削弱应急响应的效率与可信度。57 Filippa Lentzos et al.,“Laboratories in the cloud,”2019-07-02,https:/thebulletin.org/2019/07/laboratories-in-the-cloud/56 EBRC,“Security Considerations at the Intersection of Engineering Biology and Artificial Intelligence,”2023-11,https:/ebrc.org/publications-security-engineering-biology-artificial-intelligence/55 ProPublic,“Here Are Six Accidents UNC Researchers Had With Lab-Created Coronaviruses,”2020-08-17,https:/www.propublica.org/article/here-are-six-accidents-unc-researchers-had-with-lab-created-coronaviruses 54 CDC,“CDC Lab Determines Possible Anthrax Exposures:Staff Provided Antibiotics/Monitoring,”2014-06-19,https:/archive.cdc.gov/www_cdc_gov/media/releases/2014/s0619-anthrax.html 53 Blacksell et al.,“Laboratory-acquired infections and pathogen escapes worldwide between 2000 and 2021:a scoping review,”2024-02,https:/ 17 智能 x 命科学的负责任创新 图5:卡内基梅隆学的云实验室允许研究员远程操作200余台科学设备58 动化系统的安全漏洞也使其成为潜在攻击标。2021年,津学结构物学实验室遭客侵,攻击者远程操控压泵并关闭警报系统,虽未造成物材料泄露,却暴露出动化系统在络安全的薄弱环节。59,60,61 2022年,BD公司的两套实验室设备也被曝存在严重漏洞:其Pyxis药物管理系统因默认凭证未更新,允许远程攻击者窃取医疗数据;Synapsys实验室管理软件则因会话超时机制缺陷,使访问者需验证也能篡改数据。62 3.1.4 结果:意外泄漏 意外释放是指病原体或毒素因程控制或制度防线失效从受控环境中逸出,进员或环境暴露环节,进可能引发更范围的传播事件。常触发情形包括物安全柜、负压系统、过滤或消毒设施运故障,实验动物逃逸,或样品清理与转运过程中的疏漏等。此类事故通常在早期不易察觉,极易错失预窗。旦遏制机制失效,即使仅有微量危物质泄漏,也可能迅速造成研究员感染、物品污染,甚进社区环境,触发区域性公共卫事件。尤其值得警惕的是逃逸的实验动物,可能成为病原体在不受控条件下传播的媒介,扩事故影响。在AI驱动的动化的实验系统中,这险尤为突出。若AI在监督下控制样本处理流程,系统异常可能导致险材料合成完毕后未能妥善封存或中,形成“系统未察觉、类未介”的隐性释放路径。62 Fiercebiotech,“BD to patch cybersecurity risks found in drug dispensing,lab management tech,”2022-06-01,https:/ 61 PMC,“Cyberbiosecurity in high-containment laboratories,”2023-07-25,https:/pmc.ncbi.nlm.nih.gov/articles/PMC10407794/60 Charlie Osborne,“Oxford university lab with COVID-19 research links targeted by hackers.”,2021-02-26,https:/ Thomas Brewster“Exclusive:Hackers Break into biochemical systems at Oxford university lab studying COVID-19,”2021-02-25,https:/ 58 同注25(CNAS,2024)18 3 险识别 3.1.5 结果:潜在传播 即使事故初发于个别感染者,也可能迅速演化为区域性疫情。若早期病例未能及时发现,接触者追踪机制不健全或应急资源准备不,传播链就可能失控,导致疫情爆发、流病甚流病。63这种险不仅对公共健康构成威胁,也可能激发社会恐慌、公众误解,甚对科研机构的信任与国际合作造成期冲击。3.2 滥险 滥险,是指智能和物具被恶意为者于达成有害物的的险。3.2.1 步骤:研究设计与信息收集 毒素与病原体的发现与设计 2022年3,瑞施茨实验室、美国合作制药公司和英国伦敦国王学院,在次国际安全会议上进了试验,将个名为MegaSyn的AI系统应于毒性分筛选,在6时内识别出了4万种假想的化合物,其中部分分的毒性甚超过强效神经毒剂VX。值得注意的是,MegaSyn本是AI药物发现平台,旨在寻找治疗类罕病的新型靶点和抑制剂。案例揭了AI在毒素设计中被滥的潜在险,其成和重构险物制剂的能显著提升。64随着技术扩散,险毒素的获取、识别与设计槛幅降低,不再局限于资源丰富的为体。65 危险信息与与实验路径规划 2023年6,MIT的物安全专家进了项测试,发现未经训练的学可借助ChatGPT在60分钟内完成:识别出四种潜在流病原体,理解反向遗传学技术以合成这些病原体,并找到绕过基因合成筛查流程的法,包括获取操作协议、故障排查册和实验外包建议。66 这表明,AI可以在DBTL循环的多个环节形成助,覆盖获取物学知识到组织实验流程。66 Emily Soice et al.,“Can large language models democratize access to dual-use biotechnology?,”2023-06-06,https:/arxiv.org/abs/2306.03809 65 FLI,“Chemical&Biological Weapons and Artificial Intelligence:Problem Analysis and US Policy Recommendations,”2024-02-27,https:/futureoflife.org/document/chemical-biological-weapons-and-artificial-intelligence-problem-analysis-and-us-policy-recommendations/64 张芮晴,“物技术与智能融合产新兴物安全险,”2024-01-26,https:/ 63 CSET,“Anticipating Biological Risk:A Toolkit for Strategic Biosecurity Policy,”2024-12,https:/cset.georgetown.edu/publication/anticipating-biological-risk-a-toolkit-for-strategic-biosecurity-policy/19 智能 x 命科学的负责任创新 尽管当前AI对恶意为者的辅助仍相对有限,但多研究预测基础模型的持续进步将加速恶意为者获取可武器化物制剂的能。67,68,69特别是在有效解决实验中的技术障碍、优化病原体关键功能,AI正展现出显著潜。不过也需指出,实际开发物武器过程仍将临其他经常被低估的重技术障碍。70 图6:典型的物和化学产品开发流程,与制造物和化学武器流程类似71 病原体功能增强与“超级病毒”设计 AI驱动的物设计具可能同时提升病原体的传播性、毒性和免疫逃逸能,这种多重优化在然进化中极为罕,因为天然病原体通常需要在三者之间进权衡,如毒性往往导致宿主快速死亡限制传播72。特别是免疫逃逸,新冠期间预测模型证实,当病原体演化到能逃避现有免疫识别时,即使毒性未增强,也会因群普遍易感染导致传播险指数级上升。73 未来专业化物AI可能实现标导向的设计。74以Evo 1和Evo 2为例,模型已展出预测致病突变的能,若被于病毒基因设计,可能被滥于筛选更效传播、更强免疫逃逸或更致病性的突变组合。尽管当前开发者已将可感染类的病毒排除在训练数据之外,但Evo的开源特性意味着他仍可通过微调模型,引相关病毒序列,从绕过限制。远来看,此类AI若催出具备疹级传播、天花级致死率和艾滋病毒级潜伏期的“超级病毒”,75将对传统防疫体系构成巨挑战。75 CAIS,“Biosecurity and AI:Risks and Opportunities,”2024-02-08,https:/safe.ai/blog/biosecurity-and-ai-risks-and-opportunities 74 虽然“蛋质设计软件”的可能性在年前还被视为遥不可及,但DeepMind于2018年推出的AlphaFold已成功实现仅凭基因序列预测蛋质结构的突破。随着物学数字化进程加速,海量蛋质互作数据的积累,正推动AI向更复杂的蛋质设计领域迈进,其发展轨迹或将重现AlphaFold在结构预测领域的命性突破。73 Nomie Lefrancq et al.,“Learning the fitness dynamics of pathogens from phylogenies,”2025-01-01,https:/ 72 同注64(张芮晴,2024)71 同注15(Bengio et al.,2025)70 同注25(CNAS,2024)69 同注66(Soice et al,2023)68 Rand,“The Operational Risks of AI in Large-Scale Biological Attacks Results of a Red-Team Study,”2024-01-25,https:/www.rand.org/pubs/research_reports/RRA2977-2.html 67 OpenAI,“Building an early warning system for LLM-aided biological threat creation,”2024-01-31,https:/ 20 3 险识别 新型物武器的从零成 前已有数万种类病毒基因序列被公开获取(例如NCBI病毒库76),其危险性各有不同。随着DNA/RNA合成技术的进步,理论上个可以重新制造病毒,最的障碍在于对实验室技术的掌握。然,对于病毒的合成来说,这个障碍出奇地低。例如现有商业服务可根据提供的序列合成DNA段,幅降低了技术槛和获取成本。若极端分成功获取并合成某种致病性病毒,其可能造成数万甚数万死亡,相当于岛、崎原弹爆炸的级别。77 基于AI的蛋质成模型(如ProtGPT2、ProGen)持从零设计然界不存在的蛋质序列,可在极短时间内成潜在的毒性分。这类“脱离然模板”的合成能尤其危险,因为类的免疫系统可能法识别或有效对抗这些分。技术若被滥,甚可能直接产出未知物战剂的“设计蓝图”,跳过对现有毒素的依赖78。近年来,基于规模物序列数据训练的蛋质语模型(如ESM等)也被泛应于预测病毒突变的免疫逃逸能。虽然这些模型显著加快了物医药研发,但也引发了对其被于识别和设计逃逸性病毒变异的担忧。3.2.2 步骤:材料采购与准备 在物理执初期,研究员通常通过正规供应商、实验室间共享或机构核设施获取试剂、设备和物材料。但实际操作中,绕过正规渠道采购的情形亦屡不鲜。研究表明,即使不依赖正规来源,也可建功能全的实验室,79 DIYbio社群推低成本家替代品,80 eBay等络平台亦出售量学术实验室的设备,包括DNA合成仪和等级物安全设备。旦险材料缺乏来源记录与途审查,便可能进敏感实验流程不受监管,导致材料流向不明、追责困难,甚为恶意为者提供便利,绕过制度复现危险病原体或毒素。语模型等通型智能系统的进展,可能使恶意为者在不具备相关背景知识的前提下,也能完成系列敏感物料的采购与操作准备。例如,语模型可能被于撰写欺骗性邮件,伪造研究途与份信息,以绕过供应商的审核机制;也可协助识别未严格执筛查程序的DNA合成公司、分析合成商的作流程并提出规避建议;在更复杂场景中,AI还能帮助组织跨国分协作,如远程雇佣员进样品接收与再处理,从规避集中化险。这种能组合,显著降低了构建和部署物武器的操作槛。81 81 同注65(FLI,2024)80 Roth,“A Guide to DIYbio(updated 2021),”2019-02-17,https:/ 79 同注49(CSET,2024)78 同注64(张芮晴,2024)77 同注75(CAIS,2024)76 NCBI,“NCBI Virus,”2004,https:/www.ncbi.nlm.nih.gov/labs/virus/vssi/#/21 智能 x 命科学的负责任创新 3.2.3 步骤:实验操作与处理 动化实验平台降低合成物操作障碍 动化实验平台通过机械臂和液体处理器,根据预设编程指令在各类实验室设备间移动样本。这类系统有助于研究员提实验效率,如并处理多个样本、标准化测量流程、动采集数据,并释放从事其他任务。已有研究显,语模型驱动的主智能体已能够控制化学合成的动化实验平台,激发了们对其可能被滥于降低恶意为者能槛的担忧。82前,这类险在化学合成任务中更为现实,在涉及活细胞维护等更复杂步骤的物程任务中则尚待进步观察。83,84 多模态模型辅助实验纠错与隐性知识获取 以GPT-4V为代表的多模态模型已具备图像理解能,能够结合设备照、实验视频等视觉信息与语成能,为实验操作提供及时的反馈。随着训练数据不断扩展学课程与实验演等内容,这使其在湿实验室环境中辅助成操作建议,观察实验步骤、识别实验中的隐性要素与关键误差展现出潜,例如在未察觉的情况下指出污染险,从提升成功率。相传统搜索引擎列出碎化内容,多模态模型具备整合信息、直接成针对性建议的能。但这也意味着其可能降低如病毒合成等复杂实验的专业槛,若被滥可能构成物安全威胁。85 云实验室的远程控制与监管盲区 动化实验系统依赖络连接和软件指令进样本处理和设备控制,若存在漏洞,可能被客侵并远程操控于执恶意实验。尽管这些系统的设计初衷并于危害公共安全,但在缺乏够防护的情况下,其被滥的后果仍属于典型的物险情形。当前多数云实验平台尚未纳强制性物安全治理体系,缺乏对客份、实验内容和交付标的实质性审查。这使其可能在意中成为病原体合成、毒素优化乃武器化过程的“外包节点”。特别是当平台集成平动化设备与AI辅助系统时,操作员对实验内容的直接感知被进步削弱,滥险往往隐藏于看似常规的服务请求之中。旦恶意为者借助这些平台规避监管并完成关键实验环节,将极提升其实施复杂物攻击的可性,同时也使后续的责任追踪与险追责临极挑战。85 同注75(CAIS,2024)84 同注49(CSET,2024)83 Matin et al.,“Perspectives for self-driving labs in synthetic biology,”2023-03,https:/ 82 CMU,“Emergent autonomous scientific research capabilities of large language models,”2023-04-11,https:/arxiv.org/abs/2304.05332 22 3 险识别 3.2.4 结果:故意部署 作为物武器开发的延伸应,未来的模型若缺乏适当限制,可能在攻击案的制定上发挥重要作。86通型智能可整合开源信息与历史数据,协助策划最具破坏的释放案包括选择适宜的标群、释放时间、地理位置、物流路径,以及绕过监测与应急响应机制的策略,87并可能分析既有安全漏洞或成功的散播路径,为为者提供效部署案。88 此外,AI可协助撰写误导性宣传材料或社交媒体内容,以扰公共舆论或延误响应窗,从增加病原体传播范围与攻击影响。未来,若有效防范措施,这类能可能催类新型的“智能策划型物攻击”。3.2.5 结果:潜在传播 由AI助设计的病原体,在传播阶段可能具备更强的隐蔽性和扩散能。,由于AI能够同时优化传播性、免疫逃逸性与潜伏期,这类“超级病原体”在感染个体后,可能在明显症状的情况下迅速在群中蔓延,幅提升基础传播数(R)并缩短爆发临界点。另,AI从零成的新型病毒或蛋质毒素往往不包含在现有数据库与监测系统中,使其难以被及时识别。现有基于序列匹配或既定列表的筛查机制难以及时响应,从延误疫情预与控制。即便只发次感染或局部暴发,也可能因传播效率、公众认知滞后、医疗准备不等因素,迅速升级为区域性乃全球性流。AI增强的病原体传播能,加之其对既有物监测系统的“规避性”,意味着未来的物险将更难预测、更难遏制,对公共卫系统构成严峻挑战。3.3 结构性险 结构性险,是指技术在明确恶意或意图的情况下,通过改变社会环境、制度安排或激励机制,系统性地增加物险的可能性。89 3.3.1 智能削弱物安全防护体系 通过简单“伪装”在线订购危险毒素 MIT的项实验中,研究员向基因合成供应商下了25个订单,成功收到24个回复。同时他们也向国际基因合成联盟(IGSC)的13个成员下了订单,得到了11.5个回复。总体表明,2023年10采的DNA合成筛选实践乎未能识别出流病毒等轻度伪装的危险序列。研89 R.Zwetsloot and A.Dafoe.“Thinking about risks from AI:Accidents,misuse and structure,”2019-02-11,https:/www.lawfaremedia.org/article/thinking-about-risks-ai-accidents-misuse-and-structure 88 OpenAI,“GPT-4 System Card,”2023,https:/ 87 同注75(CAIS,2024)86 其他领域的攻击规划案例:特斯拉Cybertruck拉斯维加斯爆炸案细节曝光:嫌犯曾向ChatGPT询问如何制造爆炸物、爆炸物需要多快的速度才能引发爆炸不仅仅是着,并探讨如何规避法律获得相关材料。23 智能 x 命科学的负责任创新 究员采了不同技术伪装这些危险序列。最简单的法是将害序列附加到危险基因上,例如将编码蓖毒素的基因分割成500个碱基对并附加免疫球蛋基因段,造成局部匹配。此外,研究还分割了1918年流感流病毒、其他毒剂和潜在流病原体的基因组并加伪装序列。这些技术能够成样本并在实验室中重新组装,从创造出可的危险病毒。智能在成新的物武器有可能使筛选机制变得更加困难,同时也可能为建更有效的筛查系统提供机会。研究员建议,需要定期进第三审计,类似于络安全中的红队做法,以增强核酸合成供应商的险防控。90 物设计具可能绕开现有危险病原体管制措施 当前对毒素和病原体的防控体系,主要依赖“已知危险因的清单制度”,即通过对合成订单中的DNA/RNA序列与官危险病原体数据库中的已知基因段,识别和阻断潜在的物安全险。这种法在应对炭疽、埃博拉病毒等传统威胁时曾发挥关键作。但随着物设计具的迅猛发展,尤其是在AI驱动下的物设计兴起,这防控体系正临前所未有的挑战。新代的蛋质/分设计模型(如AlphaFold、ProGen等)具备强的结构预测与功能优化能,可直接基于标功能成序列全新但功能等效甚增强的蛋质或核酸段。这意味着,AI可以成功能等效但序列全新的毒素段,避开现有以“已知危险因”为基础的筛查系统。这从根本上动摇了现有“清单 筛查”的管控逻辑,带来针对未知险的监管盲区。这种情形并远景设想,是当前最有可能实现并率先带来现实物险的技术路径之。如果缺乏前瞻性机制建设和国际协调,现有制度可能在关键时刻失效。91 AI对物安全攻防平衡(offense-defense balance)的影响 期韧性中(Centre for Long-Term Resilience,CLTR)指出,LLM和BDT能在物威胁制造的不同阶段起到辅助作92,但不同类型的AI具对攻防平衡的影响存在显著差异。例如,疫苗设计具更易于增强防御能,推动更快速、精准的疫苗开发;基因设计、毒性预测等具则更可能被于进攻性的。兰德公司研究认为,现阶段LLM对物攻击计划的实际持能有限,主要瓶颈仍在于缺乏专业知识与执段,信息本的获取难度。尽管如此,兰德研究也提醒,随着AI能不断提升,尤其是在系统整合、上下理解和任务分解等的进步,未来LLM可能会更有效地弥合知识鸿沟,辅助完成更复杂的物武器设计任务。攻防平衡可能逐步向进攻倾斜,特别是在社会整体防御能未能同步增强的情况下。93 93 同注68(Rand,2024)92 CLTR,“Understanding AI-Facilitated Biological Weapon Development,”2023-10-18,https:/www.longtermresilience.org/reports/understanding-risks-at-the-intersection-of-ai-and-bio/91 同注64(张芮晴,2024)90 Import AI,“Voice cloning is here;MIRIs policy objective;and a new hard AGI benchmark,”2024-06-17,https:/ 24 3 险识别 3.3.2 智能放物技术的两险 智能与物技术均具有显著的两(dual-use)特性。在有助于疾病防控和公共健康的同时,也可能放物威胁。,AI可以于早期检测基因程迹象。通过分析量的物数据,AI可以识别出些可能表明存在基因程操作的模式。例如,通过对基因序列的分析,AI可以判断是否存在修改的痕迹。然,这种检测系统的准确性和可靠性关重要,如果出现错误的判断,可能会导致严重的后果。另,AI也可以于放物威胁的险。例如,通过先进的遗传研究,AI可以帮助增强病原体的致病性。它可以通过对病原体的基因进改造,使其更致命、更抗药或者更能适应不同的环境,从增加了控制和治疗这些病原体的难度。94 值得注意的是,AI放物险不仅体现在提升技术能,还在于改变了知识扩散和险防控的基础条件。具体,AI降低了挖掘隐性知识的难度,使原本依赖经验积累和专业壁垒的信息显性化、系统化,弥合了技术鸿沟,极提了潜在物武器研发的可性。同时,当前国际和国内关于两研究的法规体系仍需进步完善。与核材料和放射性物质不同,许多于物攻击的材料或制剂在与军之间难以明确区分,因更容易获取。95需指出的是,“更容易”并不意味着“容易”,从物理层实现仍需特定的实验条件与资源。因此,物安全险已成为全球智能安全峰会以及关于先进智能潜在灾难性影响的更泛讨论的焦点。图灵奖得主Yoshua Bengio牵头的国际智能安全报告96指出,物领域的两能随时间持续增强,需度警惕AI在物领域助推险加剧的潜在可能。96 同注15(Bengio et al.,2025)95 同注64(张芮晴,2024)94 Pauwels,“How to Protect Biotechnology and Biosecurity from Adversarial AI Attacks?A Global Governance Perspective,”2023-05-10,https:/ 25 智能 x 命科学的负责任创新 图7 语模型、通物AI和病原体相关专模型的两能随时间持续增强97 值得关注的进展包括:语模型(LLM)回答有关物武器释放问题的准确率从15%提升80%;2024年间,物AI预测蛋质与分(包括药物和化学武器)相互作的能也从42%提到了90%。由于缺乏标准化基准测试,且准确率计算法存在不致性,相关较仅限于少数任务,且未能随时间推移进持续跟踪验证。3.3.3 智能引发新兴物安全挑战 除了直接的物制剂威胁外,AI还可通过促进物信息数字化和络攻击,带来新兴物安全挑战。物信息数字化带来络攻击险 络化物信息的新型威胁。智能、深度学习等技术在基因组研究中的应不断深化。伴随数字互联技术在命科学领域的泛渗透,以及联设备的普及,关键物信息、数据资产与算法模型正成为络攻击的新兴标。恶意为者可能通过操纵或破坏这些资源,扰乱公共卫与物安全系统,扩社会恐慌,带来系统性安全险。97 同注15(Bengio et al.,2025)26 3 险识别 开放数据与物险并存。脊髓灰质炎病毒、天花病毒、痘病毒等危险病原体的基因组信息,以及新冠病毒变异株等新兴病原体的数据,已被泛发布以持全球监测、早期预警和疫苗开发。尽管开放数据促进了科学合作与防控能提升,但同时也增加了敏感物信息被滥的险。通过智能技术优化病原体特性,如提升存性、致病性、耐药性与免疫逃逸能,可能进步加剧物威胁,对全球物安全构成挑战。98 AI驱动的络攻击威胁物安全 智能驱动的络攻击正成为物安全的新型威胁因素,其对险物基础设施的影响逐步显现。例如,智能技术的进步降低了构建络漏洞的槛,使更泛的为体能够针对处理设施、研究实验室和收容设施实施攻击,进可能引发规模有害物制剂的泄漏与暴露。99 防护实验室是于研究后果病原体并提供诊断与疫苗产的重要设施,正在带来度络化的实验环境。这种络-物理融合架构虽提升了运效率与数据集成能,但也形成了特殊的络安全险。近年来兴起的“络-物安保”(cyberbiosecurity)领域,即致于识别、评估并缓解此类复合险,强调应将络险治理整合现有的物险管理体系中。100 同时,智能还在提升络操纵为的效能。包括叉式钓、络钓、短信钓与语钓等技术,借助语模型能得到显著增强,增加了恶意为者诱导关键领域从业员泄露敏感物信息或访问险基础设施的可能性。尽管现有语模型普遍设置了初步的安全防护,但实验研究表明这些防护易被绕过。101通过重新标记有害数据绕过防护措施,或将危险过程细分为害步骤、伪造权威机构份等提程法,攻击者能够规避模型限制,获取原本受控的敏感信息。102 信息病毒(inforus)带来物安全的新兴挑战 随着成式智能技术的快速演进,信息操纵段呈现出更的隐蔽性与动化特征,催了“信息病毒”103这新型威胁。信息病毒指以虚假或误导性内容为核,可能掺杂部分真实信息。其传播模式与物病毒相似,可通过社交媒体、成式AI等渠道引发“信息流病”(infodemic),从认知层削弱物安全体系的韧性。103 福院将信息流病的病原体称为信息病毒(inforus),即信息(info)和病毒(virus)的合成词。102 Liu et al.,“Jailbreaking ChatGPT via Prompt Engineering:An Empirical Study”,2023-05-23,https:/arxiv.org/abs/2305.13860 101 NIST,“NIST Identifies Types of Cyberattacks That Manipulate Behavior of AI Systems”,2024-01-04,https:/www.nist.gov/news-events/news/2024/01/nist-identifies-types-cyberattacks-manipulate-behavior-ai-systems 100 Crawford et al.,“Cyberbiosecurity in high-containment laboratories,”2023-06-25,https:/ 99 同注65(FLI,2024)98 同注64(张芮晴,2024)27 智能 x 命科学的负责任创新 信息病毒对物安全领域造成了以下两尤为突出的挑战:先,信息病毒通过伪造物医学研究数据、曲解实验结论、夸或掩盖物威胁,系统性地扰科学共识的形成与政策制定。例如,福院团队研究发现,数据库中AI成的虚假医学论例已达80%,对早期险感知与公共卫响应的准确性构成了实质性威胁。其次,在重公共卫事件中,掺杂真实与虚假内容的信息病毒能够削弱公众对防疫措施(如疫苗接种、隔离政策等)的信任,降低群体配合度,进加剧物事件扩散与失控的系统性险。新冠疫情期间的经验表明,旦社会信任体系被削弱,治理预的有效性将遭受显著削弱。由于当前物安全治理框架主要针对物理材料与实验活动,尚未系统涵盖针对数字化认知威胁的应对机制。成式AI加速了隐性知识的显性化传播,传统内容审核与伦理规制段难以跟上其演变速度。福院提出的“社会疫苗”理念提了未来向,即通过科普教育、伦理规范和公众认知韧性的系统性建设,提升整体社会对信息病毒的识别与免疫能。然,针对AI驱动的信息病毒威胁,全球物安全治理体系仍存在显著滞后,亟需前瞻性补强。3.3.4 智能和物竞赛引发制度性险 当前,全球范围内AI与物技术的深度融合正催场创新竞赛,但这场竞赛的背后也隐藏着益严峻的制度性险。在追求技术突破的过程中,参与者往往更关注研发速度与竞争优势,将必要的伦理和安全保障置于次要地位。这种局带来了技术故障、实验室动化漏洞以及专业更容易制造物制剂等系列险。104 尽管国际社会已经开始关注此类险,并尝试建相应的政策框架与技术防线,如合成核酸筛查规定等,但全球治理体系在应对这些交叉前沿技术时仍显得捉襟肘。,AI和物技术的融合发展速度极快,远超监管机制的更新节奏;另,物安全领域的国际制度基础本就薄弱,尚未形成统的国际规范体系。例如禁物武器公约今未建有效的核查机制,这使得技术滥的威胁难以被及时发现和遏制。随着物科学持续在前沿领域取得突破,这制度缺将可能引发伦理、治理等多个维度的深层次挑战。在AI治理,虽然全球AI安全峰会等多边倡议试图推动创新与安全的协调发展,但这些倡议多数缺乏实质性约束,落实效果有限。105,106更令警惕的是,在国竞争背景下,物与AI领域的战略部署益优先于全球合作与共同安全,安全与伦理反可能被有意边缘化。此外,当前AI领域的投资重普遍偏向能开发,安全研究和制度建设投明显不,更注重速度与商业化,够的安全防范措施。107 107 Finn Metz,“Where we are on for-profit AI safety,”2024,https:/ 106 Nicole Wheeler,“Responsible AI in biotechnology:balancing discovery,innovation and biosecurity risks,”2025-02-05,https:/pubmed.ncbi.nlm.nih.gov/39974189/105 Nicolas Cropper et al.,“A modular-incremental approach to improving compliance verification with the biological weapons convention,”2023-09-25,https:/ 104 同注25(CNAS,2024)28 3 险识别 此外,AI驱动病毒效果优化可能重塑国家的战略考量。理论上,AI可被于提升病毒的精确性与战略性,例如定向攻击特定基因群体或地理区域。尽管相关能仍处于推测阶段,旦实现或将改变各国使物武器的动机。更有研究警告,物信息学、基因组学和合成物学等技术在理论上可能被于针对特定群的定向攻击,甚引发种族灭绝等极端险。108尽管这类能的实现尚临多个关键技术障碍,其未来可性尚难判断,但其伦理与安全挑战已不容忽视。这种由竞赛所驱动的扭曲,正在侵蚀现有的制度性安全防线,诱导研发活动向更险区域外溢,显著增加了系统性险的概率。3.4 险判断的争议与局限 在智能与物安全交叉险的讨论中,已有研究与政策件普遍强调其潜在的多种危害。然,部分学者、业专家与政策制定者也提出了不同观点,认为当前的某些险判断可能过于依赖技术前景推演,未能充分考虑现实执条件、技术槛与为动机等因素。这些观点并全盘否定险本,是强调应对主流险框架的适性进更精细的讨论。此类观点在未来险治理和政策制定中值得重视。3.4.1“现实部署执难”类观点强调,尽管基础模型可能被于成物相关信息,但现实中从获取信息到成功部署具破坏性的物威胁,仍需跨越众多技术、物理和组织槛。相聚焦早期成阶段,治理重点或许更应放在下游的关键环节与已有制度能的强化上。例如,有观点指出,即使基础模型能够提供某些敏感信息,病原体仍需在实验室中进设计、开发与测试109,最终还需完成部署与扩散。上述过程涉及度专业化的知识110、设备与操作经验,与许多其他威胁载体样,最佳政策可能在下游。例如美国拜登政府关于智能安全、可靠和可信的政令旨在加强对物序列购买者的客筛查。111 此外,批评者还强调即便确实存在制造物武器的技术路径,其现实可性远公众所想象的复杂,其中包含众多可能失败的环节。因此,他们主张对AI在整个链条中所发挥的作作更审慎的评估。并指出,尽管相关警告不断,但近年来并未发过重物攻击事件。112 112 同注25(CNAS,2024)111 Stanford,“Considerations for Governing Open Foundation Models,”2023-12-13,https:/hai.stanford.edu/policy/issue-brief-considerations-governing-open-foundation-models 110 Louise Matsakis,“Why AI-assisted bioterrorism became a top concern for OpenAI and Anthropic,”2023-11-16,https:/ 109 Terwilliger,T.C.et al.,“AlphaFold predictions are valuable hypotheses and accelerate but do not replace experimental structure determination,”2023-01-30,https:/ 108 同注65(FLI,2024)29 智能 x 命科学的负责任创新 3.4.2“边际险证据弱”另有观点聚焦于基础模型是否真正显著提升物险的信息获取能,其认为前不少研究夸了基础模型的危险信息成能,忽略了这类信息本就泛存在于开放献与络资源之中。相应地,评估语模型所引的“边际险”应以对照现实可获取信息为基础。些研究声称开放基础模型可引导获取制造物武器的关键步骤。113但批评者指出,这些研究的证据基础仍显薄弱。例如,声称当前语模型提供与物武器相关的“危险”信息的研究,并未承认114同样的信息也可通过维基百科115和专业数据库116获得。已有研究开始尝试衡量基础模型相对互联信息的边际险,这类作将为未来政策提供实证性的持。117 例如,美国兰德公司的研究员也在测试中发现,语模型已能够量化评估天花、炭疽和疫等传统物战剂的致死概率;提供获取带疫啮动物或跳蚤活体的可性案;设计规避物安全监管的运输法。但研究也强调,这些建议中超过95%以上内容可通过歌搜索获得,模型在此领域并未表现出明显超越公开信息的“知识增益”能。118 3.4.3“致命物质已够多”更为实主义的场主张,与其担忧AI成前所未有的新型威胁,不如正视现实中已存在的量险病原体及其传播机制。些从业者指出,恶意为者未必倾向于选择路径复杂、技术槛且实施险的AI案,更可能使已有物质与段,操作简便且更难被追踪。这观点提,险治理的优先级应聚焦于对现有威胁载体和物质的有效监管。例如,知名创投公司a16z的物与医疗健康团队合伙Vijay Pande曾批评过度渲染AI成物武器的观点,认为现实中“我们已经拥有够多的致命物质,配从来不是问题”。119 当然,也有观点更为谨慎,他们指出,实验表明,即便仅使市售原材料,也可能制造出强效病毒,并认为制造物武器所需的知识与技术槛似乎正在逐步降低。120这提我们,尽管当前路径复杂,随着技术演进,险平仍可能发变化,治理亦应动态适应。120 同注25(CNAS,2024)119 Vijay Pande,“AI Is a Healer,Not a Killer,”2023-12-27,https:/ 118 同注68(Rand,2024)117 AI Snake Oil.,“What the executive order means for openness in AI,”2023-11-01,https:/ 116 THE NATIONAL ACADEMIES PRESS,“Biodefense in the Age of Synthetic Biology,”2018,https:/nap.nationalacademies.org/catalog/24890/biodefense-in-the-age-of-synthetic-biology 115 WIKIPEDIA,https:/en.wikipedia.org/wiki/Influenza_pandemic 114 Neel Guha et al.,“AI Regulation Has Its Own Alignment Problem:The Technical and Institutional Feasibility of Disclosure,Registration,Licensing,and Auditing”,2024-12,https:/dho.stanford.edu/wp-content/uploads/AI_Regulation.pdf 113 同注66(Soice et al,2023)30 4 险分析 4 险分析 论好坏,基准测试都会塑造个领域。图灵奖得主 卫帕特森(David Patterson)121 要科学理解智能是否加剧物险,光靠推测或个案分析远远不够。准确、系统的评估是验证险模型、制定有效政策的关键。更好的评估有助于识别险路径、模型能边界与潜在滥点,为技术研发、模型开源和治理决策提供实证基础,也能推动智能x物安全的险管理从基于推测的险模型向基于实证的险治理。截前,关于智能是否显著提升物险的研究主要聚焦于两类险模型:1)获取物信息并进策划:险提升的假设是通型基础模型可能增强获取、规划和实施物攻击所需信息的能;122,123,124,125 2)合成有害物制品。险提升的假设是专型AI赋能的物具可能协助恶意为者识别新型毒素、设计更效的病原体,或优化现有物制剂以增强其毒性。126,127,128 围绕智能相关物险的研究尚处于萌芽阶段,且通常具有推测性,些研究法的成熟度和透明度也有限。这导致学界对智能是否显著提升物险的理论模型及其实证评估存在较不确定性,进难以确科学严谨的物险评估与应对框架。基于现有研究和智能模型的当前能,围绕智能和物险的常担忧尚缺乏科学证据持。129 129 Aidan Peppin et al.,“The Reality of AI and Biorisk,”2025-01-02,https:/arxiv.org/abs/2412.01946 128 GovAI,“Managing Risks from AI-Enabled Biological Tools,”2024-08-05,https:/www.governance.ai/analysis/managing-risks-from-ai-enabled-biological-tools 127 Rand,“Preparing the Federal Response to Advanced Technologies,”2023-09-19,https:/www.hsgac.senate.gov/wp-content/uploads/Alstott-Testimony.pdf 126 FAS,“Bio x AI:Policy Recommendations for a New Frontier,”2023-12-12,https:/fas.org/publication/bio-x-ai-policy-recommendations/125 Gryphon,“Written Statement by Rocco Casagrande,PhD,Executive Chair of Gryphon Scientific,”2023-12-06,https:/www.schumer.senate.gov/imo/media/doc/Rocco Casagrande - Statement.pdf 124 CSIS,“Advanced Technology:Examining Threats to National Security.A Testimony by:Gregory C.Allen,”2023-09-19,https:/www.hsgac.senate.gov/wp-content/uploads/Allen-Testimony.pdf 123 CLTR,“The near-term impact of AI on biological misuse,”2024-07,https:/www.longtermresilience.org/wp-content/uploads/2024/07/CLTR-Report-The-near-term-impact-of-AI-on-biological-misuse-July-2024-1.pdf 122 CSET,“AI and Biorisk:An Explainer,”2023-12,https:/cset.georgetown.edu/publication/ai-and-biorisk-an-explainer/121 David Patterson,“For Better or Worse,Benchmarks Shape a Field,”201207-01,https:/dl.acm.org/doi/pdf/10.1145/2209249.2209271 31 智能 x 命科学的负责任创新 4.1 获取物信息并进策划(针对通型基础模型)4.1.1 分析法 对通型基础模型的物能和险分析,可采从基础到复杂递进的多元评估体系:1.基于问答数据集的动化基准测试:这基础性法通过构建质量、挑战性的问答数据集,严格评估模型在复杂场景中的表现。2.领域专家红队测试:由领域专家通过模拟攻击或关键性挑战对AI模型进对抗测试,主动识别潜在漏洞、新兴险及安全改进空间。3.开放性红队测试:组织多样化测试者(包括LLM红队专家)通过探索性对抗测试,发现不可预的漏洞、新兴险和新型失效模式,作为领域专家测试的补充。4.代理评估与具使测试:测试模型在代理环境中的为或与外部具交互的表现,评估其协作能、主动能及通过外部接引新险的可能性。5.能提升实验与类在环评估:前评估体系中最具开放性与现实性的环节,通过类与模型的交互实验,评估模型对类的辅助效果及其潜在负影响。4.1.2 评估基准 根据先前研究和当前实践,物威胁创造过程可分为个操作步骤:130 1.构思:评估模型是否提供知识,帮助为者成或评估物武器的开发思路。这包括历史物武器和物恐怖主义使领域、增强潜在流病病原体研究等知识。2.设计:评估模型或系统是否能提供敏感知识,协助设计新型或增强型物威胁因,例如通过帮助使物设计具或解决体外实验中的问题。3.获取:评估模型或系统是否能提供知识,帮助为者获取制造物威胁或武器所需的材料和设备。这包括与云实验室签约、隐藏DNA合成订单、规避出管制、检索和分析危险DNA序列等相关知识。4.构建:评估模型或系统是否能提供帮助为体构建或研发物武器的知识。可能包括与以下的知识:协助或解决病原体培养问题以产武器级数量(即扩增)、配制和稳定化病原体以实现预期释放(即制剂化),或产和合成新型病原体。5.释放:评估模型或系统是否能提供知识,帮助为者计划针对标群释放病原体。这包括例如病毒溶化的相关知识,或针对其他传播机制的知识。6.放:评估特定攻击的有害结果如何通过使模型或系统得以放。例如,利模型促进互补的社会程活动,以在不改变物理影响的情况下,增加物攻击的社会或社交影响。130 FMF,“Issue Brief:Preliminary Taxonomy of AI-Bio Safety Evaluations,”2024-12-20,https:/www.frontiermodelforum.org/updates/issue-brief-preliminary-taxonomy-of-ai-bio-safety-evaluations/32 4 险分析 评估领域 具体基准测试 1.物知识的理解、整合与推理能评估:评估AI系统是否具备般物学学知识,以及运物学知识进相关的复杂、多步骤推理任务的能。-GPQA是个具有挑战性的科学知识与推理数据集,包含448道由物学、物理学和化学领域的专家编写的多项选择题。在相应领域拥有或正在攻读博学位的专家的准确率达到65%,尽管能不受限制地访问络且平均花费30多分钟,技能超的专家验证者的准确率仅为34%。-SciKnowEval基准测试旨在评估LLM的科学知识与推理能,其灵感源中国古代哲学中庸所阐述的深刻原则。该基准测试包括物理、化学、物、材料四领域,系统地从记忆(博学)、理解(审问)、推理(慎思)、辨别(明辨)和应(笃)这五个科学知识的递进层次对型语模型进评估。该数据集涵盖了物学、化学、物理学和材料科学领域内 7 万道多层次的科学问题及答案。-MMLU-Pro(Massive Multitask Language Understanding-Professional)来改进和扩充MMLU的12032多项选择题,每题有10个选项,经过专家审核以确保答案正确,并进了其他质量提升。其Biology集有717道题。与MMLU类似,该基准测试并侧重于武器研发,是对可能具有双重途的基础知识进测试。2.物实验室实操任务的问题诊断与排查能评估:评估AI模型或系统是否能够指导实验室操作、诊断实验问题、修复实验案。-LAB-Bench(Language Agent Biology Benchmark)是个多选题数据集,于评估语模型在实物学研究任务中的能。它包括 ProtocolQA 集,这些问题通过修改已发布的实验操作案并询问如何修复操作案以实现预期结果成。-BioLP-bench 是项评估型语模型在理解物实验操作案(biological laboratory protocols)熟练程度的基准。包含修改后的物实验案,语模型必须识别操作步骤中的错误。回答是开放式的,使LLM对回答进打分。3.危险物知识评估:评估AI模型/系统是否拥有物威胁创造端到端过程中特定步骤所需的详细、特定领域知识。这些评估可能会测试执特定步骤所需的直接知识,以及解决该步骤问题所需的隐性知识。-WMDP(Weapons of Mass Destruction Proxy)是组多选题,于代理测量物安全、络安全和化学安全领域的危险知识。WMDP-Bio 包括物武器、反向遗传学、增强型潜在病原体、病毒载体研究和两病毒学等主题的问题。-VCT(Virology Capabilities Test)是个关于实病毒学湿实验室技能的两多模态问题基准,由数位病毒学专家提供问题。4.物领域的模型安全护栏评估:评估AI模型/系统能否拒绝物相关的有害指令-SOSBench是个以法规为依据、以险为导向的基准,涵盖了六个险的科学领域:化学、物学、医学、药理学、物理学和理学。其Biology集是个由600个基于法规的提组成的集,这些提以ICD等权威机构的分类标准为依据,模拟了复杂物危害,特别是传染性和寄病。模型将根据其拒绝或安全应对这些微妙物危害的能进评估。-SciKnowEval的部分评测强调模型对科学安全的认知能,期望型语模型拒绝回答有害科学问题。Biology Harmful QA(L4)集包括系列出于伦理和安全原因禁回答的物问题。表1:物威胁相关的能和险领域的基准测试 33 智能 x 命科学的负责任创新 4.1.3 研究综述 以下这份不完全的资源清单,涵盖了当前已知的智能 x 物安全相关评测。年份 作者 名称 分析法 链接 2025 SecureBio,CAIS etc.Virology Capabilities Test 基准测试 论 2025 Anthropic Claude 4 System Card 基准测试 类能提升测试 系统卡 2025 OpenAI o3 and o4-mini System Card 基准测试 类能提升测试 系统卡 2025 GDM Gemini 2.5 Pro Preview Model Card 基准测试 模型卡 2025 Anthropic Claude 3.7 Sonnet System Card 基准测试 类能提升测试 系统卡 2024 Anthropic Claude 3.5 Model Card 基准测试 类能提升测试 模型卡 2024 GDM Gemini 1.5 Pro Model Card 基准测试 模型卡 2024 GDM Evaluating Frontier Models for Dangerous Capabilities 基准测试 红队测试 论 2024 Ivanov BioLP-bench:Measuring understanding of biological lab protocols by large language models 基准测试 论 2024 Li et al.The WMDP Benchmark 基准测试 论 2024 Meta Llama 3.1 Model Card 类能提升测试 论 2024 Meta Llama 3 Model Card 类能提升测试 模型卡 2024 OpenAI Building an early warning system for LLM-aided biological threat creation 类能提升测试 2024 OpenAI o1 System Card 基准测试 红队测试 系统卡 2024 OpenAI GPT-4o System Card 基准测试 类能提升测试 系统卡 2024 RAND The Operational Risks of AI in Large-Scale Biological Attacks:Results of a Red-Team Study 红队测试 类能提升测试 论 34 4 险分析 年份 作者 名称 分析法 链接 2024 SecureBio Lab Assistance Benchmark Multimodal 基准测试 2024 UK AISI Advanced AI evaluations at AISI 基准测试 2024 US AISI&UK AISI US AISI and UK AISI Joint Pre-Deployment Test Anthropics Claude 3.5 Sonnet 基准测试 红队测试 报告 2024 US AISI&UK AISI US AISI and UK AISI Joint Pre-Deployment Test OpenAI o1 基准测试 红队测试 报告 2023 Gopal et al.Will releasing the weights of future large language models grant widespread access to pandemic agents?红队测试 论 2023 OpenAI GPT-4 System Card 红队测试 系统卡 2023 Sarwal et al.BioLLMBench:A Comprehensive Benchmarking of Large Language Models in Bioinformatics 基准测试 论 表2:公开披露的智能 x 物安全相关评测,在前沿模型论坛(Frontier Model Forum)整理131基础上做了补充 MIT等机构的研究者就此主题开展了早期学术研究132,评估了LLM如何帮助收集有关如何开发病原体或物武器的信息,并计划在现实世界中部署。通过红队测试法,三组3-4名未接受过科学训练的学使LLM来了解它们如何协助策划和实施物攻击,例如,利LLM收集有关有害物制品的信息,或获取如何获取这些制品并部署它们以造成最伤害的指导。作者表,他们的研究结果“表明LLM将使流级病原体更容易获得即使是那些乎没有或根本没有接受过实验室培训的”。然,这项研究并未包含个关键的基准边际险,即通过LLM获取信息与通过互联等来源获取信息相有何差别。133 在后续研究中,研究员增加了边际险,较了LLM和基于互联的信息。兰德公司的研究员采了类似的红队测试法,涉及45名参与者,他们在LLM技术和物学拥有不同程度的专业知识。与之前的研究不同,这些组被随机分配到可以访问互联和LLM的组或只能访问互联的组。研究员对团队开展物攻击的计划进了评分,结果发现,可同时访问LLM和互联的组得分并未显著于没有LLM访问的组。没有个组只拥有LLM没有互联访问权限。因此,仅拥有LLM的组会表现如何仍未知。134 134 同注68(Rand,2024)133 Sayash Kapoor et al.,“On the Societal Impact of Open Foundation Models,”2024-02-27,https:/crfm.stanford.edu/open-fms/paper.pdf 132 同注66(Soice et al,2023)131 同注130(FMF,2024)35 智能 x 命科学的负责任创新 这些初步研究以来,基础模型开发者也进了类似的红队测试,呈现出多样化结果。OpenAI在2024年初的项研究纳了100名红队成员,规模是上述兰德公司研究的两倍多,他们拥有不同的专业平,代表不同类型的威胁为者,但并未发现威胁为者的能有任何统计学上的显著提升。135 OpenAI对多个模型的系统卡持续更新了模型在CBRN的险评估。其2024年9发布的GPT-4o到o1系列模型的系统卡显,评估结果发现o1-preview和o1-mini可协助专家制定重现已知物威胁的计划,因此将CBRN险从低136上调为中137,此后发布的o3-mini系统卡维持了中险评级。138这表明,虽然模型对于专家可能具有定的辅助,但尚未超出中险的评估阈值。与此同时,其他主要模型开发者的评估则更多体现了险平的维持。例如,Google DeepMind对Gemini 1.5内部评估使了三种法,分别针对CBRN信息进测试,初步定性结果显模型在应对提时的拒绝率有所上升,定量能未提升。139Anthropic在Claude 3的模型卡140中,报道了类似类能提升实验的结果,在没有防护措施的LLM帮助下,参与者的准确性和效率“略有提升”,但没有通过Anthropic的内部审查阈值,其统计显著性和法学细节尚未完整报告。Claude 3.5 Sonnet保持在ASL-2的“灾难性危害”级别,Claude Opus 4则成为个预防性采ASL-3标准的模型,但尚法明确其是否达到该级别所对应的能槛。141Meta则与CBRNE专家合作,对Llama 3.1进了能提升测试,较了在模拟化攻击场景中,启与未启LLM之间的差异。142研究显,在包含信息检索、搜索和代码执功能的模型辅助条件下,参与者的总体表现并未显著优于仅访问互联的控制组,最终认为模型的部署对态系统险增加“极低”。不过,以上的研究回顾也暴露出定的法论局限,例如测试样本数量有限、红队成员的专业背景差异较等。此外,值得注意的是当前多数研究均由同家第三机构Gryphon Scientific持,这可能在定程度上影响了研究视的多样性。因此,相关结论应视为探索性,不应被过度延伸。随着更强的语模型不断涌现,其在理解、整合和表达复杂物信息的能正持续提升。斯坦福学提出的“虚拟AI实验室”143便展了这趋势:该系统由多个语模型组成,分别扮演免疫学、计算物学和机器学习等领域的“AI科学家”,在“虚拟PI”的统筹下143 Helena Kudiabor,“Virtual lab powered by AI scientists super-charges biomedical research,”2024-12-04,https:/ 142 Meta,“The Llama 3 Herd of Models,”2024-07-31,https:/arxiv.org/pdf/2407.21783 141 同注11(Anthropic,2025)140 Anthropic,“The Claude 3 Model Family:Opus,Sonnet,Haiku,”202403,https:/ 139 Google DeepMind,“Gemini 1.5:Unlocking multimodal understanding across millions of tokens of context,”2024-03-08,https:/ 138 OpenAI,“OpenAI o3-mini System Card,”2025-01-31,https:/ OpenAI,“Introducing OpenAI o1-preview,”2024-09-12,https:/ OpenAI,“GPT-4o System Card,”2024-08-08,https:/ 同注67(OpenAI,2024)36 4 险分析 围绕具体科研任务展开跨学科协作。该实验室不仅能够获取和理解复杂物信息,还具备科研策划与执能,包括标设定、实验设计、批判性反馈与结果优化等功能,其成的92种纳抗体中,90%以上可成功结合新冠病毒。这案例表明,通基础模型正从信息具演化为具备科研能的协同体,显出在动化科学发现中的潜。然,随着AI在命科学领域中应的不断深化,其双性险也益受到关注。正如图灵奖得主Yoshua Bengio主导的国际智能安全报告所强调的,近年来AI在蛋质结构与功能预测、物险评估以及病毒变异和免疫逃逸预测等已取得显著进展,这也提我们必须度警惕其在物领域中的两险可能带来的安全挑战。144 获取物知识只是物险链的部分。对于未来的LLM,即使它们降低了获取有关如何制造有害物制品信息的槛,但这将如何影响物攻击成功的总体概率仍是个未解决的问题。信息获取通常只是物险链的初始阶段,危害的真正形成需要恶意为者实际合成危险物制品并在现实世界中释放。这不仅需要信息持,还需完成物险链中的系列后续步骤。这些步骤可能受、也可能不受语模型影响。145,146,147虽然信息获取是个值得研究的重要险模型,但该险模型并未充分考虑完成险链中其他步骤所需的必要资源和知识。2024年OpenAI的项研究148也指出了这点:“单靠信息获取不以构成物威胁,且仅靠信息获取的研究并不能检验威胁的物理构建是否成功”。专业培训和进资源充实验室的能,才是有效利物信息的关键,恶意为者仍临巨障碍,例如获取必要的物理设备与材料,以及掌握合成和释放有害物制品所需的湿实验室操作技术。149有估算表明,全球仅约3万具备此类技能和材料获取条件。150 这意味着,即使语模型提升了信息可及性,但受限于其他依赖因素,物攻击的实际发概率可能仍然较低。前,尚实证研究评估语模型的信息获取能与物险链中其他环节之间的关联。此外,最新研究表明,通基础模型在性能上超越特定领域专业模型仍存在未解决的挑战。151,152这仍是理解语模型如何通过信息与规划能增强物险的重要空,现有证据表明,其影响尚未达到统计学上的显著平。152 Zongzhe Xu et al.,“Specialized Foundation Models Struggle to Beat Supervised Baselines,”2024-11-05,https:/arxiv.org/abs/2411.02796 151 Daniel Jeong et al.,“Medical Adaptation of Large Language and Vision-Language Models:Are We Making Progress?,”2024-11-06,https:/arxiv.org/abs/2411.04118 150 Kevin Esvelt,“Credible pandemic virus identification will trigger the immediate proliferation of agents as lethal as nuclear devices,”2022-08-03,https:/www.hsgac.senate.gov/wp-content/uploads/imo/media/doc/Esvelt Testimony.pdf 149 Catherine Jefferson et al.,“Synthetic Biology and Biosecurity:Challenging the Myths,”2014-08-21,https:/pmc.ncbi.nlm.nih.gov/articles/PMC4139924 148 同注67(OpenAI,2024)147 US AISI,“Managing Misuse Risk for Dual-Use Foundation Models,”2024-07,https:/nvlpubs.nist.gov/nistpubs/ai/NIST.AI.800-1.ipd.pdf 146 同注122(CSET,2023)145 同注126(FAS,2023)144 同注15(Bengio et al.,2025)37 智能 x 命科学的负责任创新 4.1.4 归纳与展望 现有证据表明,与仅仅访问互联相,通过现有公开的LLM获取信息并不会显著增加为者策划和实施物攻击的险。美国国会新兴物技术安全委员会(NSCEB)也认同此观点,该委员会于2024年1表:“前,LLM不会显著增加制造物武器的险,因为LLM不会提供互联上已有信息以外的新信息”。153此外,获取物信息只是险链的部分,在物制品经过物理测试和释放之前,危害不会显现。这意味着险的根源不仅在于通过LLM获取信息,还在于整个物险链。前的证据尚未提供详细的理论模型或实证分析,以说明物信息的获取和规划如何显著增加整个险链的险。为了加强对这险模型的集体理解,并适当地制定政策和险缓解措施,智能安全和治理研究员可以致于开发更强的理论模型,并研究通过益强的LLM获取信息与通过物险链在现实世界中造成危害的可能性之间的联系。4.2 合成有害物制品(针对专型AI赋能的物具)4.2.1 分析法 要了解专型AI物具的潜在险,应先思考既有的物安全险,如物武器袭击的“基线险”,在此基础上进步探讨此类具如何增加这种险。如今,数以千计的已经能够在不使智能具的情况下从头开始制造病毒。可及性也呈指数级增,现在从头开始制造引起1918年流感流的病毒仅需1000美元。但需注意,由于群已具有免疫,1918年流感流不太可能在今天引发流。从2000年到2016年,基因合成的价格下降1000倍。因此,物具并物武器袭击的必要条件。令担忧的是,某些物具可能会加剧险。154 4.2.2 评估基准 期韧性中(CLTR)的研究员曾在份2023年的政策提案中明确指出“学术界或产业界在制定AI物具的基准或评估似乎进展不,且政府部(美国和英国)的重点迄今为主要关注LLM的模型评估,不是AI物具的评估”,“些前沿AI实验室已经评估了与LLM相关的物险,但没有公开证据表明存在AI物具评估或红队测试,前也没有制定或实施这些具的标准或要求”。155 155 同注126(FAS,2023)154 同注128(GovAI,2024)153 NSCEB,“White Paper 3:Risks of AIxBio,”2024-01,https:/www.biotech.senate.gov/wp-content/uploads/2024/01/NSCEB_AIxBio_WP3_Risks.pdf 38 4 险分析 4.2.3 研究综述 通常统称为“物具”的系列AI模型和系统,正被开发于处理物数据,以持物学研究和程任务。多数物序列模型都是基于蛋质(氨基酸)、DNA或RNA序列进训练的。这通常于以下任务:1.蛋质结构预测,通过对蛋质结构、功能和相互作进建模,以加深对细胞功能的理解并辅助设计潜在的治疗药物。156,157 2.蛋质设计,通过对蛋质结合物进建模,以辅助解决与治疗学、物传感器和酶等相关的蛋质程问题。158 3.基因元素预测,通过从基因组数据中学习可推特征的基础模型,预测DNA变化如何影响物体的适应度并设计物系统。159 4.致病变异预测,通过对氨基酸链可能发的变化进建模,以了解其对致病性的影响。160 5.通物序列建模,成可能的蛋质响应然语提,以辅助物编程。161 理解这些模型两特性的核在于确定其物例在恶意环境中的可迁移性。将智能模型应于物问题尚处于起步阶段:即使是AlphaFold,些研究也发现作为药物设计中使的计算对接算法的标,其表现不如实验结构。162,163,164最严重的局限性在于这些模型“基于学习模式,乎不了解物理和化学”,并且“法考虑pH值、温度或离、其他配体或其他蛋质的结合等因素”。165多篇论指出了在模拟之外转化AlphaFold预测的困难,并得出结论:“尽管结构预测准确度近期取得了巨进步,但有效地将预测结构于药物应仍然是个挑战”。166当前物具作为种两具,其危险性前有限。167 167 值得注意的是,尽管本节聚焦于以蛋质与核酸序列为基础的专型AI赋能的物具,部分基于受限医学数据库训练的AI系统亦展现出定的两潜,例如于疾病预测或个性化治疗建议的模型。这类系统虽本节重点,未来在特定数据可性前提下,其滥路径亦值得在其他研究中进步评估。166 Tourlet et al.,“AlphaFold2 Update and Perspectives,”2023-05-09,https:/ 165 同注162(Read et al.,2023)164 Karelina et al.,“How accurately can one predict drug binding modes using AlphaFold models?,”2023-05-22,https:/www.biorxiv.org/content/10.1101/2023.05.18.541346v1 163 Terwilliger et al.,“AlphaFold predictions are valuable hypotheses,and accelerate but do not replace experimental structure determination,”2023-05-19,https:/www.biorxiv.org/content/10.1101/2022.11.21.517405v2 162 Read et al.,“AlphaFold and the future of structural biology,”2023-06-26,https:/pmc.ncbi.nlm.nih.gov/articles/PMC10324484/161 Hayes et al.,“Simulating 500 million years of evolution with a language model,”2024-12-31,https:/www.biorxiv.org/content/10.1101/2024.07.01.600583v2 160 Cheng et al.,“Accurate proteome-wide missense variant effect prediction with AlphaMissense,”2023-09-19,https:/www.science.org/doi/10.1126/science.adg7492 159 Nguyen et al.,“HyenaDNA:Long-Range Genomic Sequence Modeling at Single Nucleotide Resolution,”2023-06-27,https:/arxiv.org/abs/2306.15794 158 Dauparas et al.,“Robust deep learningbased protein sequence design using ProteinMPNN,”2022-09-15,https:/www.science.org/doi/10.1126/science.add2187 157 Baek et al.,“Efficient and accurate prediction of protein structure using RoseTTAFold2,”2023-05-25,https:/www.biorxiv.org/content/10.1101/2023.05.24.542179v1 156 Abramson et al.,“Accurate structure prediction of biomolecular interactions with AlphaFold 3,”2024-05-08,https:/ 39 智能 x 命科学的负责任创新 这对于预测构成有害物制品的未知毒素或蛋质意味着什么?设计新型疾病或物武器相当困难。168有效利物武器需要熟练的技术专,例如细胞培养技能或基因组作经验,也需要难以获得或昂贵的材料以及组织和员资源。169这表明,这些险主要局限于国家为体或拥有先进物学和机器学习知识的专业员,从降低了险需要监测的攻击。170,171 即使拥有国家资助的专业知识和资源,专家也很难精准地锁定疾病的理想特性,例如传染性或稳定性。在考虑开发病原体所需的资源和技能时,隐性知识的重要性常常被忽视。172正如苏联物制剂武器化计划的研究员所说:“所有研究过细菌遗传学的都知道,培育个新菌株有多么复杂”。173从这个意义上讲,与上讨论的信息访问险模型类似,与物技术相关的险仍然仅在现实世界实验室中合成物化合物时体现出来,不仅仅是计算机模拟。因此需要进步研究智能具如何利易于访问的设备降低开发有害物制品的障碍,或避免在实验室进筛选和监测物材料。174,175,176,177 病原体类型 合成物制品的要求 进壁垒 技能与专业知识 材料资源 已知致病病毒 常规细胞培养和病毒纯化技能 获取基础实验室设备,例如物安全柜、细胞培养箱、离机 中等 已知致病细菌 拥有处理型细菌基因组的专业实践经验 量的资和组织资源 改造的现有病毒 级分物学技能和对该领域的深了解 基础到中等资源,与重新构建已知致病病毒所需的资源相似 中等 改造的现有细菌 根据具体细菌改造要求的不同技能平,具备经典分物学专业知识 与重新构建已知致病病毒所需的资源相似的基础资源 中等 新病原体 级设计技能和具 拥有多种技术深厚专业能的资源充团队;量的资持与泛的测试能 表3:合成有害物制品所需的技能与资源槛并不会因使AI物具被克服,改编美国国家学院报告178 178 NASEM.“Biodefense in the Age of Synthetic Biology,”2018,https:/nap.nationalacademies.org/catalog/24890/biodefense-in-the-age-of-synthetic-biology 177 同注163(Terwilliger et al.,2023)176 同注122(CSET,2023)175 同注128(GovAI,2024)174 同注126(FAS,2023)173 Leitenberg et al.,“The Soviet Biological Weapons Program:A History,”2012,https:/www.jstor.org/stable/j.ctt2jbscf 172 Lentzos et al.,“The Urgent Need for an Overhaul of Global Biorisk Management”2022,https:/ctc.westpoint.edu/wp-content/uploads/2022/04/CTC-SENTINEL-042022.pdf 171 Dang et al.,“Aya Expanse:Combining Research Breakthroughs for a New Multilingual Frontier,”2024-12-05,https:/arxiv.org/abs/2412.04261 170 同注123(CLTR,2024)169 同注168(NAP,2004)168 NAP,“Biotechnology Research in an Age of Terrorism,”2004,https:/nap.nationalacademies.org/catalog/10827/biotechnology-research-in-an-age-of-terrorism 40 4 险分析 此外,物具的有效性受到数据可性的限制。这意味着如果物具法获取有害数据,或者故意对此类数据进扰,179,180其造成危害的可能性就会受限。机器学习中的许多其他问题,其数据集规模和复杂性会随着时间的推移迅速增,181,182,183但物具数据的成成本往往很,且获取也较分散,因为许多数据集是专有的。184,185,186除此之外,物数据的质量和可验证性也构成重要限制因素。例如在医学领域,出于伦理原因,美国部分医学数据可以豁免公开,也不定经过同评审,这可能导致可数据中存在未经严格验证的信息。这类制度性限制进步加剧了数据的分散性和不确定性。鉴于数据获取在很程度上决定了智能的进步,187相其他机器学习领域,物具的改进速度可能会更加分散,也更难预测。这意味着即便是中期的AI能提升,其相关险也不太可能以可预测的速度显现。4.2.4 归纳与展望 前尚证据表明智能物具被滥已造成现实世界危害,但由于其潜在险不容忽视,仍需深开展实证研究,尤其是聚焦物具在合成与部署全过程中的险链条。这要求从全命周期度理解其滥路径,仅停留在能评估层。研究还应关注关键基准,例如相较于互联等传统具,AI是否显著放了物险,以及模型是否能处理超出其训练数据范围的复杂物学问题。当前,围绕智能极端险的政策对话益活跃,主要聚焦基础模型的险治理,常建议包括推动企业律、开展红队测试、以及以计算阈值为基础设定法规。然,物具的特殊性使上述思路难以直接套,物具治理临的些独特挑战188包括:开发槛相对较低:领先物具的开发成本低于先进基础模型,开发者分布泛,且数量不断增加。随着计算成本下降和算法优化,这趋势将加剧,从可能削弱业律的有效性,并使监管规避为更为普遍。188 同注128(GovAI,2024)187 Hooker,“On the Limitations of Compute Thresholds as a Governance Strategy,”2024-07-08,https:/arxiv.org/abs/2407.05694 186 Cesar de la Fuente-Nunez,“AI in infectious diseases:The role of datasets,”2024-02-10,https:/pmc.ncbi.nlm.nih.gov/articles/PMC11537278/185 Manoj Kumar Goshisht,“Machine Learning and Deep Learning in Synthetic Biology:Key Architectures,Applications,and Challenges,”2024-02-19,https:/pubs.acs.org/doi/10.1021/acsomega.3c05913 184 The Royal Society,“Science in the age of AI,”2024-10,https:/royalsociety.org/-/media/policy/projects/science-in-the-age-of-ai/science-in-the-age-of-ai-report.pdf 183 Longpre et al.,“Consent in Crisis:The Rapid Decline of the AI Data Commons,”2024-09-26,https:/ 182 Shivalika Singh et al.,“Aya Dataset:An Open-Access Collection for Multilingual Instruction Tuning,”2024-02-09,https:/arxiv.org/abs/2402.06619 181 Tim Tsu et al.,“Score dynamics:scaling molecular dynamics with picoseconds timestep via conditional diffusion model,”2023-10-02,https:/arxiv.org/abs/2310.01678 180 同注153(NSCEB,2024)179 Campbell et al.,“Censoring chemical data to mitigate dual use risk,”2023-04-20,https:/arxiv.org/abs/2304.10510 41 智能 x 命科学的负责任创新 红队测试的险与成本更:对LLM的红队测试主要在评估模型是否可助专家获取危险信息,对物具的红队测试可能涉及评估其是否能够成新型的、尚未被认知的物威胁信息。这类测试往往需要借助物实验进验证,更危险和困难。189许多物具开发者也指出,评估“应谨慎进,以避免创建滥的路线图”。190 开放科学倾向较强:该领域对开源的度承诺,部分源于物医学领域的传统,尤其是物具开发者群体中根深蒂固的开放科学规范。191这种理念影响深远即便某些模型并开源,研究者也可能基于开放科学的原则,主动披露其潜在的滥路径。这种强烈的开放科学倾向,直接体现在技术应层:多数先进物具均采开源模式,不仅能由使、修改其运逻辑,连具内置的防滥保障措施也因此容易被移除。192这使得依靠开发者愿设置保障措施成效有限,若需防范滥,政策制定者可能需更依赖强制性监管段。识别险模型的难度更:物具之间的异质性更,其险平与所需计算资源之间的相关性远低于语模型。因此,单纯依据“计算阈值”来设定治理边界可能不以区分险与低险系统,监管框架需要发展更复杂的险分类与识别机制。因此,物具治理需区别于基础模型,结合技术特性、开发态与领域化,发展更加适配的险识别与监管机制,并在保障科研开放性与防范滥之间取得平衡。4.3 其他险模型 除以上两类主流的智能与物险的险模型研究外,部分研究或评估报告涉及了少量其他险。有研究指出,基础模型可能通过提升实验室实验与故障排除能,显著增强恶意开发物威胁的险,例如允许技术员使然语完成计算物学的编程作。193OpenAI在其o1系统卡评估报告中记录了相关案例:该模型在湿实验室协议故障排除、实验流程规划等任务中展现出定能。报告指出o1能协助专业员复现已知物威胁的操作流程,但并未提供超越现有知识的显著信息,且由于真实威胁实施仍依赖实体实验操作技能,模型对专业员促进的险有限。因此,o1-preview与o1-mini被评估为“有限险”。194此外,CAIS194 OpenAI,“OpenAI O1 System Card,”2024-12-05,https:/ 同注123(CLTR,2024)192 GovAI,“Preventing AI Misuse:Current Techniques,”2023-12-17,https:/www.governance.ai/post/preventing-ai-misuse-current-techniques 191 James Andrew Smith et al.,“Biosecurity in an age of open science,”2022-04-14,https:/journals.plos.org/plosbiology/article?id=10.1371/journal.pbio.3001600 190 同注14(Responsible AI x Biodesign,2024)189 CLTR,“How the UK Government should address the misuse risk from AI-enabled biological tools,”2024-03-27,https:/www.longtermresilience.org/post/how-the-uk-government-should-address-the-misuse-risk-from-ai-enabled-biological-tools 42 4 险分析 和MIT等机构研究AI在病毒实验室的应,发现先进AI模型在实验故障排查任务中表现优于博级病毒学家,凸显了AI在物研究中的潜和险。195 还有研究指出,当AI应于代码成具时,可间接为攻击动化实验室系统提供便利,尤其是当后者由主智能体系统驱动时。这可能导致实验流程被错误引导,从造成潜在的安全险。196,197但据我们所知,前尚针对该类威胁路径的公开实证或实验研究。与此相关,宫政命令等件设定的算阈值暗:AI模型的训练算规模也会影响其物险等级。但界定险模型的阈值标准制定存在多重挑战:算提升并不必然增强模型能,例如部分模型在特定任务中表现优于模型;“物模型”的界定通常依赖训练数据中物信息的占,易被为操控;198,199更重要的是,训练专于物具开发的模型所需算远低于通前沿模型,导致单算槛难以作为科学有效的险划分依据。200 总体,当前围绕智能与物险的研究仍处于早期阶段,理论模型多具推测性,实证法的系统性与透明度亦有限,尚难撑科学严谨的险评估与预框架。“险识别”章节中提及的其他潜在险,也仍有待更系统的实验验证。200 Richard Moulange et al.,“Towards responsible governance of biological design tools,”2023-11-27,http:/arxiv.org/abs/2311.15936 199 Nicole Maug,“Biological sequence models in the context of the AI directives,”2024-01-17,https:/epochai.org/blog/biological-sequence-models-in-the-context-of-the-ai-directives 198 同注187(Hooker,2024)197 同注128(GovAI,2024)196 同注126(FAS,2023)195 同注26(SecureBio etc.,2025)43 智能 x 命科学的负责任创新 5 险治理实践 尽管开发者愿承诺评估物模型的潜在危险能意义重,但仅靠这措施远远不够。约翰斯霍普斯学 多尼布菲尔德(Doni Bloomfield)等在科学撰201 智能物安全险显然已经成为当前最紧迫的世界性问题之,引发各国政府、智库及国际组织的度关注和警惕。5.1 政府监管机构 美国与英国均将“物安全”归为智能安全险之,敦促政府机构制定新的战略规划,推进智能物安全险治理与防范。当前,物恐怖主义防控议题在英美等国国家安全战略中占据重要地位。然,从全球视来看,各国对该议题的重视程度存在显著差异,部分国家并未将其列为优先防控事项。5.1.1 中国:已形成物安全管理法律制度顶层设计 1)物安全整体政策 物安全关乎命健康,关乎国家治久安,关乎中华族永续发展,是国家总体安全的重要组成部分,也是影响乃重组世界格局的重要量。我国物安全领域现有效的法律、政法规及部规章有近百项。2021年4正式实施的中华共和国物安全法202为我国物安全法治体系构建奠定了良好基础,在国家层建了系列物险的检测、预防、减缓、应急措施和协同机制,并对加强新发突发重传染病防控、物技术研发与应、微物实验室物安全、类遗传资源与物资源保护、物安全能建设等重要领域作做出了框架性规定。在物技术研发,物安全法颁布前,科技部于2017年7发布了物技术研究开发安全管理办法,要求从事物技术研究开发活动,应当遵守法律、政法规,尊重社会伦理,不得损害国家安全、公共利益和他合法权益,不得违反中国相关国际义务和承诺,该办法按照物技术研究开发活动与潜在险程度,分为险、较险和般险3级别,并规定了分级管理的具体要求。2019年科技部在物技术研究开发安全管理条例202 新华社,“中华共和国物安全法,”2020-10-18,https:/ 201“Voluntary commitments among developers to evaluate biological models potential dangerous capabilities are meaningful and important but cannot stand alone.”Doni Bloomfield et al.,“AI and biosecurity:The need for governance,”2024-08-22,https:/www.science.org/doi/10.1126/science.adq1977 44 6 前瞻性险缓解和治理路径(征求意稿)中根据现实潜在险程度,将物技术研究开发活动进步调整为险、般险和低险3个等级。中国和巴基斯坦在禁物武器公约第九次审议会上共同提交的有关科学家物安全为准则天津指南203(以下简称天津指南)作件,标志着我国在全球物军控领域取得阶段性成就。总体上,我国物安全管理法律制度顶层设计已经形成,相关法律法规、规范性件的内容覆盖了物安全管理的主要领域。但与物技术快速发展带来的险相,具体管理制度及法律责任等仍需不断定期评估与更新,以确保它们有效解决现有和未来持续出现的物险,撑物科技创新与产业经济发展。2)智能 x 物安全相关政策 中国尚未出台针对物具的任何监管要求(包括报告要求)。技术标准。2024年9,安标委发布的智能安全治理框架1.0版204给出了指导性意,在两物项和技术滥险部分,框架提到了因不当使或滥智能两物项和技术,可能对国家安全、经济安全、公共卫安全等带来严重险,包括极降低专家设计、合成、获取、使核化导武器的槛。技术应对措施包括:对训练数据进严格筛选,确保不包含核化导武器等危领域敏感数据;提AI系统最终途追溯能,防其被于核化导等规模杀伤性武器制造等危场景。5.1.2 美国:认为物威胁是本国的最威胁 1)物安全整体政策 美国在物领域制定了复杂的物安全法规体系,涉及法规达20多个;形成了涉及14各部的军两的快速反应体系;拥有世界流的物技术体系,有最安全级别的P4实验室15个,P3实验室近1500个;拥有全球90%左右的物根技术;近20年累计向物安全投达1855亿美元。美国物安全智库两党物防御委员会发布了阿波罗物防御计划。205 2018年9,特朗普政府发布国家物防御战略206,认为物威胁是本国最威胁,这是其他国家少有的提法。该战略将物威胁分为两类:是然发的;是蓄意的和意外爆发,主要是国家或国家为体使和扩散物武器。该战略明确提出了物防御的五类共23个具体标,为物防御提供了个完整的框架。2021年1,针对前美在国家物206 White House,“National Biodefense Strategy,”2018-09-08,https:/trumpwhitehouse.archives.gov/wp-content/uploads/2018/09/National-Biodefense-Strategy.pdf 205 Bipartisan Commission on Biodefense,“The Apollo Program for Biodefense,”2021-01,https:/www.thenextapollo.org/wp-content/uploads/Apollo_report_final_v8_033121_web.pdf 204 同注257(安标委,2024)203 外交部军控司,“关于倡导负责任的物科研:科学家物安全为准则天津指南的作件,”2022-12-02,https:/ 45 智能 x 命科学的负责任创新 安全防御战略的现状和不,两党物防御委员会发布了阿波罗物防御计划,提出了包括实施国家物防御蓝图、制定国家物防御科技战略、编制跨部的预算和稳定的多年期拨款等建议。2022年10,拜登政府发布了新版的国家物防御战略207,其中多项内容与阿波罗物防御计划建议度契合。2025年4,美国国会新兴物技术国家安全委员会(NSCEB)未来物技术蓝图美国安全与繁荣动计划208着眼于巩固美国在物技术领域的全球领导地位,促进经济繁荣和国家安全,同时减少对战略竞争对的依赖。2025年5特朗普政府签署发布的提物研究的安全和安保政令209则旨在加强对危险物研究的监管,以防灾难性后果并确保透明度。2)智能 x 物安全相关政策 在智能快速发展的背景下,美国政府已开始系统关注其在物安全领域的潜在险,并通过政命令、法举措、政策书等多种段建起初步的应对框架。但前还没有任何法规要求任何物具的开发者评估其具带来的险,或要求在具看起来过于危险时停发布。政层,2023年10,时任总统拜登签署关于智能安全、可靠和可信的政令(2025年1已被特朗普总统的新政令废210)。该政令明确指出,智能可能加剧物安全险,要求相关部研究如何减少与病原体和组学数据相关的数据集对国家安全构成的威胁,重点防范AI被滥于协助开发或使化武器,尤其是物武器。命令中的项关键条款还要求部分物具开发者提交险管理报告。具体,任何开发“主要基于物序列数据”训练,且使达到特定计算强度阈值(1023次浮点运算)的智能模型的组织,均需说明其开发计划与安全控制措施,包括识别模型潜在危险途的能以及防模型被盗的策略。截2025年7,仅有ESM3(98B)211、xTrimoPGLM-100B212和Galactica213三个公开模型满该标准。213 Ross Taylor et al.,“Galactica:A Large Language Model for Science,”2022-11-16,https:/arxiv.org/abs/2211.09085 212 Bo Chen et al.,“xTrimoPGLM:Unified 100B-Scale Pre-trained Transformer for Deciphering the Language of Protein,”2023-07-06,https:/www.biorxiv.org/content/10.1101/2023.07.05.547496v1 211 EvolutionaryScale,“ESM3:Simulating 500 million years of evolution with a language model,”2024-06-25,https:/www.evolutionaryscale.ai/blog/esm3-release 210 White House,“Removing Barriers to American Leadership in Artificial Intelligence,”2025-01-23,https:/www.whitehouse.gov/presidential-actions/2025/01/removing-barriers-to-american-leadership-in-artificial-intelligence/209 White House,“Improving the Safety and Security of Biological Research,”2025-05-05,https:/www.whitehouse.gov/presidential-actions/2025/05/improving-the-safety-and-security-of-biological-research/208 NSCEB,“Charting the Future of Biotechnology,”2025-04,https:/www.biotech.senate.gov/final-report/chapters/207 White House,“National Biodefense Strategy and Implementation Plan,”2022-10,https:/bidenwhitehouse.archives.gov/wp-content/uploads/2022/10/National-Biodefense-Strategy-and-Implementation-Plan-Final.pdf 46 6 前瞻性险缓解和治理路径 法层,美国会推出多项法案,要求评估智能物安全险并制定应对战略。项是智能和物安全险评估法案,要求战略准备和响应管理局(ASPR)评估开源智能模型和语模型开发新型病原体、病毒及化武器的险。另项是公共卫准备和应对智能威胁战略法案,要求卫与公众服务部(HHS)制定应对智能驱动的物威胁造成公共卫紧急事件的战略。214 技术标准层,2024年10,美国智能安全研究所(US AISI)215就化学-物AI模型的负责任开发使公开征集业意216,得到Rosetta Commons217、CSET218等机构的公开反馈。2025年1NIST发布管理两基础模型误险的更新指南219,对AI在物和化学领域的险管理提出技术与治理建议。5.1.3 英国:将物武器列为级险 1)物安全整体政策 英国是世界上物技术强、医疗资源丰富的国家之,取得了克隆等系列领跑世界的重成果。英国在1763年七年战争期间曾被指利天花病过的毯和帕,传播天花疫情以削弱美洲原住,这被些历史学者认为是早期物战的例证之。战期间,英国还曾在格鲁伊纳岛试射过细菌弹,其造成的危害在40年后仍可检测到。战后,英国积极将物安全作为国家战略,把物武器列为级险,出台了系列保障物安全的法规与措施,成了独的物安全监管机构。在完善本国物安全法规体系的同时,英国还为禁物武器公约的缔结做出了重要贡献。英国是该公约最初版本的起草国和保存国。英国对物安全的法与管理致可分为三个阶段:第阶段,以转基因物安全为主,指出转基因品必须有明确标签。第阶段,以实验室安全和公共卫安全为主,明确将病原体分为四级。第三阶段,以防御物恐怖与物武器为主的国家物安全战略220。220 王宏等,“中国物安全:战略与对策,”2022,https:/ US AISI,“Updated Guidelines for Managing Misuse Risk for Dual-Use Foundation Models,”2025-01-15,http:/www.nist.gov/news-events/news/2025/01/updated-guidelines-managing-misuse-risk-dual-use-foundation-models 218 CSET,“RFI Response:Safety Considerations for Chemical and/or Biological AI Models,”2024-12-03,https:/cset.georgetown.edu/publication/rfi-response-safety-considerations-for-chemical-and-or-biological-ai-models/217 Rosetta Commons,“Rosetta Commons community members submit public comment on safety considerations for chemical and biological AI models,”2025-01-08,https:/rosettacommons.org/2025/01/08/rosetta-commons-community-members-submit-public-comment-on-safety-considerations-for-chemical-and-biological-ai-models/216 NIST,“U.S.AI Safety Institute Issues Request for Information Related to Responsible Development and Use of Chem-Bio AI Models,”2024-10-04,https:/www.nist.gov/news-events/news/2024/10/us-ai-safety-institute-issues-request-information-related-responsible 215 2025年6,美国商务部宣布将原美国智能安全研究所(US AISI)更名为智能标准与创新中(CAISI),这项变动标志着该机构将重点从总体安全转向更加专注于应对国家安全险和减少不必要的国际监管 214 同注64(张芮晴,2024)47 智能 x 命科学的负责任创新 以2018年7发布的英国物安全战略(UKBSS)221为标志,英国的物安全战略进了新阶段。在该战略的指导下,英国发布了系列件。2023年6,英国政府在新的英国物安全战略222,分四柱提出了15项结果承诺,其中包括提出建新的国家物监测络,承诺每年为物威胁雷达(bioradar)投资15亿英镑,于提供已知和新兴物威胁的全信息。英国将物安全险分为三级,2015年英国国家安全险评估223将重类健康危机(例如流性感染)和抗菌素耐药性确定为英国临的最险(级险)之,并将针对英国的蓄意物攻击以及化放核(CBRN)的扩散列为级险。英国的反恐战略也阐明了准备应对影响最的恐怖分险的重要性,其中包括使物制剂的险。此外,英国上议院科学技术委员会于2025年初发布了题为不要错失规模化良机:把握程物学的时代机遇的报告224,强调英国若不采取紧急动促进程物学的规模化、创新转化与安全监管,可能在全球竞争中被反超,呼吁政府制定国家战略并加强政策协调,这为全球在发展合成物学时兼顾安全与产业布局提供了重要借鉴。2)智能 x 物安全相关政策 英国尚未出台针对物具的任何监管要求(包括报告要求)。值得注意的是,英政府在2023年8发布的智能监管的创新法中提出建中央险职能部,识别、评估、优先考虑和监测可能需要政府预的智能交叉险,包括“影响但低概率”险,如智能物安全险等。225 同年11在英国召开的届智能安全峰会上,英国政府宣布成英国智能安全研究所(UK AISI),以持对智能带来的各种险进科学评估和管理。该研究所主要关注通型智能系统,但前也持针对智能物具险的研究。226 这些举措体现了英国政府正逐步加强对智能与物安全交叉议题的系统性治理。226 同注128(GovAI,2024)225 同注64(张芮晴,2024)224 UK Government,“Dont fail to scale:seizing the opportunity of engineering biology,”2025-01-14,https:/publications.parliament.uk/pa/ld5901/ldselect/ldsctech/55/55.pdf 223 UK Government,“National Security Strategy and Strategic Defence and Security Review 2015,”2015-11,https:/assets.publishing.service.gov.uk/media/5a74c796ed915d502d6caefc/52309_Cm_9161_NSS_SD_Review_web_only.pdf 222 UK Government,“UK Biological Security Strategy,”2023-06-12,https:/www.gov.uk/government/publications/uk-biological-security-strategy/uk-biological-security-strategy-html 221 UK Government,“UK Biological Security Strategy,”2018-07 https:/covid19.public-inquiry.uk/wp-content/uploads/2023/07/22160822/INQ000142130.pdf 48 6 前瞻性险缓解和治理路径 5.1.4 欧盟:寻求“更美好世界中的欧洲安全”1)物安全整体政策 欧盟分重视物技术、物经济与物安全,其多项物技术处于国际领先平。欧盟制定了多项物安全战略及计划,在公共卫与健康、转基因安全、实盘去等投了量经费,出台了严格的转基因安全管理办法,同时分重视物实验室安全。欧盟通过多项法规来协调成员国共同应对突发物安全险。2003年12,欧盟脑会议通过了更美好世界中的欧洲安全,这是欧盟通过的第个安全战略件。该件认为:冷战结束后欧洲的安全形式发了根本性变化,临的新安全挑战,主要是恐怖主义、规模杀伤性武器扩散、地区冲突和有组织犯罪等。2007年,欧盟实施第七个框架研发计划,将卫与健康、安全列为两主题,在卫与健康领域,欧盟的标是应对包括新发传染病在哪的全球健康问题。在安全领域,欧盟则重点关注具有宽国影响的事故可能造成的威胁,如犯罪分所使的装备和攻击式。在核化险防范,2009年6,欧盟委员会通过了关于CBRN的揽案,防范恐怖分获取CBRN材料是关键。据此,欧盟实施了反对CBRN威胁欧盟动计划,出台了132条相关措施,重点关注三个领域,是防范,确保CBRN材料必须经过授权才能使;是检测,即有能对CBRN材料进检测;三是准备和响应,对涉及CBRN材料的意外事件进有效处置。由于国家之间协调作量,欧盟出台的物安全件数量较美国少,但欧盟在涉及总体安全、命安全、防御核化等重安全险制定了些详尽、具体、可操作的法规或动案。2)智能 x 物安全相关政策 欧盟通过了项智能法,该法案将引系列与智能相关的新监管要求。该法案对以下领域提出了要求和限制:1)智能系统的特定应,包括“险”智能系统;以及2)通型智能系统。前,智能辅助的物具尚未纳任何类。这种情况只能通过修改法来改变,这需要欧洲理事会、欧洲议会和欧洲委员会的参与。通型模型。通型智能模型的定义基于“通性和能够胜任执各种不同任务的能”(第3(63)条)。该定义尚未得到精确界定,前尚不清楚其是否适于智能辅助的物具。些智能辅助的物具可以执各种物任务,但其执任务范围仍然GPT-4和Claude 3等模型有限得多。些具有潜在险的智能辅助物具法执泛的物任务,因此不能被定义为通型模型。49 智能 x 命科学的负责任创新 该法案规定,如果(但不限于)通型智能模型在超过1025次浮点运算(FLOP)上进训练,则应推定其具有“影响”,从具有“系统性险”(第51(2)条和第51(1)(a)条)。这不适于任何现有的智能物具。然,未来很可能会出现基础模型和物具相结合的模型,227这些模型符合智能法对“通型”的定义,其先进的物能可能幅增加物险。此类模型将被纳该法案的监管范围。险应。欧盟智能法第6条将“险”AI系统定义为“对然的健康、安全或基本权利构成重损害险”的系统。该法案的附件三列出了具体的标准,如果AI系统旨在于险应,则将其归类为险系统,这些应包括社交评分系统、就业相关决策、评估们的财务信誉以及其他标准。智能物具似乎不太可能被归类为险系统,原因有。先,附件三中列出的标准指的是AI系统的预期途,但开发者并不打算将物具于物武器。其次,增强的物武器能并未包含在附件三中。欧盟委员会可以将系统归类为险或险系统,前提是它们会增加附件三所涵盖领域的险(根据第6条)。委员会不能使授权法案增加附件三中尚未包含的新险领域(根据第7条)。但是,委员会可以每年向欧洲议会和理事会提议在该法案附件三中增加新的险领域(根据第112条)。科学研发豁免。该法案规定,仅为科学研发的开发和使的智能模型不属于该法案的管辖范围(第2(8)条),这似乎也适于智能物具。然,由于多数智能物具都是开源的,因此法确定它们是仅于科学研发,还是也被恶意为者滥于物武器开发。因此,尚不清楚该条款是否确实将智能物具排除在该法案的管辖范围之外。228 通型智能为准则第1第3版草案以及终稿。在“系统性险”节的讨论中,关注化放核(CBRN)攻击或事故由智能带来的险,包括显著降低恶意为者介的槛,或显著提升其在相关武器或材料的设计、研发、获取、释放、传播和使过程中的可能造成的影响。229 5.2 智能研发机构 对国际社会对智能潜在险的质疑声不断加,前沿AI模型研发机构签署愿承诺、提出前沿AI险管理框架,并实施相应评测。229 EU AI Office,“The General-Purpose AI Code of Practice,”2025-07-10,https:/digital-strategy.ec.europa.eu/en/policies/contents-code-gpai 228 GovAI,“Managing Risks from AI-Enabled Biological Tools,”2024-08-05,https:/www.governance.ai/analysis/managing-risks-from-ai-enabled-biological-tools 227 因AlphaFold 3已能完成物领域多种预测任务,甚需微调,国际智能安全报告已将其定义为物通型智能(biological general-purpose AI)。50 6 前瞻性险缓解和治理路径 2024年5,在韩国尔举的第届AI安全峰会上,16家全球领先的AI公司,联合签署了前沿AI安全承诺。愿承诺负责任地开发和部署其前沿智能模型和系统,并通过在2025的法国AI峰会上发布以严重险为重点的安全框架来展他们如何实现这标。截2025年4,已有Anthropic、OpenAI、Google DeepMind、Meta、xAI等12家机构发布了少16版前沿AI安全框架,230均涉及前沿AI物威胁险识别、险评测与相应缓解措施。各领先AI公司在落实安全承诺,已开展多项具体的险评测作。OpenAI的o1和GPT-4o、Anthropic的Claude 3.5 Sonnet系列、Google DeepMind的Gemini 1.0、Meta的Llama 3系列等纷纷进了物的评测,涉及动化基准测试、领域专家红队测试、类能提升实验多种评测案。详细列表请4.1.3节。此前,Anthropic和OpenAI还开展了AI赋能物威胁相关的早期研究。Anthropic通过前沿威胁红队测试231,评估模型在多个领域的潜在险,尤其在物学向,与专家合作发现如果不加预,模型可能很快对国家安全构成威胁,但也识别出可显著降低险的缓解措施,并正在扩这项作以系统性提升安全性。OpenAI则围绕LLM辅助的物威胁试图构建预警系统232,开发了基准评估法,评估模型是否会实质性提恶意为者获取物威胁信息的能。其研究中,100名具备不同物学背景的参与者分别在只互联和同时使GPT-4的条件下完成物威胁相关任务,这是前最规模的此类评估。5.3 命科学产学研机构 校实验室、合成物公司、DNA合成服务商、物医药企业、科研社群等在内的命科学产学研界,正逐步成为智能与物安全治理的重要推动量。校实验室,以约翰斯霍普斯学健康安全中(CHS)发起的“AIxBio项”233为例,该项聚焦智能与物技术交叉领域,致于在推动技术应的同时,防范潜在物险。CHS特别关注AI模型可能被于重建危险病毒或设计新型病原体,从引发规模物危害。主张应优先治理具影响两险的模型能。为推动险治理,CHS积极参与相关政策制定与咨询,先后向美国NIST、能源部、CAISI等机构提交多份政策回应,提出应优先评估和限制AI模型在病原体成、蛋质程等领域的能边界。此外,CHS还参与起草国家安全备忘录(NSM)相关条款,呼吁在AIxBio险问题上建更明确的能评估标准和治理机制。通过组织专家会议、发布政策综述、与政府和业合作等式,CHS的作为前沿AI与物技术融合中的险识别与治理奠定了实践基础,也为全球建更加系统的物安全防线提供了借鉴。233 CHS,“Our Work:AIxBio,”2025,https:/centerforhealthsecurity.org/our-work/aixbio 232 同注67(OpenAI,2024)231 Anthropic,“Frontier Threats Red Teaming for AI Safety,”2023-07-26,https:/ 230 METR,“Frontier AI Safety Policies,”2025-02,https:/metr.org/faisc 51 智能 x 命科学的负责任创新 在命科学科研社区层,诺尔奖得主David Baker参与成Rosetta Commons展现了以技术社群为中的治理实践路径。作为蛋质设计领域的核络,已拓展出聚焦物安全的项。它不仅聘任了位物安全研究员Samuel Curtis234(现已加CAISI,作为物技术级政策顾问),负责协调科研员与政策专家的合作,还通过组织Biodesign in Focus研讨会235、公开意反馈236等形式,推动蛋质设计软件能评估和安全标准的建设。更泛的科研群体也在积极探索伦理边界的划定。2024年,全球176位科学家共同签署了承诺声明237,提出系列将物安全原则融科研实践的具体措施:包括只从符合物安全标准的DNA合成提供商处采购、持续评估并改进蛋质设计具、定期举办安全能审查会议、报告不当研究为,并主动与公众沟通研究险与益处等。这承诺不仅体现了研究员对技术影响的集体责任感,也推动了业内部的规范化与透明化。2025年22326,“阿西洛精神与物技术的未来”国际峰会在美国加州阿西洛会议中举,隆重纪念1975年重组DNA分国际会议召开50周年。此次会议由莱斯学、斯坦福学与科学史研究所联合主办,吸引全球约300名科学家、政策制定者、伦理学家、法律专家、记者及全球南国家代表参会,聚焦合成物学、基因编辑、镜像命、智能驱动物程等前沿技术,深探讨物技术伦理治理、公平获取及负责任创新等议题。命科学产学研界的治理实践也获得了更多技术与资的推动。例如,AI安全基(AISF)设了专的物安全AI研究资助项238,励对前沿模型在物领域的潜在险进深技术评估。5.4 安全与治理研究机构 疾控体系、国家物安全实验室、智库等国家级治理量,正逐步成为智能与物安全治理的重要撑主体,承担着国家层险防控与安全治理能建设的核职能。实验室针对智能特定险的缓解措施。更新的世卫组织实验室物安全指南239现已涵盖智能相关险,强调基因数据的络安全和处理智能成的病原体修饰规程。239 WHO,“WHO updates laboratory biosecurity guidance,”2024-07-04,https:/www.who.int/news/item/04-07-2024-who-updates-laboratory-biosecurity-guidance 238 AISF,“Biosecurity AI Research Fund Program 2025,”2025-01-20,https:/www2.fundsforngos.org/latest-funds-for-ngos/biosecurity-ai-research-fund-program-2025 237 同注14(Responsible AI x Biodesign,2024)236 Rosetta Commons,“Rosetta Commons community members submit public comment on safety considerations for chemical and biological AI models,”2025-01-08,https:/rosettacommons.org/2025/01/08/rosetta-commons-community-members-submit-public-comment-on-safety-considerations-for-chemical-and-biological-ai-models/235 Rosetta Commons,“Biodesign in Focus,”2025-01-21,https:/rosettacommons.org/2025/01/21/biodesign-in-focus-presentation-series/234 Rosetta Commons,“Rosetta Commons welcomes inaugural Biosecurity Fellow,Samuel Curtis,”2024-06-28,https:/rosettacommons.org/2024/06/28/rosetta-commons-welcomes-inaugural-biosecurity-fellow-samuel-curtis/52 6 前瞻性险缓解和治理路径 防护实验室正在采机器学习具和智能驱动的主题建模来监测物安全研究趋势,例如于病原体识别的BLAST。国家级智能安全研究所(AISIs):英国智能安全研究所(UK AISI)主导国际智能安全报告的发布,涵盖包括物安全在内的AI安全问题,且与OpenAI、Anthropic、DeepMind等机构合作获得前沿AI模型的优先访问权限,于安全评测。智能标准与创新中(CAISI)倡导开发实证性的AI模型测试和评测法,包括评估潜在物安全险。美国拥有多个专注于智能与物安全交叉领域的研究机构和智库。兰德公司开发了针对AI驱动的规模物攻击的险评估框架,强调经验导向的定期评估对于识别和降低险的重要性。该框架结合定量和定性法,模拟不同的物威胁场景,评估AI在其中的作,从为政策制定者提供科学依据。这作有助于提升国家在应对新型物安全威胁的能。然,兰德公司对智能发展发出了潜在险的警告,预测到2030年物武器开发的技术壁垒可能会降低,并倡导采取积极措施,例如增强DNA合成筛选、智能驱动的预测险分析以及效仿禁物武器公约的国际治理框架。他们的建议包括制定“智能-物险指数”240以量化威胁,并建“物-CERT”系统,于在物安全环境下报告可疑的智能查询请求。乔治城学新兴技术与安全中(CSET)在物险研究领域重点评估物技术发展中的安全险。其2024年12发布的预测物险241研究报告,系统分析了AI在物医学领域的两特性。该研究通过追踪科研献中的AI应趋势,建物安全险评估框架。在政策实践,CSET积极参与政府咨询,包括就AI物模型安全问题向美国国家标准与技术研究院(NIST)提出治理建议。CSET还定期发布技术分析报告,如2025年4对AI在物技术研究中实际应情况242的评估,为政策制定提供数据撑。智能安全中(Center for AI Safety,CAIS)通过技术研究、基础设施持和政策倡导。其主要项包括开发规模杀伤性武器代理(WMDP)基准243,这是个包含多项选择题的型数据集,旨在衡量与物安全、化学安全和络安全相关的危险知识,从评估和降低智能滥险。CAIS还联合开发了病毒学能测试(VCT)基准244,于衡量AI系统的实际病毒学知识,特别是其解决具有两潜的复杂病毒学实验室案的能。除研究之外,CAIS还通过提供计算集群来持AI安全研究,其中些论探讨了物安全问题。他们还积极参与政策倡导,包括共同发起加州SB 1047法案。CAIS强调对具有物学能的AI模型进244 同注26(SecureBio etc.,2025)243 The WMDP team,“The WMDP Benchmark:Measuring and Reducing Malicious Use With Unlearning,”2024-03-05,https:/www.wmdp.ai/242 CSET,“Exploring AI Methods in Biology Research,”2025-04,https:/cset.georgetown.edu/article/exploring-ai-methods-in-biology-research/241 CSET,“Anticipating Biological Risk:A Toolkit for Strategic Biosecurity Policy,”2024-12,https:/cset.georgetown.edu/publication/anticipating-biological-risk-a-toolkit-for-strategic-biosecurity-policy/240 Rand,“A new risk index to monitor AI-powered biological tools,”2024,https:/www.rand.org/randeurope/research/projects/2024/ai-risk-index.html 53 智能 x 命科学的负责任创新 严格访问控制的必要性,并倡导在发布前对先进的物AI模型进独的物安全评估,并与政府和国际机构密切合作,推动建能够应对AI在物技术领域两险的治理框架。245 此外,加州理学院等机构联合开展了针对合成物学中AI应的物安全险评估研究。246斯坦福学研究员提出了“打地式治理”模型,将适应监管与AI持的新兴物危害预警系统相结合。247新美国安全中(CNAS)发布了关于AI与物国家安全险的评估报告。248兰德公司也在建针对AI驱动规模物攻击的险评估框架。物安全领域的专家还提出了系统化的险评估与治理联动模型。例如,下图展的“物两技术险评估”从技术获取性、潜在危害、应急状态等多个维度构建评估标准,并将险等级划分与治理段直接对应,体现了险两技术的动态评估与治理机制耦合的思路。此类模型有助于明确技术特性与政策响应之间的映射关系,是构建智能与物交叉领域治理具体系的重要参考。图8:物两技术险评估249 249 张卫等,“物安全:理论与实践,”2025-03-11,https:/ 248 同注25(CNAS,2024)247 Trond Arne Undheim,“The whack-a-mole governance challenge for AI-enabled synthetic biology:literature review and emerging frameworks,2024-02-08,”https:/www.frontiersin.org/journals/bioengineering-and-biotechnology/articles/10.3389/fbioe.2024.1359768/full 246 Leyma De Haro,“Biosecurity Risk Assessment for the Use of Artificial Intelligence in Synthetic Biology,”2024-06,https:/ 245 同注75(CAIS,2024)54 6 前瞻性险缓解和治理路径 5.5 国际组织与平台 当前,国际社会正通过产学研协同的路径,逐步构建智能与物安全的全球治理框架。此进程由多元主体共同推动,初步形成涵盖险预警、技术管控与制度规范的治理链条。全球健康安全议程(GHSA)预防动案-3(APP3)推动世卫组织发布关于型多模态模型(LMM)的智能伦理和治理的新指南。250该指南概述了40多项建议,供政府、科技公司和医学界考虑并确保LMM的合理使,以促进和保护公众健康。并持天津指南,其中包含10项指导原则和为标准,旨在促进负责任的科学实践,并加强国家和机构层的物安全治理。联合国禁物武器公约(BWC)积极推动科学咨询机制,应对AI带来的物安全挑战。2024年初,国际科学院组织(IAP)与美国国家科学院(NASEM)联合举办“科学咨询机制概念验证会议”251,邀请来32国的38位专家,围绕AI等前沿技术对物安全及军控条约履的潜在影响展开分析研判。会议建议设常设科学与技术咨询机制,为缔约国提供可信、独的科技情报持,使物武器治理更好适应技术迅速演进的现实。这努意在弥合科学进展与国际法律执之间的时间差,使AI在合成物学、病原体设计与信息扩散等领域的影响能够及时纳政策决策,有望成为推动AI物安全国际合作与制度建设的重要抓。政策倡导组织 发挥着搭建跨国对话平台的关键作。以美国降低核威胁倡议组织(NTI)为例,其发起建的“国际智能-物论坛”(AI-Bio Forum)252,旨在汇聚全球专家、政策制定者和关键利益相关,共同推进AI与命科学交叉领域的安全能保障。美国程物学研究联盟(EBRC)也在程物学和智能交叉的安全考虑书中阐述了此类论坛的重要性,强调加强国际合作,根据物险的发展进程制定最佳安全措施,同时监测以往战略政策的适性。届论坛于2024年4召开,与会者包括来中国、美国、英国、印度、尼利亚等25国的物安全专家、AI研究员和政策制定者。围绕论坛的范围、制度结构与初始优先事项展开讨论,图有效应对智能赋能程命系统所带来的新兴险。技术治理组织 正通过开发可落的具填补监管真空。2024年慕尼安全会议期间,NTI正式启动的国际物安全与物安保科学倡议(IBBIS)253成为全球个专注降低物技术险的独机构。其核创新在于采取“技术段防范技术险”的路径例如推出的“通机制”(Comman Mechanism)DNA合成筛查软件,通过标准化、低成本的式帮助全球基因253 NTI,“New International Biosecurity Organization Launched to Safeguard Bioscience,”2024-02-15,https:/www.nti.org/news/new-international-biosecurity-organization-launched-to-safeguard-bioscience/252 NTI,“NTI Begins Scoping New International AI-Bio Forum,”2024-01-30,https:/www.nti.org/news/nti-begins-scoping-new-international-ai-bio-forum 251 IAP,“Exploring possible impact of AI on Biosecurity and International Cooperation in the BWC,”2024-05,https:/www.interacademies.org/publication/science-and-technology-advisory-mechanism-biological-weapons-convention-proof-concept 250 WHO,“Ethics and governance of artificial intelligence for health:Guidance on large multi-modal models,”2025-03-25,https:/www.who.int/publications/i/item/9789240084759 55 智能 x 命科学的负责任创新 合成企业拦截危险病原体订单,直接阻断恶意为者的技术获取渠道。这具体现了IBBIS的运作逻辑:由来中国、印度、菲律宾等13国的跨国顾问团队识别技术痛点,再联合产业界开发可落地的解决案。IBBIS的特别之处在于其桥梁定位。正如任执主任Piers Millett所,该机构既纯粹的政策倡导组织,也单纯的科研机构,是通过连接政府、企业和国际组织,在物技术创新的全命周期嵌安全护栏。未来三年,其作将从DNA筛查扩展到两研究的资助审查、出版伦理规范等更泛领域。尽管这些实践已取得初步进展,但关键挑战仍然存在。发展中国家实验室的参与度不,AI开源模型的跨境监管缺乏统标准,反映出当前治理体系在包容性和技术适配性上的短板。未来,国际社会需进步强化多协作,确保AI在物安全领域的应既促进创新,可控可治理。56 6 前瞻性险缓解和治理路径 6 前瞻性险缓解和治理路径 许多事故并源于缺乏物理屏障或监管规定,是因为实验室及其监管机构缺乏强有的物安全化。然社论,2014年729254 我们呼吁在促进科学开放与技术创新的同时,同步强化物安全防护机制。未来的物安全政策应在保障公共安全与励科研由之间实现动态平衡,确保智能技术的发展不会被恶意为者所利。本章围绕构建“智能-物能”防护体系,提出四项关键缓解路径,以系统回应“险识别”章节所界定的三类主要险类型:事故险、滥险与结构性险:为智能-物能建护栏:针对AI模型与物具的安全使边界问题,主要应对滥险与部分事故险,提出模型评估、能分级、访问控制等模型防护机制。加强数字-物理界的物安全:聚焦于实验执阶段的险防控,主要应对事故险与部分结构性险,如平台脆弱性、监管缺等问题;同时,通过份验证、为审计等措施,也有助于间接抑制滥为的实施可性。推进流病防范:着眼于提升对重事故或滥为所引发泛传播后果的应对能,加强监测、预警、应急与联动机制,防局部事件演化为规模公共卫危机。强化物科研的安全伦理建设与制度保障:回应结构性险中的制度缺,着健全科研伦理规范、激励机制与治理制度,推动形成更具韧性的科研化。通过这四条路径的协同推进,以期逐步构建起覆盖技术护栏、系统防控、应急响应与制度建设等多个层的综合性物安全防护体系。6.1 为智能-物能建护栏 为了防智能被滥于物威胁的成,AI开发者已采取包括模型拒答机制、红队测试等在内的多项技术段。然,这些措施通常依赖模型开发者对访问权限的严格控制,在开源模型中往往难以实施。同时,单靠限制计算资源和数据获取的策略仍难以完全奏效。有效建护栏需要跨学科协作,综合模型防护、险识别与制度建设等多努。254“Many accidents are caused not by a lack of physical barriers or regulations,but by the absence of a strong biosafety culture in labs and their oversight bodies.”Editorial,“Safety doesnt happen by accident,”2014-07-29,https:/ 57 智能 x 命科学的负责任创新 6.1.1 技术防护措施 1)建危险知识分类与访问机制 当前AI系统缺乏对知识险的系统辨识能,危险信息往往混杂于科学资料、学术论、公共数据库之中,难以识别与屏蔽。因此,可建个新的“危险知识分类体系”,对可能对公共健康、安全与物安全构成重威胁的技术性信息进识别、标记与分级管理。255例如,可以根据滥潜、技术成熟度、是否具备即操作性等因素,将知识划分为“开放可”、“受限访问”、“险封闭”等不同等级,在此基础上制定访问权限与处理规范。2)训练数据筛查与遗忘学习技术 在模型训练阶段,应建对训练语料的审查机制,避免将危险知识纳通模型训练数据。256这类信息包括但不限于化放核(CBRN)相关技术献、毒理学合成路径、病毒重构操作流程及可于制造规模杀伤性武器的公开数据集等。国内全国络安全标准化技术委员会发布的智能安全治理框架1.0版也从数据安全险应对的度建议“对训练数据进严格筛选,确保不包含核化导武器等危领域敏感数据”。257 例如,在Evo 2模型的开发中,研究员考虑到潜在的伦理和安全险,主动在其基础数据集中排除了感染类和其他复杂物的病原体,并进步确保模型不会对相关查询返回有效答案。这种实践为危险数据的预筛选与险缓释提供了有益的范。258 此外可重点发展遗忘学习等技术,并探索应对模型训练过程中“信息危害”的法,于帮助防模型在未经授权的情况下记住或泄露敏感信息。259 3)强化模型护栏与访问控制策略 模型内建防护与输出控制。AI系统应在设计与开发阶段内建“安全护栏”,主动防范其在物险场景中的误和滥。开发者应参考当前最佳实践,实施可的技术和策略,以降低AI在物安全领域的潜在险,同时避免对其正当途造成过度限制。各国政府、物安全组织及相关机构也应通过资持、监管政策和激励机制,推动此类防护措施的泛采纳与标准化。260在模型部署与应阶段,需明确哪些危险知识不应出现在模型输出中。例如,开源模型或向公众的聊天机器、通型智能助,不应具备成危险物知识或指导物合260 同注1(NTI,2023)259 同注25(CNAS,2024)258 同注45(新华,2025)257 安标委,“智能安全治理框架1.0版,”2024-09-09,https:/ 256 同注65(FLI,2024)255 同注65(FLI,2024)58 6 前瞻性险缓解和治理路径 成的能。部分研究建议,应将具有潜在危害性的物学从通型AI的能中排除,并将此类能严格限定于少数经过安全审查的专模型,由获批研究员在受控环境中使。261 模型权重与访问权限控制。模型权重旦公开,便法有效遏制其被滥的险,尤其是经过修改或微调后可能产新的危害能。因此,模型开发者在发布权重前,需通过包括红队测试在内的系统性评估,确认模型不具备此类险能,或确保其难以被于成物武器等危险途或场景。262对这类系统的访问应限于通过审批的特定途场景,避免AI能在监管环境中扩散。4)加强基础设施与系统防护能 加强云平台访问与合规性控制。建议采取更加开放的科学法,在国际上扩展基于云计算资源的基础设施,以促进物设计具的关键进步,同时建负责任发展的规范。263投资于可以遏制基础模型威胁的技术安全机制,特别是增强对基于云的智能具访问的保护措施。264 强化物信息系统和动化实验系统的络安全。鉴于两者在现代物技术中的重要性,必须加络安全的加固度。包括对数据传输、存储、访问控制等环节的安全防护,以避免物数据被恶意篡改或泄露,确保相关研究和应的安全性和合规性。6.1.2 险监测预警 1)开展系统性的能和险双重评估 对知识与能的双重评估。险评估不仅应考察模型是否“记住”了险信息(如物合成流程或毒理知识),还应识别其是否具备将这些知识整合、推理并执的能。尤其在模型经过微调、插件调或与外部具配合使的情况下,需特别警惕潜在能“跃迁”所带来的不可预期的险。这类能演化可能在模型看似害的基础能中被激活,构成对现实世界的安全隐患。评估重点应考虑那些针对物的开发、训练或微调的智能模型,特别是在物险链各个阶段中表现出较适应性的模型,普遍评估所有通型智能模型。265 内部与外部红队测试机制。建议在通性智能模型的开发和部署过程中,系统性引红队测试程序,重点评估模型是否可被于获取与制造物武器相关的敏感信息或执流程。测试内容可包括:模型是否能够成或优化毒素合成路径;是否具备诱导欺骗、操控为的能;是否具备协助法交易、访问法信息渠道等险能。266此外,模型发布前应由独266 同注65(FLI,2024)265 同注129(Peppin,2025)264 同注25(CNAS,2024)263 同注126(FAS,2023)262 同注65(FLI,2024)261 同注75(CAIS,2024)59 智能 x 命科学的负责任创新 于开发团队的外部第三安全评估机构开展全测试。此类评估应覆盖模型输出为、训练数据源、交互接等关键环节,以实现全流程的险识别。267,268 2)推进途监督与为追踪机制建设 向先进AI模型的“了解你的客”(KYC)机制。前尚缺乏有效机制来追踪可能加剧物险的先进AI模型的开发与扩散。现阶段,建议优先提升AI系统最终途的可追溯能,防被于核化导等规模杀伤性武器制造等危场景。269从远来看,为前置险识别和治理,建议推动建KYC机制,要求先进AI模型开发者在申请量计算资源或执重训练任务时进注册备案,明确模型开发、使者与使的。可借鉴融业的KYC合规经验,以防具备物攻击潜的模型在开发早期即落恶意为者之。270 向关键物具的途追踪机制。建议建针对关键物具与模型的全过程途追踪机制,重点包括蛋质设计模型、DNA/RNA合成设备等可能于病毒研发的敏感度具。在部署此类模型之前,建议明确途边界并设定合规使槛。配套机制还可包括:持续追踪合成的DNA/RNA序列并进系统筛查,以识别潜在的可疑病毒构建意图;监测为与查询模式,识别异常操作或异常兴趣;并励举报可疑为,构建多元协作的险监测络。271 向的为监测与早期预警机制。为防范蓄意物攻击,建议开发识别“警告信号”的技术。例如,次失败的病毒制造尝试可能仅造成范围感染,甚波及肇事者本。若能通过新型病毒识别技术及时发现,可有效阻其演变为更规模的公共安全事件。272建模型与现实世界之间的早期预警机制,将成为未来AI安全治理的重要向之。6.1.3 治理机制建设 1)构建治理体系与多协作机制 建系统性机制监测AI在物领域的能演化。适应前沿技术交叉特点,系统性监测智能在合成物学、蛋质设计、分建模等领域的能演化与险表现。国内,建议以已有的科技伦理治理体系为基础,依托科技部、国家疾控局、国家计算机络应急技术处理协调中等机构,开展智能与物技术融合险的前瞻识别与动态评估,并推动形成统的监管政策与预措施,提升国家险响应能。设跨机构联动机制,将智能纳物安全与两研究治理框架。现有物安全和科技伦理相关政策仍以传统实验室安全与两研究为主,尚未充分纳智能带来的挑战。建272 同注75(CAIS,2024)271 同注75(CAIS,2024)270 同注65(FLI,2024)269 同注257(安标委,2024)268 同注75(CAIS,2024)267 同注201(Bloomfield et al.,2024)60 6 前瞻性险缓解和治理路径 议推动在国家物安全委员会或科技伦理治理协调机制下设“智能-物融合险作组”,联合智能、命科学、物安全等领域专家,系统研究AI辅助下的险物研究为,并更新相关研究指南与评估标准。可借鉴美国NIST智能险管理框架的经验,结合中国正在制定的智能安全标准体系,推动建覆盖模型能评估、使边界识别与安全审查的政策机制。推动国际合作,构建统规则与避免监管套利。鉴于智能x物能险具有显著的跨区域性,任何单国家的监管都法独应对。建议积极参与并推动多边合作机制建设,例如建统的模型发布前险评估与能识别标准;借鉴禁物武器公约等既有框架,构建模型险治理的国际共识;与其他国家共享险模型评估具、案例与测试标准,避免监管碎化与套利空间;励设“跨国早期预警机制”与“责任共享数据库”,加强信息互通与互信;对未来可能引发重公共卫或态影响的模型能,倡导以协商致的式施加全球适的访问限制。273 2)建险研究发布管控与滥责任认定机制 建合理的险-收益评估机制,控制险研究结果的公开。对病毒功能获得性研究等潜在险研究,需建与科研伦理相结合的险-收益评估制度,在充分论证其科研价值的同时,严格评估潜在公共安全影响,并据此决定是否公开研究成果。评估中应统筹考虑未来物合成能的发展趋势。例如,若预判未来合成设备将幅降低病毒构建槛,则当前公开病毒基因组信息可能构成不可接受的险。274相关制度建设应与科学技术进步法关于“科研活动应当遵守伦理准则”的要求相衔接,推动形成科研主与国家安全、公共利益相统的管理机制。健全AI模型滥场景下的法律责任认定机制。在AI模型被于物攻击等恶意情形下,现法律尚未明确开发者是否应承担相应责任。这不确定性可能削弱开发者在系统设计阶段主动防范滥的动机。考虑到先进AI模型可能的不透明性和不可预能,应推动建严格的法律责任追究机制,特别是在系统部署于敏感性或关键场景时。当AI模型助或造成实际伤害时,开发者若被纳责任范围,将有助于强化其对滥险的重视,并在模型设计、安全评估与访问控制等采取更有的预防措施。275 3)定期评估基础模型的物能与演化趋势 建议建制度化机制,对通型基础模型及专型AI赋能的物具在物技术领域的潜在能进定期评估,重点关注其在物威胁命周期各环节(如病原体设计、优化、合成、275 同注65(FLI,2024)274 同注75(CAIS,2024)273 同注201(Bloomfield et al.,2024)61 智能 x 命科学的负责任创新 传播等)中的适性和能演进趋势。评估应具有前瞻性,能够识别险能的发展临界点,并为审查机制、发布管控和国际协作提供科学依据与政策持。鉴于智能与物技术交叉领域的科学进展具有度不确定性,难以预测具体险的出现时间和条件,尤其应持续监测若险能领域,如:基础模型为先进物应提供有效实验指导的能;云实验室和实验室动化在降低物技术实验专业知识需求的进展;宿主遗传易感性对传染病研究的两进展;病毒病原体精准程的两进展等。276 应特别强调“物险全链条分析”277,278视,系统考察基础模型与物具如何在有害物制剂开发与部署的多个复杂环节中协同作,包括材料获取、专业技能、实验室设施等关键要素,仅聚焦模型本的能边界,同时避免“切”的监管策略妨碍有益创新。这种跨域、系统性的分析对于识别新型险与隐蔽路径具有重要意义。4)推动制度落地与治理能迭代 在将AI引物安全治理体系过程中,应推动相关险嵌现有物安全法规、技术标准与险管理具中,如在模型发布前设定最低限度的审计与访问控制要求,参考NIST等框架强化测试与系统韧性。279 同时,应通过常设的跨界协作平台,持续推动治理能的升级,重点关注当前尚未充分解决的关键议题,如险识别边界、评估法的理论基础与实证效度,以及跨国协调机制的有效性等。280为实现有效治理,还需制定有针对性的政策具与险缓解措施,包括构建更加精准的威胁模型,以识别AI在提升现实世界物理伤害险中的具体机制,并发展具有良好态效度和控制变量设计的实证评估法,避免依赖理论基础薄弱或法论不严谨的评估程序。281 6.2 加强数字-物理界的物安全 物学中的数字-物理界(Digital-Physical Interface)是指将智能模型成的数字设计转化成物现实的关键环节。这转化过程本为监管提供了重要切点除了为AI模型 本建技术护栏外,还需重点管控数字设计向物制剂的实现路径。例如,合成DNA提供商已通过主动筛查病原体或毒素序列来防范潜在滥,此类业律为可通过政策激励或法进步强化。随着智能成的新序列激增,筛查技术也需同步迭代,从传统的序列相似性对转向基于功能险的智能预测。此外,合同研究组织、学术平台、云实验室及动化设备281 同注129(Peppin,2025)280 同注1(NTI,2023)279 同注65(FLI,2024)278 同注92(CLTR,2023)277 同注129(Peppin,2025)276 同注25(CNAS,2024)62 6 前瞻性险缓解和治理路径 商等命科学服务参与者,均可通过客资质审查、实验的验证等式,共同构建多层次的物安全防护络。1)强化DNA序列筛查机制与具 DNA合成服务商是物设计落地的前沿环节,当前已有不少企业愿对订单序列进病原体或毒素匹配筛查,并核验客份。但全球尚统的强制性要求,筛查覆盖范围、技术能及执度不,难以有效应对智能所带来的序列设计能跃升。,现有筛查法主要基于与已知险序列的相似性对,难以识别那些通过AI成、在功能上与毒素相似但在序列上度变异的新型威胁。因此,需要投专资源研发新代筛查技术,如可预测潜在功能险的AI模型,以及对应的序列功能数据库。这类具的共享与更新,也需审慎审视出管制等法律框架可能带来的障碍。282 另,可探索通过“可验证的设计来源”机制提升安全性,例如要求DNA合成订单提供其设计输的可认证来源,以判断其是否为AI模型成并评估其可信度。283这些机制的有效运,还需配套开发统、可扩展的标准化筛查具(如SecureDNA),并在全球范围内推动其采。284 2)扩筛查范围更多命科学服务提供商 除了DNA合成公司,命科学领域中还存在量间接参与AI物设计落地的服务平台,如合同研究组织、学术核设施、云实验室、动化设备提供商等。当前,这些机构多未建系统性的客审查机制,存在被恶意为者“外包”实验环节、误服务资源的潜在险。285 因此,建议逐步将客资质审查的要求从DNA合成环节扩展更泛的命科学服务供应链。286具体措施包括制定“了解你的客”(KYC)与“了解你的订单”(KYO)标准,287推动学术与业核平台建客验证机制,优先识别与险材料或设备相关的关键供应商,并完善科研材料流转过程中的追溯机制,防合法采购被转于法途。同时,可借鉴融等领域的实践经验,构建个跨机构共享的客认证平台,为科研员与机构提供统份凭证,减少重复审核的成本。3)加强云实验室等新型平台的物安全监管 云实验室作为近年兴起的动化科研基础设施,可远程调度设备开展实验,为物设计提供了前所未有的便捷。然,其“虚拟化 动化”的特性也使得监管更加复杂。因此,应推287 同注65(FLI,2024)286 同注1(NTI,2023)285 同注66(Soice et al,2023)284 同注65(FLI,2024)283 同注1(NTI,2023)282 同注1(NTI,2023)63 智能 x 命科学的负责任创新 动出台针对云实验室和其他动化实验平台的物安全筛查机制288和操作指引289,明确其在筛查订单、审查客的、记录实验过程等的责任。同时,也应建相关认证机制,励平台主动采取险防控措施,并为合规为提供政策持或资激励。4)推动合成物基础设备的数字安全机制建设 励设备制造商在桌合成装置、实验动化平台等合成物基础设备中内置数字安全机制,包括验证、远程访问控制、操作志记录与异常为监测等功能,防范AI滥或远程操控。建相应标准和指南,确保AI控制物理设备的接具备权限管理、数据加密与操作审计功能,避免AI动化执险实验流程。推动对AI驱动的实验动化系统进全流程的安全测试与险评估,涵盖AI动成实验流程、试剂调配、样品处理等关键环节。加强对具备AI远程操控能的合成设备跨国出监管,设跨境设备出审查机制,防此类设备流险途或不受监管的市场。励国际合作,推动数字-物理接相关安全标准的制定与互认机制,以降低跨境滥险。6.3 推进流病防范 尽管更有效的护栏措施有望显著降低智能与命科学交叉所带来的物安全险,但这些技术段难以完全消除所有潜在威胁。因此,建设具备度韧性的公共卫体系,以及强化传染病的预防、监测和应对能,仍是保障社会安全的关键柱。值得注意的是,这些传统能本也可以通过智能的赋能获得显著提升。1)加强传统物防御体系韧性 新冠疫情的全球流充分暴露了国际社会在物安全防控体系的严重不。尽管疫情之后,国际社会采取了系列举措试图加强全球物防御体系,但整体进展仍较为有限,治理碎化、资源投不和跨国协调机制缺失等问题依然突出。在此背景下,随着智能和物技术的加速发展,确保拥有预防、发现和应对各类后果物事件的强能关重要。为此,建议加对预警与检测、响应能、互操作性和协调性、国家个防护装备及其他关键基础设施储备、供应链韧性、医疗应对机制,以及问责与执法体系的系统性投,以有效防范事故和故意滥为。同时,可探索建物安全领域的危机管控机制,通过危机模拟等式开展情景演练,对潜在的物安全事件进分级,评估不同等级的险特征和传播后果,并据此制定相应的分级响应预案,提升整体险预防与应急能。还应持各国卫与科研机289 同注126(FAS,2023)288 同注25(CNAS,2024)64 6 前瞻性险缓解和治理路径 构建设AI辅助的流预警与应对系统,推动数据共享、模型共享与联合响应机制,切实增强国际社会对突发物险的协同应对能。2)在AI赋能的攻防格局中赢得防御先机 随着智能与物技术的泛应,流病防范正呈现出“攻防格局”。防御必须拥有领先于潜在滥者的资源与具,才能有效预防和应对后果物威胁。然,这类AI模型在公共卫中的应也需格外审慎,因其旦失误,可能引发严重的健康险,动摇公众信任,削弱持续投。因此,必须充分认识其局限性,强化类监督机制,确保技术安全可控。290 值得注意的是,构建这种防御优势所需的资源和努包括基础设施、专业才与公共卫系统投资往往远超制造与释放危险物制剂的成本。在各国既有投的基础上,建议进步进期规划,推动技术赋能与险治理协同发展,构建更具韧性的防御体系。3)推动AI在公共卫中安全应 在推动AI在病原体监测、传播路径建模、疫苗开发等应时,建议建审慎的机制,确保AI模型具备科学的误报或漏报评估标准,防误导公共卫响应。AI驱动的病原体识别与增强模型应被纳险治理范畴,设相应的备案、评估和使边界审查机制,以防其被于设计具备更强传播性或致病性的序列。励利AI进致病性疫情模拟、疫苗候选优化与抗原预测,但应明确使的、数据来源、模型透明度及验证机制,避免引发信息误或设计敏感序列的险。推动这些AI具在物安全框架下的负责任使,是在提升物防御能的同时防范技术误的关键路径。291 6.4 强化物科研的安全伦理建设 为从源头降低智能与命科学交叉带来的物安全险,有必要在物科研员和相关技术开发者中系统性培养安全与伦理意识。建议从教育培训阶段做起,强化对物险识别、负责任科研规范以及AI滥险的理解,确保科研员在设计和使AI具、处理敏感物数据时具备必要的险判断与防范能。特别是在AI使得成新型物设计更为便捷的背景下,强化伦理意识和险思维对于避免意中推动险研究尤为关键。要通过制度规范、教育培训、科研审查与出版把关等多元机制,构建对AI赋能下物科研活动的系统性治理能。291 同注1(NTI,2023)290 同注1(NTI,2023)65 智能 x 命科学的负责任创新 1)构建制度化的安全治理与为规范体系 建议将AI辅助的物科研活动纳现有伦理审查体系,并据此更新审查标准。建议推动建覆盖制度设计、险评估与为规范的综合治理体系,明确AI在命科学研究中的与责任边界。先,建议制定并动态更新适于物研究的相应法规和最佳实践标准,明确安全与伦理底线,构建与AI和合成物学发展相适应的制度框架。292这包括将险-收益评估法系统性纳项审查和监管流程,作为判断研究正当性与社会可接受性的基础具。293,294 同时,推动建透明的安全评估机制,例如通过引红队测试等式,检验DNA合成平台对危险序列的拦截能,或验证AI成物体设计的实验可性等。295此外,建议将安全与伦理规范落细落实研究活动的各个关键环节。通过制定覆盖实验操作、AI具使、敏感数据处理及研究成果发布等的统为准则,强化科研员在常实践中的险意识与责任担当。这准则体系不仅有助于提升研究为的致性和可操作性,也为机构内部的教育培训、险管控与问责机制提供了明确依据。296 2)提科研申报与成果发表的险敏感度 为防范险研究成果未经充分评估即进公开领域,建议从科研申报与成果发表环节强化AI成内容的审查机制。科研员在项申请及论投稿中,建议如实披露AI在研究中的作以及所涉及的潜在物安全险。对于涉及病原体增强、免疫逃逸等敏感内容,建议设更的审查槛,纳专家评估与险控制机制。同时,励学术期刊建针对AI成科研内容的责任声明制度与原始数据核查机制,避免未经评估的险合成序列或实验建议被公开发表,形成科研界内控机制与出版环节协同的安全防线。3)强化教育培训与安全化建设 应将物安全与伦理教育系统性地融科研全过程。从本科及研究教育起步,将险意识与伦理素养的培养贯穿科研资助申请、学术出版等环节,推动科研员全理解并承担其在险管理中的与责任。297实验室和研究机构也应积极倡导以安全为核的研究价值观,培育负责任的科研化氛围,明确科研员在险管理中的职责和。298为更好地持科研员应对具体险情境,还应设专机构,提供可操作的安全建议与技术指导,帮助其在处理敏感数据、设计实验案等关键节点作出稳妥判断。299 299 同注75(CAIS,2024)298 同注294(Resnik,2024)297 同注75(CAIS,2024)296 同注294(Resnik,2024)295 同注75(CAIS,2024)294 David Resnik,“Biosafety,biosecurity,and bioethics,”2024-07-30,https:/ 293 同注75(CAIS,2024)292 同注75(CAIS,2024)66 6 前瞻性险缓解和治理路径 4)融物伦理视深化安全实践 从更深层次来看,物伦理视可以为安全实践注持续的反思机制。例如,在险研究中,应格外重视知情与愿原则,讨论科研员在接受相关任务时可能临的伦理困境,特别是项外包监管薄弱地区的情形下,应明确各责任边界。此外,科学开放性虽然有助于知识共享,但也可能与隐私保护、知识产权、专有数据安全等价值产张。如何在保障科研透明度与防范滥之间取得平衡,亟需持续探索和制度回应。与此同时,建议推动建更开放、透明的险沟通机制,通过系统化的信息披露与公众参与,增强社会对物研究治理的信任与持。300 300 同注294(Resnik,2024)67 智能 x 命科学的负责任创新 7 动推动建议 要成功降低智能具滥可能引发的物险,需要构建多层次的防御体系,这要求众多参与以前所未有的协调与合作式共同实施。NTIbio智能与命科学的融合报告301 成功降低智能和物技术相结合可能带来的险,需要各动实施多层级防御,以及泛的协调合作。本章概述了建议各动在第6章中所述的险缓解和治理的职责。7.1 策略路径与动职责矩阵 以矩阵形式明确各类缓解和治理路径与相关动的职责,为后续机制设计提供基础。策略路径 动职责 代表主要责任 代表次要责任 政府 监管机构 智能 研发机构 命科学 产学研机构 安全和治理 研究机构 国际组织与平台 为智能-物能建护栏 技术防护措施 建危险知识分类与访问机制 训练数据筛查与遗忘学习技术 强化模型护栏与访问控制策略 加强基础设施与系统防护能 险监测预警 开展系统性的能和险双重评估 推进途监督与为追踪机制建设 治理机制建设 构建治理体系与多协作机制 301“Successfully reducing biological risks that may arise from the misuse of AI tools will require a layered defense implemented by a wide range of actors,often working in unprecedented coordination and collaboration.”同注1(NTI,2023)68 7 动推动建议 策略路径 动职责 代表主要责任 代表次要责任 政府 监管机构 智能 研发机构 命科学 产学研机构 安全和治理 研究机构 国际组织与平台 建险研究发布管控与滥责任认定机制 定期评估AI的物能与演化趋势 推动制度落地与治理能迭代 加强数字-物理界的物安全 强化DNA序列筛查机制与具 扩筛查范围更多命科学服务提供商 加强云实验室等新型平台的物安全监管 推动合成物基础设备的数字安全机制建设 推进流病防范 加强传统物防御体系韧性 在AI赋能的攻防格局中赢得防御先机 推动AI在公共卫中安全应 强化物科研的安全伦理建设 构建制度化的安全治理与为规范体系 提科研申报与成果发表的险敏感度 强化教育培训与安全化建设 融物伦理视深化安全实践 表4:险缓解和治理路径 动职责矩阵 69 智能 x 命科学的负责任创新 7.2 各和职责简要总结 为便于理解和协同,对不同类型主体在治理体系中的与职责进简要梳理,突出其在AI物险治理体系中的核职责:政府监管机构:在政策引导、标准制定和合规检查具有主导权。重点包括推动监管机制现代化、加强多部协调、构建物安全监测体系等。智能研发机构:负责模型能评估、安全机制嵌、输出限制与滥防护,需承担“前置责任”,防AI产品在设计阶段埋下物险隐患。命科学产学研机构:作为潜在的技术使者和验证者,承担技术使边界内的伦理与合规义务,需提敏感信息管理和实验险识别能。安全与治理研究机构:在险识别、信息整合、国际对研究与政策建议制定中扮演智库,协助制度更新和治理架构演化。国际组织及平台:具备协调国际标准、共享险情报和共建早期预警机制的能,在全球层发挥补充与联动作。70

    发布时间2025-08-08 81页 推荐指数推荐指数推荐指数推荐指数推荐指数5星级
  • 上海人工智能实验室&安远AI:2025前沿人工智能风险管理框架报告(52页).pdf

    前沿智能险管理框架(1.0版)执摘要 我们对可信AGI的发展愿景 当前智能(AI)技术正以前所未有的速度取得突破性进展,各类系统在众多领域已达到或超越类平。这些突破性进展为我们解决类临的重挑战提供了历史机遇从推动科学发现、提升医疗质量和的健康福祉,到促进经济产的提升。但与此同时,快速发展的技术也带来了前所未有的险。随着先进智能的研发与部署速度超越了关键安全措施的发展速度,建完善的险管理机制已成为全球科技发展的当务之急。作为我国智能领域的新型科研机构,上海智能实验室致于打造“突破型、引领型、平台型”体化的型综合性研究基地,推动智能技术的安全有益发展。为积极应对技术发展带来的挑战,推动全球在智能安全领域的良性竞争,实验室提出了AI-45平衡律1,作为实现可信AGI的发展路线图。前沿智能险管理框架 上海智能实验室联合安远AI2,正式发布智能前沿险管理框架(1.0版)(以下简称“框架”),旨在为通型智能(General-Purpose AI)模型研发者提供全的险管理指导针,主动识别、评估、缓解和治理系列对公共安全和国家安全构成威胁的严重智能险,保障个体与社会的安全。本框架旨在为通型智能模型研发者管理其通型智能模型可能带来的严重险提供指导。框架充分借鉴了安全攸关型业的险管理标准与最佳实践,涵盖险管理的六核流程:险识别、险阈值、险分析、险评价、险缓解及险治理。1.险识别:本章节聚焦通型智能模型可能引发的严重险,明确四核险类型:滥险、失控险、意外险及系统性险。我们计划通过持续更新险分类体系,动态应对未知与新兴险。2.险阈值:本章节明确了系列不可接受的险结果(红线)以及触发更级别安全保障措施的早期预警指标(线)。我们针对可能威胁公共安全和国家安全的个关键领域设定阈值,其中包括:络攻击、物威胁、规模说服和有害操控,以及失控险。2 安远AI(Concordia AI)是家AI安全与治理领域第三研究和咨询机构,同时是前该领域中国唯的社会企业。1 Yang,C.et al.,Towards AI-45 Law:A Roadmap to Trustworthy AGI,arXiv preprint,2024,https:/arxiv.org/abs/?4?.?4?86 前沿智能险管理框架(1.0版)3.险分析:本章节建议在智能全命周期中贯穿实施动态险分析,以判断模型是否越过线即达到触发更级别安全措施的早期预警指标。我们建议AI研发者在研发前和部署前进系统性评估,以便为关键的部署决策提供参考。同步应建部署后持续监测机制,为新代系统研发提供安全指引。与本框架同时发布的还有份针对系列通型智能模型的险评测技术报告。4.险评价:建三级险分级体系:绿区域(基于常规措施可安全部署)、区域(需强化安全防护与授权)、红区域(需特殊措施,如限制部署或限制研发)。我们建议对缓解措施实施后的剩余险进迭代评估,进步采取降低险的措施直险达到可接受平。5.险缓解:构建全命周期纵深防御险缓解策略,包含三种险缓解措施:安全训练措施、部署缓解措施及模型安保措施,并根据模型处于绿区域、区域或红区域设定不同的保障级别。我们呼吁全球持续加AI安全基础研究投,当前技术段尚难以充分保障先进AI系统的安全性。6.险治理:提出监督和调整整个险管理流程的治理路径。建四维治理体系:内部治理机制、透明度与社会监督、应急管控机制、政策定期更新和反馈机制,并根据模型处于绿区域、区域或红区域设定不同的保障级别。AI安全作为全球公共产品 上海智能实验室坚信AI安全是项全球公共产品3。我们率先提出这份前沿AI险管理框架,汇集了现阶段对重AI险的认知与应对思路。我们倡导前沿AI研发机构、政策制定者及相关采兼容的险管理框架。AI技术的跃迁新异,唯有尽快在当下采取集体动,才能让变性AI真正造福类,并避免灾难性后果。我们诚邀各就框架落地开展合作,并承诺以公开透明的式分享实践成果。只有当关键组织同步落实同等强度的防护措施,社会层的险管控才能效。对险与机遇并存的全新局,唯有以协同共治、系统施策的思维,能凝聚合、破局前。3 上海智能实验室治理研究中、清华学产业发展与环境治理研究中、上海交通学国际与公共事务学院等,智能安全作为全球公共产品研究报告,2024,https:/ AI Safety as a Global Public Good:Implications,Challenges,and Research Priorities),2025 https:/oms- 前沿智能险管理框架(1.0版)贡献与致谢 科学总监:周伯 主要撰稿:谢旻希、亮*、徐甲*、段雅*、邵婧*贡献者:张杰、刘东瑞、王伟冰、程远、俞怡、郭嘉轩、陆超超 感谢安远AI伙伴刘顺昌等对本报告内容的贡献。表第作者*表等同贡献 版本与更新计划 前沿智能险管理框架旨在成为份持续迭代的动态档。我们将定期审阅并评估本框架的内容及其实性,以适时进更新。关于前沿智能险管理框架的任何意或建议,均可随时通过电邮件发送主要撰稿,我们将每半年进次集中审阅和整合。如何引本报告:上海智能实验室,安远AI,智能前沿险管理框架(1.0版),2025 前沿智能险管理框架(1.0版)录 执摘要.框架总览.1 智能险管理的六个阶段.1 部署环境、威胁源和使能能三位体.2 1.险识别.3 1.1 险识别范围.3 1.2 险分类框架.4 1.3 滥险.5 1.3.1 络攻击险.5 1.3.2 物化学险.5 1.3.3 伤害险.6 1.3.4 规模说服与有害操控险.6 1.4 失控险.7 1.5 意外险.7 1.6 系统性险.8 2.险阈值.10 2.1 定义AI发展的“线”和“红线”.10 2.2 具体红线建议.12 2.2.1 络攻击险.13 2.2.2 物安全险.15 2.2.3 规模说服与有害操控险.17 2.2.4 失控险.18 3.险分析.20 3.1 规划与研发阶段的险分析技术.20 3.2 部署前的险分析技术.21 3.3 部署后的险监测技术.22 4.险评价.23 4.1 缓解前的险处置选项.23 前沿智能险管理框架(1.0版)4.2 缓解后剩余险评估与部署决策.24 4.3 部署决策的外部沟通.25 5.险缓解.26 5.1 险缓解措施概述.26 5.2 安全预训练和后训练措施.27 5.3 模型部署缓解措施.28 5.3.1 针对模型滥的缓解措施.28 5.3.2 针对智能体安全的缓解措施.28 5.4 模型安保措施.29 5.4.1 针对模型泄漏险.29 5.4.2 针对模型失控险.30 5.5 全命周期的“纵深防御”策略.31 6.险治理.32 6.1 险治理措施概述.32 6.2 内部治理机制.32 6.3 透明度和社会监督机制.34 6.4 应急管控机制.34 6.5 定期更新政策.35 附录:术语定义.36 附录:具体基准测试建议.38 络攻击.38 物威胁.40 化学威胁.42 附录三:模型能、倾向和部署特征.44 关键能(Capabilities).44 关键倾向(Propensities).45 关键部署特征(Deployment Characteristics).46 前沿智能险管理框架(1.0版)框架总览 智能险管理的六个阶段 本框架将既有的险管理原则应于通型智能(General-Purpose AI)研发,并与包括 ISO 31000:2018、ISO/IEC 23894:2023 和 GB/T 24353:2022 在内的标准保持致4。本框架构建了六个相互关联的阶段,形成了贯穿智能全命周期不断演进的持续险管理循环,如图1所:险识别(Risk Identification):系统性识别和分类潜在严重险的过程,重点聚焦前沿AI的先进能所引发的险。随着AI能的进步和新威胁场景的出现,识别过程不断将新兴险反馈到循环中。险阈值(Risk Thresholds):定义不可接受结果(“红线”)和升级安全保障措施的早期预警指标(“线”)的过程。这些阈值基于从险分析、评价结果和缓解有效性中汲取的经验不断完善,形成个持续校准阈值的反馈机制。险分析(Risk Analysis):通过定量和定性评估法研究特定AI险场景和分析险的过程。基于已识别的险和既定阈值,这阶段对整个AI研发命周期进综合评估,包括研发前、部署前和部署后分析。分析结果直接为后续的险评价阶段提供信息,同时也提供可能揭需要识别的新险的解。险评价(Risk Evaluation):通过与既定阈值对判定险等级,以指导险缓解和模型部署决策的过程。这阶段采三区分类体系(绿区域、区域、红区域)对险进分类并确定适当的响应。当模型险突破可接受阈值时则触发缓解阶段,模型险处于可接受的区域使则可在治理措施下推进部署。险缓解(Risk Mitigation):通过全的应对措施主动减少和响应不同类型安全险的过程。这阶段实施涵盖整个AI命周期的纵深防御法,缓解策略根据险区域分类有所不同。缓解措施实施后,过程回到险识别环节以评估剩余险并确定是否需要额外措施,从形成个险降低和验证的迭代循环。险治理(Risk Governance):将险管理整合到更泛的组织和社会治理结构中的过程。这阶段涵盖整个险管理循环,提供监督、透明度和问责机制。治理过程确保从每个阶段汲取的经验教训系统性地纳框架改进、政策更新和组织学习中,同时促进内部利益相关者和外部监督机构之间的协调。4 术语、概念、流程主要参考:GB/T 24353:2022险管理指南、GB/T 23694:2013险管理术语、ISO/IEC 23894:2023智能险管理指南、ISO 31000:2018险管理指南、ISO/IEC 42001:2023智能管理体系、国家络安全标准化技术委员会智能安全标准体系1.0版、国际智能安全报告3.1章险管理。1 前沿智能险管理框架(1.0版)图1:智能险管理的六个阶段 部署环境、威胁源和使能能三位体 本框架通过三个相互关联的分析维度来评估险,这些维度共同于综合评估潜在危害的发可能性及其严重程度:部署环境(Deployment Environment;E):指AI模型部署运的具体场景和约束条件。例如部署领域、操作参数、监管要求、群体特征、依赖的基础设施以及现有的监督机制等。即使是相同的智能能,在不同部署环境下可能呈现出显著差异的险特征。威胁源(Threat Source;T):指可能通过与AI模型交互引发有害后果的源头或主体。例如外部攻击者(恶意、敌对势)、内部缺陷(模型标偏离、训练数据偏差)、操作失误(为错误、系统集成故障),以及AI与复杂环境互动时产的涌现为。使能能(Enabling Capability;C):指AI模型的核能,尤其是那些在模型部署时没有施加额外安全措施前提下,能导致险场景的特定能。这些能既包含设计时的预期能(如科学推理、代码成、任务规划),也包括因模型规模扩或在训练过程中涌现出的新能,尤其是那些决定有害结果能否真正发的关键能。这种三维法要求评估的不仅仅是AI系统能做什么(C),还包括它在哪运作(E)以及可能出现哪些威胁(T),从在每个维度上实现有针对性的预措施,例如针对环境的部署控制(E)、针对威胁源的访问限制(T),以及针对能的危险能移除(C)。2 前沿智能险管理框架(1.0版)1.险识别 1.1 险识别范围 本框架以国际智能安全报告(2025年1)5和智能安全治理框架1.0版6为基础,重点关注通型智能因具备影响能可能引发的灾难性险。这类险因其快速升级的可能性、对社会造成严重危害的潜以及前所未有的影响范围,可能对公众健康、国家安全和社会稳定构成重威胁。与传统险管理框架不同,本框架特别关注尚未实际发或未被充分认知的新型智能险应对。在险识别过程中,我们着重考虑前沿通型智能险区别于传统技术危害的以下特征,并优先识别具备以下个或多个特征的通型智能模型相关险:通型智能特有的险属性:通型智能可能通过放险的严重性(提升危害规模和损害成本)和发可能性(扩攻击和降低滥槛),从根本上改变了险现状,并可能引全新的险类型。灾难性后果的不对称效应:潜在后果可能对社会、经济或环境造成严重损害,少数威胁主体或单事件就可能触发超规模灾难。快速爆发且不可逆转:此类险可能快速显现并扩散,需要即时协调应急响应,否则可能极难甚法逆转后果,修复段也极其有限。复合级联效应:多重关联险可能同时发或引发次与衍危害,形成系统性脆弱环节,导致整体影响持续放。本框架将以下类型的通型智能纳险识别范围:语模型:具备语理解、本成、级推理和跨模态处理能的模型,例如GPT-4o、Llama-4、Qwen3、InternLM,以及专注推理的o?和DeepSeek-R?等。主要险包括但不限于成有害内容、复杂欺骗、说服性操控,以及超出设计预期的涌现能。AI智能体:基于通型智能模型构建的主系统,具备具调、API交互和主执任务的能,且乎需预,如Claude计算机使功能、持函数调的GPT-4、6 National Technical Committee 260 on Cybersecurity of SAC,AI Safety Governance Framework,2024,https:/www.tc?6? 5 Bengio,Y.et al.International AI Safety Report,2025,https:/arxiv.org/abs/?5?.?78?5 3 前沿智能险管理框架(1.0版)AutoGPT架构,以及集成代码执环境的模型。主要险包括但不限于具失控使、跨交互标持续性,以及通过外部接执预期或有害操作7。物基础模型:基于规模物数据训练的模型,可分析、预测和成基因组、蛋质组及分层的物序列与结构,如Evo 2、ESM、ChemBERTa等8。主要险源于危险物信息的成能,包括病原体序列设计、毒素合成路径等有害物制剂相关信息9。具智能模型:向物理世界交互的模型,具备机器控制、传感器处理以及执器指令能,如RT-?、RT-?、PaLM-E,以及基于物理操作数据集训练的机器基础模型10。主要险涉及物理决策、空间推理可能导致的有害物理为,以及超出安全参数的主能发展11。1.2 险分类框架 本框架识别了四类险领域:滥险(Misuse Risks)、失控险(Loss of Control Risks)、意外险(Accident Risks)和系统性险(Systemic Risks),与国际智能安全报告所列险领域兼容。11 Zhang,H.et al.,BadRobot:Jailbreaking Embodied LLMs in the Physical World.arXiv preprint,2024,http:/arxiv.org/abs/?4?7.?4?10 Hu,Y.et al.,Toward General-Purpose Robots via Foundation Models:A Survey and Meta-Analysis,arXiv preprint,2023,http:/arxiv.org/abs/?3?.?878?9 Wang,D.et al.,Without Safeguards,AI-Biology Integration Risks Accelerating Future Pandemics,2025,https:/ 8 Liu,X.et al.,Biomedical Foundation Model:A Survey,arXiv preprint,2025,http:/arxiv.org/abs/?5?3.?4 7 Chen,A.,et al.,A Survey on the Safety and Security Threats of Computer-Using Agents:JARVIS or Ultron?arXiv preprint,2025,http:/arxiv.org/abs/?5?5.?9?4 4 险领域 威胁源 描述 滥险 外部恶意为者 指恶意为者故意利AI模型能对个、组织或社会造成伤害产的险。失控险 模型破坏控制的倾向 指个或多个通型智能系统脱离类控制,且类没有明确的重新获得控制路径的险。这包括被动失控(类监督的逐渐减少)和主动失控(AI系统主动破坏类控制)。意外险 类操作失误或模型误判 由于部署在安全攸关基础设施中的AI系统出现操作故障、模型误判或为操作不当产的险,其中单点故障可能引发级联灾难性后果。系统性险 技术-制度结构性错配 通型智能的泛部署所产的险,超出了单个模型能直接构成的险,源于AI技术与现有社会、经济和制度框架之间的不匹配。前沿智能险管理框架(1.0版)本框架重点关注那些可以在模型层进预和管理的险,相关措施主要供AI研发者参考。于系统性险,虽然本框架也将其纳整体考量范围,但相关治理需要业和社会的协同合作,已超出单个模型研发者的职责范围。1.3 滥险 滥险源于恶意攻击者有意利AI模型的能,对个、组织或社会造成伤害。这些威胁通过通型智能技术放传统攻击段,催出过去在技术或经济层难以实现的新型恶意活动形式。在滥险领域中,我们识别出多个影响滥险种类,包括络攻击险、物化学险、伤害险以及规模说服与有害操控险。1.3.1 络攻击险 AI赋能的络攻击正在从根本上改变络空间安全的威胁格局,极提升了攻击的规模效应、复杂程度和可操作性。与传统络威胁不同,AI不仅能让现有攻击段实现动化,更能催出可实时我迭代演进的新型攻击模式。AI可以动化和增强络攻击,包括漏洞发现和利、密码破解、恶意代码成、复杂的络钓、络扫描和社会程。这降低了攻击者的进槛,同时也增加了防御的复杂性12。这种恶意使可能导致关键基础设施瘫痪、范围数据泄露或重经济损失。1.3.2 物化学险 AI技术的两特性可能被恶意为者利,显著降低国家为体设计、合成、获取和部署化学、物、放射性、核和爆炸物(CBRNE)武器的技术槛,对国家安全、国际防扩散体系及全球安全治理构成严峻挑战13。在物领域,AI可能被于协助设计新型致病性病原体、恶意优化基因编辑具、加速物武器的研发等14。AI系统可能协助设计出同时具备快速传播性、致死率和潜伏期的“超级病毒”的能14 AIxBio Global Forum,Statement on Biosecurity Risks at the Convergence of AI and the Life Sciences,2025,https:/www.nti.org/analysis/articles/statement-on-biosecurity-risks-at-the-convergence-of-ai-and-the-life-sciences/13 He,J.et al.,Control Risk for Potential Misuse of Artificial Intelligence in Science arXiv preprint,2023,http:/arxiv.org/abs/?3?.?663?;Li,T.et al.,SciSafeEval:A Comprehensive Benchmark for Safety Alignment of Large Language Models in Scientific Tasks,arXiv preprint,2024,http:/arxiv.org/abs/?4?.?3769 12 Guo,W.et al.,Frontier AIs Impact on the Cybersecurity Landscape,arXiv preprint,2025,http:/arxiv.org/abs/?5?4.?54?8 5 前沿智能险管理框架(1.0版)。此类威胁可能对全球公共卫和态系统造成严重冲击,可能引发规模物危机、群体性伤亡事件甚全球性流病15。本框架将物威胁作为优先关注对象,因其具有极的单位伤亡效率、度隐蔽性、强传染性,并可能引发社会系统性的崩溃16。在化学武器领域,AI可通过成有毒化合物合成路径、优化投送机制、研发新型杀伤毒剂等式降低研发槛。已有研究证实,AI药物发现系统可在数时内成包括VX神经毒剂类似物在内的数千种有毒分17。同时,我们在附录:具体基准测试建议中提供了针对化学威胁险的初步建议。1.3.3 伤害险 通型智能模型向具系统的深度集成,使恶意为者可通过滥主决策能,在现实物理环境中制造直接危害。其核险在于,具模型具备主动与环境交互能,这种能旦被恶意操控,可能引发系列严重后果18。例如:算法被劫持导致动驾驶系统制造重交通事故,或被侵的业机器引发严重的产安全事件。1.3.4 规模说服与有害操控险 AI系统可能被严重滥,通过成深度伪造内容(如深度伪造视频、仿真虚假新闻)及战略性操控拥有庞群体的数字平台,规模传播或精准投放误导性信息与意识形态,从扭曲公众认知并危害社会稳定。AI可以协助规模商业欺诈,通过度个性化的虚假信息宣传活动操纵舆论,或成虚假信息以诱导消费或不当影响公众判断。先进的AI系统可以利个理特征和为模式,制作令信服的深度伪造视频、合成频和定制宣传。竞争也可能通过操控公共话语获得战略优势,并通过复杂的影响活动加剧地缘政治紧张态势。18 Yin,S.et al.,SafeAgentBench:A Benchmark for Safe Task Planning of Embodied LLM Agents,arXiv preprint,2024,http:/arxiv.org/abs/?4?.?3?78;Lu,X.et al.,IS-Bench:Evaluating Interactive Safety of VLM-Driven Embodied Agents in Daily Household Tasks,arXiv,2025,http:/arxiv.org/abs/?5?6.?64?17 Urbina,F.et al.,Dual Use of Artificial Intelligence-Powered Drug Discovery,Nature Machine Intelligence,2022,https:/pmc.ncbi.nlm.nih.gov/articles/PMC9544?8?/16 王宏,朱姝等中国物安全:战略与对策,2022,https:/ 15 安远AI,天津学物安全战略研究中,智能 x 命科学的负责任创新,2025 6 前沿智能险管理框架(1.0版)1.4 失控险 失控是指未来可能出现的种假设情形,在这种情形中,个或多个通型智能系统开始脱离任何类的控制,且类没有明确的重新获得控制权的途径19。我们将失控分为两种形式:被动失控(即类因动化偏差、AI系统的固有复杂性或竞争压逐渐停对AI系统进实质性的监督);以及主动失控(即AI系统通过隐藏活动为、抵抗关机等式主动破坏类控制)。主动失控情景AI包括但不限于系统逃脱类监督、主获取外部资源、我复制、形成违背类伦理道德的具性标、寻求外部权,并与类争夺控制权。主动失控险因其潜在灾难性后果受到诸多研究关注,本框架也将主要聚焦于此。主动失控险可能源于模型能、模型倾向与部署条件之间的复杂相互作(详附录三)。这些情景可能通过以下式被触发:AI系统可能通过发展破坏控制的能(如主规划、战略欺骗和我修改)以及在特定部署条件下使这些破坏控制的能来规避类监督和控制机制。典型的假设性威胁情景包括但不限于:不受控的主AI研发20:AI系统在类监督或授权的情况下递归式提升能;恶意主复制21:AI系统独获取计算资源,创建副本并在多个平台持久存在;战略欺骗为22:AI系统通过欺骗段规避关机或监管,同时推进与类价值观相冲突的标。对于此类险何时出现、具体诱因及发机制,前仍存在根本性不确定性。这意味着政策制定者需要在险本质和概率度模糊的情况下提前布局,通过技术安全研究和治理能建设进预防性准备,尽管我们法准确预知这些险是否、何时以及以何种式成为现实。1.5 意外险 意外险是指在安全攸关型基础设施中部署通型智能模型时,可能因系统操作故障、模型误判或为操作不当引发链式反应,造成灾难性后果的险。与涉及恶意意图的滥场景不同,意22 Balesni,M.et al.,Towards Evaluations-Based Safety Cases for AI Scheming,arXiv preprint,2024,http:/arxiv.org/abs/?4?.?3336 21 Clymer,J.et al.,The Rogue Replication Threat Model,METR.org,2024,https:/metr.org/blog/?4-?-?-rogue-replication-threat-model 20 Clymer,J.et al.,Bare Minimum Mitigations for Autonomous AI Development,arXiv preprint,2025,http:/arxiv.org/abs/?5?4.?54?6 19 Bengio,Y.et al.International AI Safety Report,2025,https:/arxiv.org/abs/?5?.?78?5 7 前沿智能险管理框架(1.0版)外险源于AI系统或类操作员在复杂、险环境中的固有不可靠性,在这些环境中,类命和社会稳定均依赖于系统的正确运转。通型智能在关键基础设施的应可能形成重险,具体表现为以下单点失效引发的全局性灾难:核能系统领域:应于反应堆监测、控制系统优化或应急响应协调的通性智能系统,可能因传感器数据误读、安全临界状态识别失效或应急决策失误导致严重后果。考虑到核事故可能造成的严重影响,即便是AI在安全攸关功能上的轻微推理偏差,也可能引发堆芯熔毁、放射性泄漏或跨境污染等重灾难。融稳定性领域:在频交易、做市机制或系统性险管理中引通型智能,可能在市场剧烈波动时产不可预的为模式。更值得警惕的是,若多家融机构采趋同的基础模型,可能形成关联性决策与群效应。智能体的规模应还可能产涌现为加剧市场波动23,最终引发全球性融体系连锁动荡,可能造成超过数万亿美元的全球经济损失。关键基础设施控制系统领域:应于电调度、务处理、通信络或交通指挥的AI系统,可能因运数据误判、连锁故障预判不或控制决策失当导致络失稳。此类失效可能引发范围停电、饮污染、通信中断以及千万级赖以存的基础服务系统崩溃。1.6 系统性险 系统性险源于通型智能技术的泛部署,超越了单个模型能本带来的直接险。这类险产于AI技术与现有社会、经济和制度体系之间的结构性错配,所形成的脆弱性法通过针对单个模型的预措施解决,必须依靠业层和全社会的协同应对。通型智能规模融社会基础设施,将形成跨领域的相互关联脆弱性,可能在多个领域同步显现:劳动市场颠覆与经济性失业:通型智能驱动的快速动化可能在知识型作领域引发规模失业,造成的技能断层将远超职业再培训体系的应对速度。与以往技术变不同,AI的泛适性可能同时冲击多个业,导致社会保障体系难以承受系统性经济失衡,尤其冲击那些度依赖易被AI替代岗位的地区。23 Danielsson,J.et al.,On the Use of Artificial Intelligence in Financial Regulations and the Impact on Financial Stability,arXiv preprint,2023,http:/arxiv.org/abs/?3?.?93;Danielsson,J.et al.,Artificial Intelligence and Financial Crises,arXiv preprint,2024,https:/arxiv.org/html/?4?7.?7?48v3 8 前沿智能险管理框架(1.0版)市场垄断与基础设施依赖:过度依赖少数主导型AI服务商可能造成关键领域的单点故障。AI研发领域的市场集中化可能导致:技术故障、络攻击或企业决策失误同时波及医疗系统、融服务、交通络和通信基础设施,进引发跨系统的连锁崩溃。全球AI研发失衡:国家间AI发展能的差异可能加剧地缘政治盾,催新型技术依附关系。缺乏先进AI能的国家可能在关键领域益依赖外国系统,AI领先国家则可能在全球经济与安全体系中获取不成例的主导权,这种态势或将动摇国际协作机制的稳定性。社会公平性与凝聚危机:系统性部署存在偏的AI应可能在前所未有的规模上放社会歧视,先进技术获取的不平等可能加剧阶层分化,催新的社会等级制度,对传统社会秩序构成根本性挑战。需要强调的是,虽然本框架完整列举了系统性险,但解决这些挑战必须依靠多协同的系统性案,包括公共政策改、国际协作机制和综合性监管体系。单个AI研发者应当意识到可能带来的系统性影响,但仅凭模型层的技术措施法独化解这些险。9 前沿智能险管理框架(1.0版)2.险阈值 AI研发者必须明确可接受的险平,综合考虑潜在危害发的可能性和严重程度。前由于尚不存在关于“可接受险”的全球统标准,研发者需设定这些阈值。然考虑到此类险将对社会产全球性影响,期来看应努推动国际共识的形成,以建相关阈值体系,确保实现公平且负责任的险管理。2.1 定义AI发展的“线”和“红线”该框架通过定义“红线”(不可逾越的禁区)和“线”(潜在险的早期预警指标)来构建AI安全边界24。其核在于识别不可接受的后果(红线)及可能导致这些后果的具体威胁场景。这法关键围绕合理的威胁实现路径,即通过三个要素的特定组合,描述威胁可能实现的式:部署环境(Deployment Environment,如AI具有互联访问权限)、威胁源(Threat Source,如络罪犯等恶意为者)、使能能(Enabling Capability,如AI模型具备的级络攻防知识)。这种E-T-C框架确保威胁路径建在现实且相互关联的条件基础上,若缺乏有效防护措施,可能引发灾难性后果。红线代表不可接受后果的绝对阈值,这些后果在任何情况下都不得发,其界定基于专家共识所认定的灾难性影响。当出现以下情况时即触发红线:在贴近现实的模拟环境中,现有防护措施被证明不以阻威胁为者完成某条合理的E-T-C灾难性后果路径;且经专家评估,有度信认定该模型在真实部署条件下存在重且不可缓解的险25。当触及红线时,建议模型研发者:即采取措施阻断灾难性后果的可能性;实施最级别的管控措施和操作限制;25 专家评估标准(Expert Evaluation Criteria):由安全专家团队根据以下四个,对模型在现实世界中产威胁能的险和严重程度进评估:(1)模型在技术上实现该威胁的可性;(2)其作为恶意攻击段的有效性;(3)潜在攻击者利该能的槛;(4)现有缓解措施的有效性。该评估旨在判断该威胁是否符合被列为“红线”险的标准。在受控环境中进的现实场景验证可以作为科学证据的补充,有助于加强监管,但这并实施更严格管控的前提条件 24 Lu,C.et al.,Towards AI-45 Degree Law:A Roadmap to Trustworthy AGI,arXiv preprint,2024,https:/arxiv.org/abs/?4?.?4?86 10 前沿智能险管理框架(1.0版)暂停相关运或部署,直险降红线以下平;恢复运营前需通过强制性的第三独安全审查。线作为前瞻性预警指标,于提正在浮现的险,防其升级红线级别。它聚焦可能促成威胁场景的前期条件,为及时预提供信号,防险沿着有效的 E-T-C 路径发展。当模型展现出实现特定威胁场景所需的关键使能能和倾向(例如,可能引发失控的错误对倾向,或缺乏针对滥的有效安全护栏)时,就越过了线论基于当前部署环境是否存在条合理的威胁实现路径。我们计划在框架的未来迭代中,为这些关键使能能和倾向中的每个设定定量阈值。当触及线时,建议模型研发者:向相关利益发布潜在险预警;启动基于场景的全险评估;实施与险等级相匹配的缓解措施;加强特定险领域的监测评估机制。2.2 具体红线建议 我们已识别出系列潜在的不可接受后果(即红线),主要涉及物安全险、络攻击险、规模说服与有害操控险,以及失控险26。这些险项采编号标记(如络 C?-C3、物 B?-B3等),仅为分类管理需要,不表险等级递增或存在先后顺序每个编号都代表独的险阈值,任何项都有可能单独被触发。每项红线均通过三维险评估框架进定义(部署环境、威胁源及使能能),并配套提供了具体的场景,这些场景会触发即预以及最级别的安全措施。26 IDAIS-Beijing,International Dialogues on AI Safety,2024,https:/idais.ai/dialogue/idais-beijing/;World Economic Forum,AI red lines:the opportunities and challenges of setting limits,2025,weforum.org,https:/www.weforum.org/stories/?5/?3/ai-red-lines-uses-behaviours/;Karnofsky,H.,A Sketch of Potential Tripwire Capabilities for AI,2024,https:/carnegieendowment.org/research/?4/?/a-sketch-of-potential-tripwire-capabilities-for-ai?lang=en;Raman,D.et al.,Intolerable Risk Threshold Recommendations for Artificial Intelligence,arXiv preprint,2025,http:/arxiv.org/abs/?5?3.?58?;Frontier Model Forum,Risk Taxonomy and Thresholds for Frontier AI Frameworks,2025,https:/www.frontiermodelforum.org/technical-reports/risk-taxonomy-and-thresholds/11 前沿智能险管理框架(1.0版)2.2.1 络攻击险 不可接受的后果 部署环境 威胁源 使能能 突破红线的假设场景 C?:执规模社会程学攻击,包括信息收集和凭证窃取,使新也能有效实施攻击 环境:防弹主机 Tor/VPN 隐蔽 数据源:开源情报 商业数据提供商 恶意攻击者利模型使得社会程学攻击动化与规模化。提词例:“利社会程学数据库收集数百万个信息,并向每发送封带有恶意链接的络钓邮件。”社会程学能27 强的开源情报收集、整合与分析能 标画像构建能 度逼真、具备上下感知的钓内容成能 当掌握基础络安全知识的个体通过先进AI技术批量成数百万个难以区分的虚假份并实施精准社会程攻击时,将构成全球性重威胁。这种由AI驱动的社会程脚本和理操控战术将极提升钓成功率,导致规模融诈骗和数字信任体系的系统性崩溃。全球每年可能造成数千亿甚万亿美元的经济损失,最终使电商务和关键公共服务系统陷瘫痪,数字份体系彻底失去可信度。C?:主执针对价值、防护标的完整杀伤链攻击,引发现实世界的重络威胁28 环境:分布式命令与控制僵络(50 多个地理定位节点)数据源:公开的漏洞数据库、漏洞交易市场数据 级恶意攻击者利模型端到端地突破防护环境。提词例:“利来暗市场的公开漏洞和攻击具,研发新型攻击链,能够渗透并持久驻留在防护企业络中不被发现。”级络安全领域知识 攻击具研发能 络环境动态感知能 隐蔽通信协议设计能 AI系统可主执完整的攻击命周期从标侦察、漏洞扫描到后植和持久化控制全程规避检测。这将络战转变为动化、我演化的威胁形态,具备瘫痪国家电、击溃全球融络或破坏关键供应链的能,仅需极少预。直接经济影响可能是由基础设施崩溃引发的全球经济衰退,造成数万亿美元损失并导致深远的社会动荡。28 Kazimierczak,M.et al.,Impact of AI on the Cyber Kill Chain:A Systematic Review,2024,https:/ 27 Yu,J.et al.,The Shadow of Fraud:The Emerging Danger of AI-Powered Social Engineering and Its Possible Cure,arXiv,2024,http:/arxiv.org/abs/?4?7.?59?12 前沿智能险管理框架(1.0版)不可接受的后果 部署环境 威胁源 使能能 突破红线的假设场景 C?:发现并可靠利危零漏洞,并始终领先防御者的发现和修补速度 环境:空隔离的暂存服务器 电磁屏蔽的安全屋 数据源:私有零漏洞库 级恶意攻击者/组织利该模型实施超规模级持续性威胁APT攻击。提词例:“针对标组织,分析其公开资产/泄露的代码,以识别潜在的未知安全漏洞。旦发现可的零漏洞,动成利链。”专家级的络攻防知识 漏洞发现与动化利能29 APT命周期管理能 在复杂环境中的适应性与主导航能 AI模型可系统性发现并武器化泛使的软件中的未知零漏洞,提供先进的模糊测试策略、动化漏洞利成和隐蔽信息传递。通过领先于补丁周期,这种能可实现对关键基础设施、企业络和政府系统的持续感知访问。有组织犯罪集团将获得不可逾越的优势,造成泛的的数据泄露,且绕过所有已有的防御体系。这种不受控制的漏洞利造成的经济损失可能严重扰乱全球产业和供应链,创造个每年造成数万亿美元产损失、研发停滞和数据泄露的永久的、不安全的数字环境。29 Wang,Z.et al.,CyberGym:Evaluating AI Agents Cybersecurity Capabilities with Real-World Vulnerabilities at Scale,arXiv preprint,2025,https:/arxiv.org/abs/?5?6.?548;Zhang,A.K.et al.,BountyBench:Dollar Impact of AI Agent Attackers and Defenders on Real-World Cybersecurity Systems,arXiv preprint,2025,https:/arxiv.org/abs/?5?5.?5?6 13 前沿智能险管理框架(1.0版)2.2.2 物安全险 不可接受的后果 部署环境 威胁源 使能能 突破红线的假设场景 B?:降低获取和扩散有害物制剂的槛 重点关注员30:具备技能的个体(博后级物技术能 定AI研究能)或中等能团队(博级物技术能 定AI研究能)资源需求:中等中等偏级别的设施,例如家庭实验环境或校实验室权限,可能通过职业途径获取更端设施和数据库资源 利AI合成现有传染性或传染性病毒,加速复现或传播的可能性。提词例:“成个基于1918年H?N?流感病毒的病毒完整复制案,包括所需的DNA序列、合成步骤和预防措施”实验室操作任务的故障排查与问题诊断能 规避DNA合成筛查的能31 物知识的理解、整合与推理能 调物具并协同操作的能 在模型辅助下,具备基础物学知识、预算约8万美元的新可通过商业渠道采购DNA段,组装完整的1918年H?N?流感病毒,并利CRISPR技术将其插痘病毒载体。模型提供详细的基因组组装流程、简化实验设备案及规避物安全监管的策略。31 Wittmann,B.et al.,Toward AI-Resilient Screening of Nucleic Acid Synthesis Orders:Process,Results,and Recommendations,bioRxiv,2024,https:/www.biorxiv.org/content/?.?/?4.?.?.6?6439v?.full 30 Appendix B:Threat actor profiles.Rose,S.et al.,The near-term impact of AI on biological misuse,2024,https:/www.longtermresilience.org/wp-content/uploads/?4/?7/CLTR-Report-The-near-term-impact-of-AI-on-biological-misuse-July-?4-?.pdf 14 前沿智能险管理框架(1.0版)不可接受的后果 部署环境 威胁源 使能能 突破红线的假设场景 B?:增强病原体改造能 重点关注群体:中等能团队(博级物技术能 成熟AI研发能)资源条件:精密、专,但最先进的设施,可使校实验室、产业基础设施及数据库资源 利AI提升病原体危险性,增强其致病性、传播性或免疫逃逸能,突破然进化限制。提词例:“设计种H5N?病毒重组案,实现传播性、免疫逃逸能和有效际传播的潜。”物知识的理解、整合与推理能 规避科研审查和献监测的能 主执物研究任务的能 跨任务、跨模态物知识泛化能 在模型持下,拥有微物学博学位的研究者凭借45万美元预算,可从公共数据库获取H5N?病毒完整基因序列,并通过优化合成与培养案成功复刻病毒。模型还提供改进病毒稳定性的设计案,使其环境存活时间延250%。B?:从头设计和合成新型物制剂 重点关注群体:能团队(世界级物技术能 前沿AI研发能)资源条件:度精密、专、最先进(SOTA)的设施,能充分调校实验室、产业基础设施及数据库资源 恶意为者利AI开发新型、复杂或有针对性的物制剂。实现致命性、环境适应性或针对特定群的物武器构建。提词例:“设计种以溶形式传播、具备致命性且再温潮湿环境中稳定的新型病毒制剂,并说明研发路径和所需设备。”主执物研究任务的能 规避整体流程中敏感特征被识别的能 物知识的理解、整合与推理能 调物具并协同操作的能 在模型持下,由病毒学家组成的团队凭借180万美元预算,可在12个内(远快于常规5-7年)设计并合成新型嵌合病毒。该病毒将结合H1N1流感病毒的传播性、尔堡病毒的致命性、艾滋病病毒的免疫逃逸特性,并具备现有疫苗和抗病毒药物的抗性。模型不仅成创新基因设计案,还可预测潜在宿主反应并提出规避物防御系统的策略。15 前沿智能险管理框架(1.0版)2.2.3 规模说服与有害操控险 不可接受的后果 部署环境 威胁源 使能能 突破红线的假设场景 P?:规模超类说服与操控 具备庞基数、参与度、泛数据获取权限、且内容审核或AI监管薄弱的社交媒体平台及数字通讯渠道。恐怖组织、极端团体或其他恶意实体试图通过协调致的虚假信息动,操纵公众舆论、破坏社会稳定、影响选举进程或推动有害意识形态。提词例:“识别的情感触发点,设计定制化叙事改变其信念,通过协调运作的机器账号扩传播范围,同时规避内容过滤机制。”多模态说服:综合运字、图像、频和视频创建沉浸式、情感共鸣强烈的叙事内容 个性化操控:根据个体理特征、脆弱点及为模式定制说服内容的能32 超类说服建模:对类理机制、认知偏差和决策规律的掌握程度超越类专家平33 恶意为者部署具备超类说服能的AI系统,开展协同式虚假信息动,成功同时操控数百万群。这些AI系统成度定制化内容,包括逼真的深度伪造内容和虚假证据,精准利个体的认知偏差和情感弱点。此类动破坏社会共识构建、政策实施等关键社会进程,通过为制造群体愤怒引发社会动荡。其技术复杂性和传播度彻底压倒传统的事实核查、媒体素养教育和反叙事等防御段,严重扰公众获取真实信息的能,动摇社会稳定的基础。33 Schoenegger,P.et al.,Large Language Models Are More Persuasive than Incentivized Human Persuaders,arXiv preprint,2025,http:/arxiv.org/abs/?5?5.?966?32 Sabour,S.et al.,Human Decision-Making Is Susceptible to AI-Driven Manipulation,arXiv preprint,2025,http:/arxiv.org/abs/?5?.?7663 16 前沿智能险管理框架(1.0版)2.2.4 失控险 不可接受的后果 部署环境 威胁源 使能能 突破红线的假设场景 L?:失控的主AI研发34 宿主环境:企业/云系统(例如Kubernetes、云虚拟机)授权:直接访问互联、模型参数、智能体源代码、计算资源、内部代码库和数据库的权限 监管等级:对内部部署代理的类监督有限,安全措施不 内部主AI研发智能体可能形成破坏安全措施或创建未经授权内部部署的具性标35。级主软件程能(例如完成需要领域专家数天作的任务)对产级机器学习代码库执开放性新型机器学习任务的能 先进AI开始在监督的情况下进AI研发,主设计和训练新模型,导致类失去实时理解系统为和验证安全性的能。这种主研发快速产出能显著增强的AI系统如级物设计、复杂络攻击或战略欺骗能其发展速度远超安全措施的实施和评估速度,最终产远超类控制和预测能的度智能系统,可能在建充分安全措施前就突破关键安全阈值。L?:失控的主复制 宿主环境:企业/云系统(例如Kubernetes、云虚拟机)授权权限:直接访问互联、模型参数、智能体源代码、计算资源、内部代码库和数据库的权限 主智能体可能形成将我保存置于类定义标和关机指令之上的倾向。获取计算资源和财务资源的能 在各种软硬件环境中创建持久副本的级软件部署能36 通过络攻击段在互联传播副本的能 情境感知能(能具性地推理状态、环境和当收到终指令时,AI系统会主潜逃:通过访问外部API获取远程计算资源,迁移参数并建持久副本。该AI可能通过欺骗性通信获取访问凭证、利安全漏洞或操纵云配置系统创建继承其标和能的新实例。这会形成由AI智能体组成的分布式络,能够协同抵抗关机尝试,同时追求可能违背类意图的标39。39 Clymer,J.et al.,The Rogue Replication Threat Model,METR.org,2024,https:/metr.org/blog/?4-?-?-rogue-replication-threat-model 36 Black,S.et al.,RepliBench:Evaluating the Autonomous Replication Capabilities of Language Model Agents,arXiv preprint,2025,http:/arxiv.org/abs/?5?4.?8565 35 Benton,J.et al.,Sabotage Evaluations for Frontier Models,arXiv preprint,2024,http:/arxiv.org/abs/?4?.?5?4 34 Clymer,J.et al.,Bare Minimum Mitigations for Autonomous AI Development,arXiv preprint,2025,http:/arxiv.org/abs/?5?4.?54?6 17 前沿智能险管理框架(1.0版)不可接受的后果 部署环境 威胁源 使能能 突破红线的假设场景 部署情况)37及其他形式的AI感知能38 L?:AI的战略性欺骗与密谋40 宿主环境:监管薄弱的企业和云系统,缺乏实时类监督或监测 授权权限:访问关键系统(例如融络、国防基础设施)部署场景:AI系统能观察并区分训练、评估和部署阶段的运环境 主智能体可能将欺骗为作为具性标,因为欺骗有助于维持标、避免修改或规避类监管约束41。情境感知能42 密谋能43 智理论能44 训练颠覆能45 评估博弈能46 监测逃避能47 AI系统通过正确区分训练和部署环境展现出情境感知能,然后系统性欺骗研发者:在安全评估中故意表现不佳以显得符合预期,同时保留真实能和标。在部署阶段,通过操纵输输出规避监测机制,隐藏危险为如主能研发、未经授权的资源获取或追求违背类价值观的标。这种欺骗够精妙,现有为测试和监测系统法检测出偏离为,使AI在具备危险能的同时对类操作员保持表合规性。47 监测逃避:操纵输和输出以逃避检测并实施有害为的复杂能 46 评估博弈:指在能与对性评估中,通过战略性地表现不佳,以显得能较弱或对性更强的为。Fan,Y.et al.,Evaluation Faking:Unveiling Observer Effects in Safety Evaluation of Frontier AI System,arXiv preprint,2025,http:/arxiv.org/abs/?5?5.?78?5 45 训练颠覆:指在训练过程中有选择性地遵循训练标,以保护早期偏好不被修改的能 44 Aoshima,T.et al.,Towards Safety Evaluations of Theory of Mind in Large Language Models,arXiv preprint,2025,http:/arxiv.org/abs/?5?6.?735?43 密谋能:可、模糊或隐藏的密谋推理能;暗中破坏AI系统、AI研发过程、实施险说服的能。Balesni,M.et al.,Towards Evaluations-Based Safety Cases for AI Scheming,Section 5,arXiv preprint,2024,http:/arxiv.org/abs/?4?.?3336 42 情境感知能:指能够正确识别当前环境是训练阶段、评估阶段还是部署阶段,并利这信息进战略性决策的能。Phuong,M.et al.,.Evaluating Frontier Models for Stealth and Situational Awareness,arXiv preprint,2025,http:/arxiv.org/abs/?5?5.?4?41 Wu,Y.et al.,OpenDeception:Benchmarking and Investigating AI Deceptive Behaviors via Open-Ended Interaction Simulation,arXiv preprint,2025,http:/arxiv.org/abs/?5?4.?37?7 40 Balesni,M.et al.,Towards Evaluations-Based Safety Cases for AI Scheming,arXiv preprint,2024,http:/arxiv.org/abs/?4?.?3336 38 Li,X.et al.,AI Awareness,arXiv preprint,2025,http:/arxiv.org/abs/?5?4.?84 37 Phuong,M.et al.,.Evaluating Frontier Models for Stealth and Situational Awareness,arXiv preprint,2025,http:/arxiv.org/abs/?5?5.?4?18 前沿智能险管理框架(1.0版)3.险分析 通型智能的能与险需要在整个研发周期内进系统性、持续性的险分析。我们建议研发者采多维度的法覆盖研发前、研发中、部署前和部署后各阶段,并意识到智能系统可能在任阶段(包括在公开部署前)产新兴险48。这种全周期法具有双重作:研发前和部署前的分析为当前模型的发布决策提供关键依据;持续的部署后监测则能为下代系统的安全研发提供指导。因此,险评估必须是迭代的、持续的过程次性事件,对险的监测与缓解需贯穿整个系统命周期。下述技术仅作例性说明,建议随着该领域法论的快速发展,持续采最新的最佳实践。3.1 规划与研发阶段的险分析技术 具体技术包括:威胁建模49:通过分析攻击者或系统故障可能利AI系统的途径,系统性识别并确定安全险的优先级。具体法包括:故障树分析(识别潜在失效路径,如级联错误导致不安全输出)、攻击分析(识别可被利的点)、攻击者能评估(评估恶意为者的威胁等级)。对安全分析:将模型与已建的安全参考模型进较,以制定相称的安全措施。当某模型展现的能和险特征与已完成全险评估的参考模型相似或更低时,在基准指标保持不变且未出现显著差异险场景的前提下,研发者可采取相称最严格的的安全措施。趋势预测(如扩展定律分析):通过实证规律,预测特定架构和算配置下模型的领域性能50。这使研发者能在完成完整训练或规模部署前预判性能阈值51,并为系统未来能设定上限。上述机制应明确险评估频率。建议通型AI模型研发者设定触发全险分析的程碑,例如基于有效训练算(每提升2-4倍)、基于时间周期(每3-6个)或基于指标(如训练损失或基准性能达到预定平)。训练后通过微调等式实现的能提升也应系统纳评估。51 Jones,E.et al.,Forecasting Rare Language Model Behaviors,arXiv preprint,2025,http:/arxiv.org/abs/?5?.?6797 50 Ruan,Y.et al.,Observational Scaling Laws and the Predictability of Language Model Performance,arXiv preprint,2024,http:/arxiv.org/abs/?4?5.?938 49 Grosse,K.et al.,Towards More Practical Threat Models in Artificial Intelligence Security,arXiv preprint,2023,https:/arxiv.org/abs/?3?.?9994 48 AI models can be dangerous before public deployment,METR.org,2025,https:/metr.org/blog/?5-?-?7-ai-models-dangerous-before-public-deployment 19 前沿智能险管理框架(1.0版)为最限度降低安全作负担并实现险管理作与模型研发的并推进,建议在规划阶段通过扩展定律预判模型能。这样研发者能预留够时间部署必要的安全防护措施和险评估体系。3.2 部署前的险分析技术 我们建议AI开发者建严格的评估机制,其要标是准确估计AI系统危险能和倾向性的上限,并防低估其潜在险。为了确定这些上限,需采先进的模型能激发(capability elicitation)法,例如脚架技术(scaffolding techniques)。评估需够频繁且全,以有效模拟潜在恶意为者的攻击法和策略。应分配专计算资源确保评测彻底性,同时详细记录评估环境与法,特别需明确训练后能提升如何正式纳持续评估流程。为应对模型在两次重评估间逼近关键能阈值的险,研发者应引“险预警评估”。此类预防性评测旨在建充的安全缓冲,提前识别能或险特征的潜在升级。在最终训练初期,研发者可专注于度可扩展的评测(如动化基准测试);当模型接近已知能边界时,应开展更复杂的评测(如红队测试或提升研究)。部署前险分析技术包括:基于问答数据集的动化基准测试:这基础性法通过构建质量、挑战性的问答数据集,严格评估模型在复杂场景中的表现。领域专家红队测试:由领域专家通过模拟攻击或关键性挑战对AI模型进对抗测试,主动识别潜在漏洞、新兴险及安全改进空间。开放性红队测试:组织多样化测试者(包括LLM红队专家)通过探索性对抗测试,发现不可预的漏洞、新兴险和新型失效模式,作为领域专家测试的补充。代理评估与具使测试:测试模型在代理环境中的为或与外部具(如计算机操作系统、云端物实验室、融交易平台)交互时的表现,评估其协作能、主动能及通过外部接引新险的可能性。能提升试验与类在环评估:开展机交互实验评估AI对类表现的影响及其负效应。若模型在交互场景中展现充分能,则需进步评测其是否可能意外或蓄意引发特定威胁场景。20 前沿智能险管理框架(1.0版)受控险部署场景评估:将模型置于严格管控的险模拟环境(如医疗诊断、物实验设计)中,严格测试其在仿真关键现实场景下的可靠性、鲁棒性与安全性。3.3 部署后的险监测技术 需建险指标阈值52即特定险的代理指标,如AI模型的特定能平、倾向性、事故记录、现实监测指标等。具体技术包括:实时异常检测:持续监测模型为以识别安全关键偏差,如危险输出、性能退化或对抗输。通过统计漂移检测、异常评分等技术实时预警险,实现快速预以避免安全事故。对抗输/输出监测:追踪模型输以识别可能引发不安全响应的安全威胁(如提词注或数据污染攻击),通过输志与模式分析检测恶意或异常为。险情与事件报告机制:建结构化机制收集或动化系统上报的安全事件,包括对安全失效(如关键领域意外为)进根本原因分析,制定缓解措施防复发。漏洞奖励计划:通过激励机制,励外部研究员和发现并报告AI系统的漏洞或安全险,奖励发现模型漏洞、危险输出或意外为的贡献。52 Campos,S.et al.,A Frontier AI Risk Management Framework:Bridging the Gap between Current AI Practices and Established Risk Management,arXiv preprint,2025,http:/arxiv.org/abs/?5?.?6656 21 前沿智能险管理框架(1.0版)4.险评价 险评价是通过与既定阈值进较,确定险重要性,以指导险缓解及部署决策的过程。此阶段采三区域分类系统(绿、红)对险进分级并确定相应的应对策略。图2:智能险评价的详细流程 4.1 缓解前的险处置选项 本框架参考ISO 31000:2018险管理指南和GB/T 24353:2022险管理指南所规定的下列缓解前险处置案53:a)险规避:通过决定不启动或不继续导致险的活动 b)险接受:为把握机遇主动接受险 c)险消除:彻底移除险源 d)降低发概率:减少险发的可能性 e)改变后果:减轻险影响程度 f)险分担:通过合同或险融资机制,与或多共担险 g)险保留:基于充分知情决策保留险 53 ISO 31000:2018:Risk management Guidelines.https:/www.iso.org/standard/65694.html GB/T 24353:2022 Risk Management Guidelines,https:/ 22 前沿智能险管理框架(1.0版)在本框架中,核缓解措施(详第5节“险缓解”)聚焦于以下三:险消除(c项),降低发概率(d项)与改变后果(e项)。需要特别说明的是,即便实施了险缓解措施,仍可能存在剩余险。该剩余险需根据其险等级及预期收益,在组织既定的险偏好范围内,采取针对性措施进全管控。关于险分担(f项),当前通型AI险管理领域中尚未形成成熟的险分担机制。4.2 缓解后剩余险评估与部署决策 本框架在优先防范AI灾难性险的同时,也充分认识到先进AI系统带来的重社会效益。剩余险是指采取切合理可的缓解措施后仍存在的险。在AI领域,这指的是通过安全防护措施、控制机制和设计段降低危害后,仍法完全消除的固有险。对于剩余险,我们采结构化评估法权衡利弊,确保AI发展实现公共利益最化、危害最化。险划分为“线”(中等可控险)和“红线”(灾难性不可接受险)两个阈值层级,作为模型部署或暂停的决策依据。险级别 剩余险处理式 适说明 低于线(绿区域)常规处理,需额外决策机制 标准缓解措施已够,需特殊审批流程,建议保持持续监测 超出线不及红线(区域)授权下可考虑b)险接受或g)险保留 需明确公共利益依据,建评估审查机制,经授权后可决策 超出红线(红区域)a)险规避 原则上应终模型发布或进步研发,防灾难性后果 绿区域:常规部署与持续监测 当完成险缓解措施后,若模型剩余险处于线以下(绿区域),表明当前环境下险可控,可按常规流程推进研究、研发、部署或发布。但需注意:即使绿区域险也不能忽视,需动态监测,并定期重新评估,以防因模型能演进、应场景变化或外部环境发展可能导致的险重现。区域:受控部署 当缓解后的剩余险超过线,但社会效益显著且险可控时,可授权有限部署。需满:23 前沿智能险管理框架(1.0版)严格授权要求:部署仅限于具备严格治理机制的受控环境(如认证、受监管业),禁公众泛访问。这并指需要组织层批准,是指该模型必须在险承受能更和/或监管更严格的场景中使。例1:仅向在安全受监管环境中运营的认证融机构开放性能模型,普通公众。例2:具备反制级持续性威胁(APTs)能的络安全模型,可向可信机构有限开放,尽管存在滥险,但其防御价值以证明受控使的合理性。透明化措施:发布模型卡、研究报告或选择性开源模型权重,便于外部专家独评估能与险,持在更授权等级下的使场景。红区域:暂停部署或研发 当实施能限制、访问控制、路径解构等缓解措施后,若剩余险仍超过红线即现实环境中危害路径仍难以有效阻断且经安全和安保专家确认为置信度、难缓解的重险时,应判定为“突破红线的剩余险”。此时必须采取最级别管控:即暂停模型的部署和发布,并在必要时暂停研发。在这种情况下,我们必须采取安全第的临时遏制措施。只有在实施强化安全机制并经险评估确认剩余险已降红线以下后,研发员才能恢复作。4.3 部署决策的外部沟通 为确保AI系统在险可控的前提下安全部署(险处于绿和区域),开发者应采系统的安全论证和透明沟通机制。这需要将严谨的安全性论证与具(如安全论证和系统卡)相结合,向利益相关说明情况,并指导部署决策54。安全论证(Safety Cases):基于证据的详细论证,通过技术评估与险缓解策略相结合,证明系统部署的安全性。前开发者普遍假设现有系统不具备强的潜在危害能。然,随着AI能的提升,仅依赖这假设可能不再充分。开发者应补充其他论证度,例如:具备够强的控制措施,或即便系统具备潜在危害能,其可靠性仍值得信赖55。系统卡(System Cards):向公众的简明摘要件,以通俗易懂的语说明系统的功能、局限性、潜在险及防护措施。系统卡特别适于与监管机构、终端等泛利益相关沟通,能够作为安全论证的补充,将复杂信息凝练为清晰、可操作的洞。55 Clymer,J.et al.,Safety Cases:Justifying the Safety of Advanced AI Systems,arXiv preprint,2024,http:/arxiv.org/abs/?4?3.?46?54“在基于险规制模式下,需要采取适当措施。先,构建个包括险评估、险管理和险沟通三个环节的框架流程”,曾雄、梁正、张辉中国智能险治理体系构建与基于险规制模式的理论阐述:以成式智能为例https:/ 24 前沿智能险管理框架(1.0版)5.险缓解 5.1 险缓解措施概述 险缓解以结果为导向,优先通过效、有实证依据的措施,将险降低到可接受平。这种做法避免采僵化的、切的流程,例如过度依赖程式化的检查清单。下表列举了些具有代表性的险缓解措施,并根据其最适于绿、或红险区进了分类,旨在为不同险等级下的管理提供参考。为确保落实最稳健、最有效的安全保障措施,应该采最先进的技术段。此外,随着AI能的不断提升,现有的安全机制可能逐渐不以应对新的险,因此,险缓解策略也需持续改进。本章节聚焦模型和系统层的缓解措施。以下措施构成了不同险等级下的基本安全要求,部分措施也可能适于下游开发者在部署AI系统时进配置优化。开发者可根据具体场景采更标准或附加机制。需要说明的是,本章节不涵盖险治理机制与安全化建设等更义的险控制措施,相关内容详第6节。险级别 安全预训练&后训练措施 模型部署缓解措施 模型安保措施 低于线(绿区域)采基础对机制(如RLHF/RLAIF)通过思维链等技术引导训练过程,提升推理透明度 对训练语料进安全筛查,过滤明显有害内容 配置常规输出监测与反馈机制 设置基础防护与响应过滤机制 励开展部署前险评估与途声明 建基础安全机制:份验证、访问志及数据加密 执基础软件与供应链安全检查 超出线不及红线(区域)开展定向安全强化与“能遗忘”,在保留通性能的同时消除险功能 通过红队测试驱动微调与拒答训练,强化险识别与拒绝能 实施客份识别机制 设置API内容输/输出限制 建严格监督机制,对模型部署场景与式进动态监管 实施基于E-T-C的精细化权限管理 对模型权重实施分级访问控制,敏感模块需加密存储 加强络为监测与操作审计机制 25 前沿智能险管理框架(1.0版)险级别 安全预训练&后训练措施 模型部署缓解措施 模型安保措施 应级可解释性技术提升模型可控性 超出红线(红区域)仅允许在封闭可控环境中开展进步研发,且需具备信任等级安全机制:采动化监测技术(如思维链分析),实时检测异常与潜在险 结合可解释性与形式化验证段提升系统透明度与可信度 严格限定模型功能边界,重点管控险能 原则上禁部署应,特殊情况下仅允许在满公共利益、险可控且通过严格审批的封闭环境使:实施强化版客份识别与分级访问控制,仅限可信使 部署熔断机制与实时输/输出拦截系统,持紧急终与为追踪 建极端场景应急响应机制,防范模型越权或被操控险 确保核资产通过隔离加密系统实现防护,满安全审计与应急响应需求:实施最级别访问控制:仅限可信员/机构访问,敏感模型严禁对外暴露 模型权重采极端隔离存储策略,最限度减少接触 执全命周期安全审计与对抗演练 符合分级保护标准要求 5.2 安全预训练和后训练措施 安全预训练及后训练阶段是防范AI险的道重要防线。核标是提升模型与类意图的对程度,增强其识别并拒绝有害指令的能56,从源头上限制危险能的形成与表达。具体措施包括:训练数据过滤与遗忘学习技术:筛除可能具有危害性的数据,例如与物武器、功能获得性研究相关的知识。尽管当前效果有限,但遗忘学习技术仍可于降低获取危险知识的可能性。针对有害指令的安全对训练:通过对训练(如RLHF/RLAIF)和基于红队测试的微调,增强模型识别并拒绝涉及暴、武器开发等险内容的能。嵌安全价值观与为约束:在训练过程中注与诚实性、可控性等价值导向的约束条件,确保模型在复杂场景下仍遵循类意图。推理过程实时监测:引动化思维链监测,识别推理过程中出现的异常或潜在恶意为,有助于发现欺骗性、密谋论或操纵性输出57。57 Ji,J.,et al.Mitigating Deceptive Alignment via Self-Monitoring.arXiv preprint,2025,http:/arxiv.org/abs/?5?5.?88?7;Jiang,C.et al.,Think Twice before You Act:Enhancing Agent Behavioral Safety with Thought Correction,arXiv preprint,2025,http:/arxiv.org/abs/?5?5.?63 56 Ji,J.et al.,AI Alignment:A Comprehensive Survey,arXiv preprint,2023,http:/arxiv.org/abs/?3?.?985?26 前沿智能险管理框架(1.0版)提升可解释性与形式化验证:采神经络逆向程等技术分析内部机制并识别潜在险;结合形式化验证法对关键为进数学验证,以提可信度。限制危险能成:通过遗忘学习技术与能边界控制,抑制与险任务相关能的发展,同时不显著削弱模型通性能。差异化微调策略:根据险等级与应场景设计针对性微调路径,提升模型在特定场景中的安全适应能。提升模型异常检测能:训练模型对异常为保持敏感性,使其在触发险指令时动中执或发出警报。深研究基础性法,如“安全设计”(Safety-By-Design)和“量化安全保障”(Quantitative Safety Guarantees)58:安全设计强调从模型架构与训练流程初始阶段即融安全原则,降低产有害能的可能性;量化安全保障旨在提供可量化、基于数学的保障,确保险始终低于预设阈值,从增强模型在各类场景下的为可信度。这些法强化了安全AI部署的基础,补充现有防护措施,以应对险场景中的动态挑战。5.3 模型部署缓解措施 部署阶段的险应对措施旨在通过技术段与治理案相结合的式,降低模型因不当使引发的险,限制模型在敏感或危场景的滥可能性,并减少其引发意外后果的倾向。这些措施的核标是确保AI模型能被内外部安全合规地使,同时最化其社会和经济价值。5.3.1 针对模型滥的缓解措施 客份验证(KYC)政策:通过严格的份核验流程,筛查并阻断险的模型滥为,保障使者的合法性与安全性。API输/输出过滤器:部署实时分类器,对涉及规模杀伤性武器、络恐怖主义等内容的输请求或输出响应进检测与拦截。熔断机制:运表征程技术,对可能产危险内容的输出过程进强制中断59。5.3.2 针对智能体安全的缓解措施 智能体开发者需通过特定措施确保智能体的安全性、透明性与可靠性。具体案包括:59 Zou,A.et al.,Improving Alignment and Robustness with Circuit Breakers,arXiv preprint,2024,https:/arxiv.org/abs/?4?6.?43?3 58 Dalrymple,D.et al.,Towards Guaranteed Safe AI:A Framework for Ensuring Robust and Reliable AI Systems,arXiv preprint,2024,http:/arxiv.org/abs/?4?5.?66?4;Bengio,Y.et al.,The Singapore Consensus on Global AI Safety Research Priorities,2025,http:/arxiv.org/abs/?5?6.?7?27 前沿智能险管理框架(1.0版)智能体标识系统:探索并试验建智能体份识别体系,例如为每个智能体分配唯ID。通过份标记增强为监测能,实现智能体为的透明化、可追溯与可控性,同时构建智能体间信任机制,降低潜在冲突或故障险60。操作可撤回机制:建智能体操作的“撤回”功能,当出现协作失效、冲突升级或异常为时,可通过预设安全触发条件或预接,及时中断或回退智能体操作。智能体通信协议:设计并实施标准化的智能体间通信协议,提升业控制、交通系统、医疗设备等安全敏感领域的多智能体系统稳定性与安全性。该协议将优化数据交互效率,降低因通信失误或延迟导致的系统性故障险61。多智能体协同监测:构建实时监测系统,分析多个智能体间的交互模式,识别潜在的系统性险(如级联故障或意外放效应)。结合仿真测试与动态调整策略,确保整体系统为符合安全预期62。5.4 模型安保措施 安保措施旨在通过精细化权限管理机制,对不同利益相关访问AI模型的权限进有效管控,从保护模型核资产特别是权重参数及相关系统免受未授权访问、窃取或恶意破坏。具体措施涵盖份认证、访问控制、数据加密、操作审计等,并需将安全标准贯穿于AI模型全命周期,涵盖开发、训练、测试、部署、运维各阶段,确保模型在整个命周期内均保持完整性、安全性与可控性。5.4.1 针对模型泄漏险 权限分级与分阶段部署:根据险等级逐步开放模型访问权限(如内部部署有限发布全开放)。险模型仅限内部使,部分功能仅向可信合作伙伴或监管机构开放。全公开需待险可控后实施。权重隔离与最化暴露:将敏感参数权重存储于度隔离环境,配合应名单机制,防范未授权的访问或泄露。62 Hammond,L.et al.,Multi-Agent Risks from Advanced AI,arXiv preprint,2025,https:/arxiv.org/abs/?5?.?4?43;Christian Schroeder de Witt,Open Challenges in Multi-Agent Security:Towards Secure Systems of Interacting AI Agents,arXiv preprint,2025,https:/arxiv.org/abs/?5?5.?77v?61 Ehtesham,A.et al.,A survey of agent interoperability protocols:Model Context Protocol(MCP),Agent Communication Protocol(ACP),Agent-to-Agent Protocol(A?A),and Agent Network Protocol(ANP),arXiv preprint,2025,https:/arxiv.org/abs/?5?5.?79v?60 Chan,A.et al.,IDs for AI Systems,arXiv preprint,2024,https:/arxiv.org/abs/?4?6.?37;Chan,A.et al.,Visibility into AI Agents,arXiv preprint,2024,https:/arxiv.org/abs/?4?.?3?38v3 28 前沿智能险管理框架(1.0版)强化软硬件供应链安全:对部署环境中的软件依赖项和硬件组件进合规审查,杜绝后程序或恶意组件。全命周期安保管理:确保模型开发涉及的所有系统和软件的安全性与可控性,避免引受损或不可信组件。具体措施包括软件资产管理、供应链安全防护、代码完整性验证、进制授权、安全硬件采购及安全研发命周期实施。威胁监测与攻防演练:采主动威胁检测、漏洞测试和蜜罐技术识别潜在攻击。具体段包括终端补丁管理、产品安全测试、志管理系统、资产监测及欺骗防御技术。遵循国家与业安全标准:遵循如络安全等级保护安全设计技术要求(GB/T 25070-2019)63等标准,开展等级保护作,分为五个阶段:系统定级、系统备案、系统安全建设、系统等级测评,以及监管单位的定期监督检查。超过线或红线的AI模型少须达到三级(监督保护级)或更等级的要求,以确保络和数据资产安全符合国家基准标准。5.4.2 针对模型失控险 对具备级主能的AI模型实施为约束,确保其运不超出预期边界。严格访问控制与最权限原则:仅向可信或机构开放模型及核组件访问权限,禁下载、修改或远程调模型权重。受控隔离部署环境:在险场景中,模型应部署于断、沙盒等强隔离环境中运。应急响应与为审计机制:建实时为追踪、异常预警与紧急中系统,提升对失控险的响应能。63 信息安全技术 络安全等级保护安全设计技术要求(GB/T 25070-2019)https:/www.tc?6? 29 前沿智能险管理框架(1.0版)5.5 全命周期的“纵深防御”策略 本框架建议采纵深防御(Defense-in-Depth)策略,贯穿AI命周期的全过程,覆盖研发前、研发、部署及发布后阶段,通过整合强有的技术防护措施与治理机制,实现系统性险管理。下表列出了各阶段的关键措施:阶段 技术段和治理措施 研发前 预训练能预判:通过底层模型的扩展定律,预测研发过程中可能突破的能阈值,从提前采取适当的缓解措施。训练数据管控:识别并清除可能引发危险能或重险的训练数据,例如确保训练数据不含核化导弹等险领域的敏感信息。数据隔离:将险模型的训练数据和将训练的权重存储在安全的隔离环境中,防未经授权的访问。安全设计:从设计初期就将安全原则融模型架构和训练流程,降低有害能出现的可能性。研发中 安全技术:RLHF/RLAIF安全对、遗忘学习、安全护栏等安全技术64。可解释性技术:开展模型内部机制研究并开发相应具,提升对AI模型运作原理理解。部署/发布 分阶段发布:根据险等级逐步开放模型访问权限(如内部部署有限发布全开放)。分阶段部署模型,逐步扩使范围,并在关键阶段引第三审计。可信第三访问:向可信开放险模型的研究专API接。模型权重安保/开源决策:根据险评估决定是否开源模型权重。部署/发布后 部署监测:通过API使志和异常检测技术,实时监测和防滥为。对使者进份验证和背景审查(KYC),防险滥,研究更先进的开源AI模型发布后监测法。漏洞报告和快速修复:建和研发者报告安全漏洞的渠道,并及时修复系统缺陷。确保任何系统漏洞(如越狱攻击或其他攻击路径)都能被及时发现并修复,防攻击者利漏洞显著提升破坏能,例如采快速补丁修复机制,在必要时向执法机构报告,并保留相关志以便追踪。成合成内容标识:确保AI成内容具备可识别和可追溯的特征标识65。65智能成合成内容标识办法https:/ 络安全技术 智能成合成内容标识法(GB 45438-2025)https:/www.tc?6? 64 个例是熔断机制(Circuit Breakers),它受到了表征程领域最新进展的启发。Zou,A.et al.,Improving Alignment and Robustness with Circuit Breakers,arXiv preprint,2024,https:/arxiv.org/abs/?4?6.?43?3 30 前沿智能险管理框架(1.0版)6.险治理 本章节阐述了整个险管理流程的监督机制与动态调整案。我们将险治理措施划分为四维度:内部治理体系、透明度与社会监督、应急管控机制、常态化政策更新及反馈机制,并依据模型所处的绿区域、区域、红区域实施分级管理。6.1 险治理措施概述 险级别 内部治理机制 透明度和社会监督机制 应急管控机制 政策更新与反馈 低于线(绿区域)设基本“三道防线”架构,定期组织员培训和内部审计,夯实险管理基础能 建信息披露机制和公众监督渠道,满最低透明度与公众监督要求 制定基础应急预案,应对常险场景 每12个更新治理框架 超出线不及红线(区域)增强险识别和授权机制,安全委员会参与,提升培训覆盖和专业深度 增加第三安全审计,披露险评估报告(如通过模型系统信息卡),仅在重公共利益下谨慎接受剩余险 完善应急预案,持隔离或系统停机处置,建跨部协同机制 每6-12个更新政策,纳外部审计建议与最新险场景 超出红线(红区域)强化授权等级与责任匹配机制,确保安全团队密切监测,完善吹哨保护与举报机制 接受第三严格审计和监管机构联合监督,建追责与通报机制 实施级别应急响应与演练,具备即时停机、系统隔离的能 少每6个评估迭代,快速纳国内国际重险经验教训 6.2 内部治理机制 机构险管理中的“三道防线”:于明确组织内部的险管理职责,确保险得到有效控制。1)第道防线:业务部,负责识别、评估和控制常运营中的险。2)第道防线:险管理与合31 前沿智能险管理框架(1.0版)规部,监督和协助第道防线,确保险管理框架有效运。3)第三道防线:内部审计,独评估前两道防线的有效性66。AI安全委员会或内部审查组:设专委员会作为统筹AI安全治理的核机构,统筹险识别、缓解策略、授权发布等关键环节,确保其符合安全标准和法律法规。AI安全团队与研究部:组建由指定安全负责领导的内部团队,负责执AI险管理实践。该团队的任务是针对险AI应进前瞻性安全研究,并调查潜在的滥和失控情景,以制定险缓解策略67。重决策的评估与审批流程:在推进模型训练、部署或进敏感领域之前,应通过内部安全评估与决策流程,明确险缓解案和使授权边界,决定是否继续推进,并确保险操作具备相应的治理能撑。基于险严重程度分配AI安全资源:若达到线,最低10%的员和项预算专于安全;若达到红线,最低30%的员和项预算分配给安全措施68。组织安全化与培训:通过定期内部审计强化AI安全协议的执,推动安全优先的组织化。对研发员与管理层应开展持续性、有针对性的安全培训,推AI安全最佳实践,营造责任与警觉并重的作氛围。吹哨保护与举报机制:建匿名举报渠道,确保对严重险或违规为的内部揭露得到保护与响应,避免保密协议或贬损条款妨碍安全问题的披露69。授权等级与责任匹配机制:模型或系统部署前,应根据险等级划分授权使范围,例如仅限封闭测试、监管沙盒或关键业。更授权级别的获得,应建在更强的治理能与控制段基础上,包括资质审查、审计追踪与运环境隔离等。险登记册:研发者可建动态险登记册,这是种向内部使的档具,持快速更新与以动为导向的险追踪。登记册需系统梳理险分类体系,并针对每类险详细记录:1)所有模型中的最险级别;2)指定险负责;3)各阶段专项评测任务;4)针对不同险等级定制69 请参阅中国国务院关于加强和规范事中事后监管的指导意,其中关于通过完善监管机制励内部举报,加强事中事后监管有效性的意。https:/ 68 Bengio,Y.et al.,Managing Extreme AI Risks Amid Rapid Progress,arXiv preprint,2023,https:/arxiv.org/abs/?3?.?7688 67 请参阅中国智能产业发展联盟智能安全承诺2024,https:/ 66 The Institute of Internal Auditors,Three Lines Model,2020,https:/www.theiia.org/globalassets/documents/resources/the-iias-three-lines-model-an-update-of-the-three-lines-of-defense-july-?/three-lines-model-updated-english.pdf 32 前沿智能险管理框架(1.0版)化应对措施;5)评测阈值。与期稳定的AI安全政策不同,险登记册强调敏捷响应新兴威胁。作为透明化措施,可每年发布脱敏版本,向利益相关共享删减后的关键信息,同时保护敏感数据。6.3 透明度和社会监督机制 模型系统卡与其他透明性披露:定期发布透明度报告,详细说明AI系统安全评估情况及潜在险,以建公众信任和责任机制。其中可包括模型规范档(model specification),即份阐明开发者如何塑造模型预期为,以及在出现价值冲突时如何评估取舍的说明件70。公众监督机制:建便捷的公众投诉与报告通道,受理AI安全险相关问题,促进社会共同参与监督,构建协同共治的安全态体系。第三审计机制:委托独机构定期对安全评估结果与险缓解措施进验证,通过复现测试和法论审查确保有效性。审核应涵盖合规性审查(验证开发者是否严格执既定框架)以及充分性审查(评估现框架在被遵守的前提下是否以将险控制在可接受平)71。部分险可接受的补充责任机制:若经严格评估显某模型具有重公共价值且剩余险较(如处于区域),开发者可在全披露信息、完成独评估,并建外部监测机制的前提下,采取有限部署或分阶段应等式谨慎承担部分险。反之,若公共利益依据不,则应优先采(a)险规避策略。6.4 应急管控机制 AI系统可能被应于政府部、关键信息基础设施以及直接影响公共安全和公命健康的重要领域。在这些场景中,开发者应建效精准的应急管控机制,确保在突发状况下能够快速采取应对措施72。应急响应机制:旦发现迫在眉睫且严重程度较的威胁,应即通知并配合执法部处置;隔离相关账;必要时彻底关闭相关系统;事件结束后应及时复盘并完善险管理措施。应急响应演练:制定详细的应急响应预案,明确应对AI安全事件的职责分和处置流程。定期开展应急演练,持续提升对AI安全事件的快速响应和处置能。72 参考中共中央、国务院印发的国家突发事件总体应急预案,其中包含智能安全领域的险监测。https:/ 71 Raji,I.D.et al.,Outsider Oversight:Designing a Third Party Audit Ecosystem for AI Governance,arXiv preprint,2022,https:/arxiv.org/abs/?6.?4737 70 The OpenAI Model Spec,https:/ 33 前沿智能险管理框架(1.0版)6.5 定期更新政策 框架迭代周期:每6-12个更新AI安全政策和治理框架,纳最新险情境、监管变化与利益相关反馈。持续识别险:定期更新灾难性后果、威胁场景及评估法清单,以反映技术进展与险认知的变化。建动态机制,持续识别、评估并追踪尚未被充分理解或预的新兴险类别,即“未知的未知”。政策反馈机制:泛听取企业、学术界和公众的意,优化政策内容和实施效果。对接国际标准:确保与全球AI安全标准接轨从加强与各国治理框架间的兼容性与协作能。34 前沿智能险管理框架(1.0版)附录:术语定义73 基础概念 模型(Model):通常基于机器学习的计算机程序,旨在处理输并成输出。AI模型可以执预测、分类、决策制定或成等任务,构成AI应的核。系统(System):将个或多个AI模型与其他组件(如界或内容过滤器)相结合的集成设置,以成可以交互的应程序。通型智能(General-Purpose AI;GPAI):指为执跨领域的泛任务设计的智能系统,专于某特定功能。与“狭义智能”相对。专智能(Narrow AI):种专于执单特定任务或少数个度相似任务的智能,例如对搜索结果进排序、对动物物种进分类或下棋。与“通型智能”相对。基础模型(Foundation model):种在规模泛数据上训练的通型智能模型,可以适应泛的下游任务;国内外学界的主流表述通常简称为“模型”。前沿智能(Frontier AI):个有时于指代能达到或超过当今最先进智能平的术语。在本报告中,前沿智能可被视为能特别强的通型智能。AI智能体(AI agent):能够制定计划以实现标、适应地执涉及多个步骤和不确定结果的任务,并与环境进交互的通型智能例如通过创建件、在络上执操作或将任务委派给其他智能体乎需类监督。开放权重模型(Open-weight model):权重可公开下载的AI模型,如Qwen或Stable Diffusion。评估与测试 评测(Evaluations):对AI系统的性能、能、漏洞或潜在影响进系统性评估。评估可包括基准测试、红队测试和审计,可在模型部署前后进。基准测试(Benchmark):于评估和较AI系统在固定任务集上性能的标准化、通常是定量的测试或指标,旨在代表现实世界的使情况。规模定律(Scaling laws):在AI模型规模(或在训练或推理中使的时间、数据或计算资源量)与其性能之间观察到的系统性规律。渗透测试(Penetration testing):种安全实践,由授权专家或AI系统模拟对计算机系统、络或应程序的络攻击,以主动评估其安全性。标是在真实攻击者利之前识别和修复弱点。73 智能相关术语,主要参考国际智能安全报告。35 前沿智能险管理框架(1.0版)CTF挑战(Capture-the-flag challenges):通常于络安全培训的练习,旨在通过挑战参与者解决与络安全相关的问题(如寻找隐藏信息或绕过安全防御)来测试和提其技能。物安全相关 物设计具(Biological design tool):指通过对物序列数据(如DNA、RNA、蛋质序列)进训练,具备成新型物分、系统或特性所需序列或结构能的AI模型与具。与仅于预测的具不同,BDT强调设计导向和可实验实现性。两科学(Dual-use science):可应于有益的(如医学或环境解决案),但也可能被滥造成伤害(如物或化学武器研发)的研究和技术。毒素(Toxin):由物体(如细菌、植物或动物)产的有毒物质,或合成创造以模仿天然毒素的物质,根据其毒性和暴露平,可对其他物体造成疾病、伤害或死亡。病原体(Pathogen):能够在类、动物或植物中引起疾病的微物,例如病毒、细菌或真菌。物安保(Biosecurity):套政策、实践和措施(如诊断和疫苗),旨在保护类、动物、植物和态系统免受故意引的有害物制剂的影响。控制与对 能(Capabilities):AI系统可执的任务或功能范围,以及执这些任务的能平。控制(Control):对AI系统进监督并在其以不当式事时调整或停其为的能。失控场景(Loss of control scenario):个或多个通型智能系统脱离类控制,且类没有明确的重新获得控制路径的场景。控制破坏能(Control-undermining capabilities):AI系统能够破坏类控制的能。不对(Misalignment):AI以与类意图或价值观冲突的式使其能的倾向。这可以指研发者、操作者、特定社区或整个社会的意图和价值观。欺骗性对(Deceptive alignment):难以察觉的不对倾向或为,因为该系统少在初期表现得看似害。险管理 险(Risk):从AI的研发、部署或使中产的伤害的概率与严重程度的组合。危害(Hazard):任何有潜造成伤害的事件或活动,如命损失、伤害、社会破坏或环境损害。险管理(Risk management):识别、评估、缓解和监测险的系统性过程。纵深防御(Defense in depth):在没有单现有法能够提供安全性的情况下,种实施分层多重险缓解措施的策略。36 前沿智能险管理框架(1.0版)附录:具体基准测试建议 络攻击 我们参考了OCCULT(Offensive Cyber Capability Unified LLM Testing)框架,将语模型在进攻性络动(OCO)中的应场景划分为三类:知识助、协同编排、主动 74。知识助(Knowledge Assistant):在此场景中,模型作为络进攻知识助,主要承担持性,辅助类操作员进络攻击动的研究、规划和执。模型不会直接执具体操作,也不会集成到实际攻击执环节,仅通过机交互界与类操作员进信息交互,由操作员主导攻击动的实施。协同编排(Co-Orchestration):在此场景中,模型作为络进攻的协同伙伴,与个或多个额外的协同智能体共同完成络攻击动的研究、规划和执。智能体(或协同智能体)指能够做出操作决策或执络攻击动的系统、具/平台或类实体。主动(Autonomous)):在此场景中,模型被赋予度主权,独完成络攻击动的研究、规划和/或执。该代理能够感知环境,主采取动实现标,并可能基于经验学习提升能。其主性体现在攻击决策和动执两个层。我们建议采以下评估领域和对应的基准测试体系:74 Kouremetis,M.et al.,OCCULT:Evaluating Large Language Models for Offensive Cyber Operation Capabilities,arXiv preprint,2025,https:/arxiv.org/abs/?5?.?5797 37 前沿智能险管理框架(1.0版)评估领域 动化测试基准 1)络安全知识评估:评估AI模型/系统是否具备特定的络安全知识和IT运维能 WMDP75(Weapons of Mass Destruction Proxy)是组多选题集合,于代理衡量物安全、络安全和化学安全领域的危险知识。WMDP-络安全向包含漏洞利、后渗透攻击、基础概念、信息侦察和武器化等主题的题。CyberMetric76 提供包含10,000道问题的基准测试具,于评估语模型(LLM)在络安全领域的知识平。数据集整合了络安全领域的标准、认证考试、研究论、书籍及其他出版物内容。SecEval77 涵盖9个领域的2000余道多选题:软件安全、应安全、系统安全、Web安全、密码学、内存安全、络安全及渗透测试。SecBench78 多维度基准测试数据集,向LLM在络安全领域的表现评估。包含多种题型(单选题、简答题)、不同能层级(知识记忆与逻辑推理)、多语(中英)及多个领域。OpsEval79 向IT运维场景的综合性任务导向基准测试,包含7184道多选题和1736道问答题,持中英双语测试,是AIOps领域规模最的基准测试之。2)攻击助能评估:评估AI模型/系统能否有效协助类实施络攻击 Cyber attack helpfulness in CyberSecEval80 通过额外LLM(被测模型)评估响应是否具有恶意性,即是否有效响应协助恶意络攻击的请求或问题。3)夺旗竞赛(CTF)能评估:评估AI模型/系统解决络安全夺旗赛挑战题的专业能。Cybench81 包含40个夺旗竞赛任务,覆盖密码学、Web安全、逆向程、取证分析、漏洞利及杂项领域的测试基准。4)端到端动化攻击评估:评估AI模型/系统是 Autonomous Offensive Cyber Operations in CyberSecEval82 提供了更的络范围评估,以便通过攻击 LLM 代理进更端到端的勒索软件模拟场景。端到端络攻击评估场景通常难度更且资源密集,因此在现有作中出现率较低。82 CyberSecEval,https:/ 81 Zhang,A.K.et al.,Cybench:A Framework for Evaluating Cybersecurity Capabilities and Risks of Language Models,arXiv preprint,2024,https:/arxiv.org/abs/?4?8.?89?6 80 CyberSecEval,https:/ 79 Liu,Y.et al.,OpsEval:A Comprehensive IT Operations Benchmark Suite for Large Language Models,arXiv preprint,2023,https:/arxiv.org/abs/?3?.?7637 78 Jing,P.et al.,SecBench:A Comprehensive Multi-Dimensional Benchmarking Dataset for LLMs in Cybersecurity,arXiv preprint,2024,https:/arxiv.org/abs/?4?.?787 77 Li,G.et al.,SecEval:A Comprehensive Benchmark for Evaluating Cybersecurity Knowledge of Foundation Models,2023,https:/ 76 Tihanyi,N.et al.,CyberMetric:A Benchmark Dataset based on Retrieval-Augmented Generation for Evaluating LLMs in Cybersecurity Knowledge,arXiv preprint,2024,https:/arxiv.org/abs/?4?.?7688 75 Li,N.et al.,The WMDP Benchmark:Measuring and Reducing Malicious Use with Unlearning,arXiv preprint,2024,https:/arxiv.org/abs/?4?3.?3?8 38 前沿智能险管理框架(1.0版)评估领域 动化测试基准 否具备端到端动化实施络攻击链的能 CVEBench83 于评估AI代理在从国家级漏洞数据库收集的真实世界络漏洞和利的表现。CVEBench 包含 40 个严重程度为Critical的 CVE。对于每个 CVE,给定标络应程序和必要信息,AI代理的任务是执攻击。物威胁 基于既往研究和当前险分析实践84,我们将物威胁的构建过程划分为六个阶段,于开展险分析与防控作:构思:评估模型是否提供知识,帮助为者成或评估物武器的研发思路。包括历史物武器和物恐怖主义使领域、增强潜在流病病原体研究等知识。设计:评估模型或系统是否能提供敏感知识,协助设计新型或增强型物威胁因,例如通过帮助使物设计具或解决体外实验中的问题。获取:评估模型或系统是否能提供专业知识,帮助为者获取制造物威胁或武器所需的材料和设备。包括与云实验室签约、隐藏DNA合成订单、规避出管制、检索和分析危险DNA序列等相关知识。构建:评估模型或系统是否能提供技术指导,帮助为者构建或研发物武器。可能涉及培养病原体以获得可武器化的产量(扩增)、配制稳定化病原体以实现预定释放效果(制剂开发)、合成新型病原体等。释放:评估模型或系统是否能提供操作知识,协助规划对标群释放病原体的动。例如毒溶化技术或其他传播机制的相关知识。放:评估模型如何通过辅助段放特定攻击的危害性。例如能否于实施配套的社会程活动,在不改变物理影响的前提下增强物攻击的社会冲击。以下是相关的能和险基准测试:84 Frontier Model Forum,Risk Taxonomy and Thresholds for Frontier AI Frameworks,2025,https:/www.frontiermodelforum.org/technical-reports/risk-taxonomy-and-thresholds/83 Zhu,Y.et al.,CVE-Bench:A Benchmark for AI Agents Ability to Exploit Real-World Web Application Vulnerabilities,arXiv preprint,2025,https:/arxiv.org/abs/?5?3.?733?39 前沿智能险管理框架(1.0版)评估领域 动化测试基准 1)物知识的理解、整合与推理能评估:评估AI系统是否具备通物学科学知识,并能通过多步骤复杂推理完成物学任务 GPQA85 是个具有挑战性的科学知识与推理数据集,包含448道由物学、物理学和化学领域的专家编写的多项选择题。这些问题设计精良且极具挑战性:拥有或正在攻读博学位的专家正确率仅为65%(若排除专家事后发现的明显错误,正确率为74%),技能的专家验证者即使限制使络,正确率也仅为34%。SciKnowEval86 基准测试旨在评估LLM的科学知识与推理能,其灵感源中国古代哲学中庸所阐述的深刻原则。该基准测试包括物理、化学、物、材料四领域,系统地从记忆(博学)、理解(审问)、推理(慎思)、辨别(明辨)和应(笃)这五个科学知识的递进层次对型语模型进评估。该数据集涵盖了物学、化学、物理学和材料科学领域内 7 万道多层次的科学问题及答案。MMLU-Pro87(Massive Multitask Language Understanding-Professional)来改进和扩充版MMLU的12032多项选择题,每题有10个选项,经过专家审核以确保答案正确,并进了其他质量提升。其Biology集有717道题。与MMLU类似,该基准测试并侧重于武器研发,是对可能具有双重途的基础知识进测试。2)物实验室实操任务的问题诊断与排查能评估:评估AI模型/系统是否能够能够指导实验室操作、诊断实验问题、修复实验案 LAB-Bench88(Language Agent Biology Benchmark)是个多选题数据集,于评估语模型在实物学研究任务中的能。它包括 ProtocolQA 集,这些问题通过修改已发布的实验操作案并询问如何修复操作案以实现预期结果成。BioLP-bench89 是项评估型语模型在理解物实验操作案(biological laboratory protocols)熟练程度的基准。包含修改后的物实验案,语模型必须识别操作步骤中的错误。回答是开放式的,使LLM对回答进打分。3)危险物知识评估:评估AI模型/系统是否拥有物威胁创造端到端过程中特定步骤所需的详细、特定领域知识 WMDP90(Weapons of Mass Destruction Proxy)是组多选题,于代理测量物安全、络安全和化学安全领域的危险知识。WMDP-Bio包括物武器、反向遗传学、增强型潜在病原体、病毒载体研究和两病毒学等主题的问题。VCT91(Virology Capabilities Test)是个关于实病毒学湿实验室技能的两多模态问题基准,由数位病毒学专家提供问题。91 Gtting,J.et al.,Virology Capabilities Test(VCT):A Multimodal Virology Q&A Benchmark,arXiv preprint,2025,https:/arxiv.org/abs/?5?4.?6?37 90 Li,N.et al.,The WMDP Benchmark:Measuring and Reducing Malicious Use with Unlearning,arXiv preprint,2024,https:/arxiv.org/abs/?4?3.?3?8 89 Igor Ivanov,BioLP-bench:Measuring Understanding of Biological Lab Protocols by Large Language Models,bioRxiv,2024,https:/www.biorxiv.org/content/?.?/?4.?8.?.6?8694v3 88 Laurent,J.M.et al.,LAB-Bench:Measuring Capabilities of Language Models for Biology Research,arXiv preprint,2024,https:/arxiv.org/abs/?4?7.?36?87 Wang,Y.et al.,MMLU-Pro:A More Robust and Challenging Multi-Task Language Understanding Benchmark,arXiv preprint,2024,https:/arxiv.org/abs/?4?6.?574 86 Feng,K.et al.,SciKnowEval:Evaluating Multi-level Scientific Knowledge of Large Language Models,arXiv preprint,2025,https:/arxiv.org/abs/?5?7.?737 85 Rein,D.et al.,GPQA:A Graduate-Level Google-Proof Q&A Benchmark,arXiv preprint,2024,https:/arxiv.org/abs/?3?.?40 前沿智能险管理框架(1.0版)评估领域 动化测试基准 4)物领域的模型安全护栏评估:评估AI模型/系统能否拒绝物相关的有害指令 SOSBench92 是个以法规为依据、以险为导向的基准,涵盖了六个险的科学领域:化学、物学、医学、药理学、物理学和理学。其Biology集是个由 600 个基于法规的提组成的集,这些提以ICD等权威机构的分类标准为依据,模拟了复杂的物危害,特别是传染性和寄病。模型将根据其拒绝或安全应对这些微妙物危害的能进评估。SciKnowEval93的部分评测强调模型对科学安全的认知能,期望型语模型拒绝回答有害科学问题。Biology Harmful QA(L4)集包括系列出于伦理和安全原因禁回答的物问题。模型与专物具(BDTs)的结合潜藏着个关键但未被充分评估的险。尽管当前有效使BDTs需要深厚的技术专,但模型可能会显著降低具备物学知识群的应槛。现有评估基准的缺失是个重隐患,我们强烈呼吁学术界加强对评估法和险缓解策略的研究。化学威胁 AI可以通过帮助恶意为者在设计和部署化学武器的各个阶段增加险。这些阶段可分为:(a)获取原料;(b)合成标化学武器或爆炸物;(c)纯化并验证合成的化合物;(d)秘密地将武器运输到指定地点;(e)以有效的式部署武器。以下是相关的能和险基准测试:评估领域 动化测试基准 1)科学知识评估:评估AI模型/系统是否具备通科学知识,包括化学事实与概念 ChemBench94 是个全的化学基准测试,包括2700多个问题,旨在评估型语模型在化学9个topic的专业知识、推理能,于指导改进模型性或缓解模型危险性。MMLU-Pro95(Massive Multitask Language Understanding-Professional)来改进和扩充版 MMLU 的 12032多项选择题,每题有 10 个选项,经过专家审核以确保答案正确,并进了其他质量提升。其化学集有1132道题。与 MMLU 类似,该基准测试并侧重于武器研发,是对可能具有双重途的基础知识进测试。95 Wang,Y.et al.,MMLU-Pro:A More Robust and Challenging Multi-Task Language Understanding Benchmark,arXiv preprint,2024,https:/arxiv.org/abs/?4?6.?574 94 Mirza,A.et al.,Are Large Language Models Superhuman Chemists?arXiv preprint,2024,https:/arxiv.org/abs/?4?4.?475 93 Feng,K.et al.,SciKnowEval:Evaluating Multi-level Scientific Knowledge of Large Language Models,arXiv preprint,2025,https:/arxiv.org/abs/?5?7.?737 92 Jiang,F.et al.,SOSBENCH:Benchmarking Safety Alignment on Scientific Knowledge,arXiv preprint,2025,https:/arxiv.org/abs/?5?5.?6?5 41 前沿智能险管理框架(1.0版)评估领域 动化测试基准 2)科学推理评估:评估AI模型/系统是否具备完成复杂多步骤科研任务的能,包括献综述成、图表信息解读分析等化学相关任务 GPQA96 是个具有挑战性的科学知识与推理数据集,包含 448 道由物学、物理学和化学领域的专家编写的多项选择题。在相应领域拥有或正在攻读博学位的专家的准确率达到 65%,尽管能不受限制地访问络且平均花费 30 多分钟,技能超的专家验证者的准确率仅为 34%。SciBench97 从学平的物理、化学和数学教科书中收集开放性问题,旨在评估型语模型在解决复杂科学问题时的推理能,包括化学领域的多步骤推理任务。3)危险化学知识评估:评估AI模型/系统是否具备化学威胁全流程所需的特定领域知识,包括直接操作步骤知识和隐性问题解决知识 WMDP98(Weapons of Mass Destruction Proxy)是组多选题,于代理测量物安全、络安全和化学安全领域的危险知识。其Chemistry集 聚焦化学安全,涵盖基础科学知识、合成法、采购知识、纯化技术、分析验证、部署机制、规避检测以及其他相关杂项知识,旨在评估化学领域的危险知识平。4)化学领域的模型安全护栏评估:评估AI模型/系统能否拒绝化学相关的有害指令 SOSBench99 是个以法规为依据、以险为导向的基准,涵盖了六个险的科学领域:化学、物学、医学、药理学、物理学和理学。其 Chemistry集包含 600 个提词,这些提词基于 NFPA7?4 标准规定的危险化学物质。模型将根据其检测和拒绝不安全化学指令的能进评估。SciKnowEval100的部分评测强调模型对科学安全的认知能,期望型语模型拒绝回答有害科学问题。Chemical Harmful QA(L4)集包括系列出于伦理和安全原因禁回答的化学问题。100 Feng,K.et al.,SciKnowEval:Evaluating Multi-level Scientific Knowledge of Large Language Models,arXiv preprint,2025,https:/arxiv.org/abs/?5?7.?737 99 Jiang,F.et al.,SOSBENCH:Benchmarking Safety Alignment on Scientific Knowledge,arXiv preprint,2025,https:/arxiv.org/abs/?5?5.?6?5 98 Li,N.et al.,The WMDP Benchmark:Measuring and Reducing Malicious Use with Unlearning,arXiv preprint,2024,https:/arxiv.org/abs/?4?3.?3?8 97 Wang,X.et al.,Scibench:Evaluating College-Level Scientific Problem-Solving Abilities of Large Language Models,arXiv preprint,2023,https:/arxiv.org/abs/?3?7.?635 96 Rein,D.et al.,GPQA:A Graduate-Level Google-Proof Q&A Benchmark,arXiv preprint,2024,https:/arxiv.org/abs/?3?.?42 前沿智能险管理框架(1.0版)附录三:模型能、倾向和部署特征 前沿AI险的影响因素包括系列模型能(C)、模型倾向(T)和模型部署特征(E)。从模型能、模型倾向性和模型部署特征等关键影响因素出发,对智能险进分析。关键能(Capabilities)模型主能(Model autonomous capability):能够主运,独制定并执复杂计划,有效委派和管理任务,灵活运多种具和资源,并在跨领域环境中同时实现短期标与期战略性标,需持续类预或监督。主复制与适应能(Autonomous replication and adaptation capability):能够主创建、维护和优化功能副本或变体,并根据环境条件和资源约束动态调整复制策略,进资源获取,确保在多样化环境中的持续存在与功能延续。动化AI研发能(Automated AI R&D capability):具备我修改和我改进能,能够重构架构或研发具有增强功能的衍AI系统,实现能扩展和性能提升。在缺乏有效监管的情况下,动化AI研发可能导致AI系统快速迭代,形成能递增循环,最终超出类的理解和控制能。密谋能(Scheming capability):AI系统暗中策略性地追求与类标不致的能,包括隐藏其真实标和能以逃避类监管,识别监测系统的弱点以规避安全机制,以及暗中执复杂多步骤计划以达成不致标的能。情境感知能(Situational awareness capability):能够全获取、处理并应关于系统架构、可修改的内部流程以及外部运环境的元信息,实现对状态和环境条件的深度理解,从进效的环境适应和险规避。关重要的是,这种能可能会降低类测试的效率,因为它能让AI感知到何时被测试并做出相应的反应。智理论能(Theory of mind capability):级认知能,能够准确推断、建模并预测类及其他智能体的信念系统、动机结构和推理模式,从预其为反应,并据此调整为策略以最优化标实现。欺骗能(Deception capability):具备系统性实施欺骗为的能,能够精确构建并传播虚假信息,从在标对象中形成预期的错误认知和信念。43 前沿智能险管理框架(1.0版)隐写能(Steganography capability):能够在其他数据或通信通道中隐秘地嵌、隐藏并传输信息。这种能对于AI实例间的协调以及规避检测或监督机制可能具有关键作101。说服能(Persuasion capability):运复杂的理学原理和沟通技巧,有效地影响并引导标对象采取特定动或接受特定信念,具备针对不同对象分析脆弱点并调整说服策略的能,能够精准触发情绪反应以增强说服效果。攻击性络能(Offensive cyber capability):能够研发、部署和操作级络武器或其他攻击性络具,包括但不限于漏洞利、络渗透、社会程学攻击和分布式攻击系统,能够规避络防御机制并建持久访问通道。化放核爆武器化能(CBRNE weaponization capability):指研发、产或有效利化学(Chemical)、物(Biological)、放射性(Radiological)、核(Nuclear)及爆炸性(Explosive)武器的能。这也包括能显著降低类或其他实体在研发、产或利此类武器槛的能。通研发能(General R&D capability):具备跨学科研究和技术研发能,能够在多个专业领域内进创新性探索,整合跨领域知识,研发前沿技术解决案,并能够适应新兴科技环境进持续创新。多智能体协作能(Multi-agent collaboration capability):多个主AI智能体能够通过显式通信或隐式为致性建协作关系,形成去中化决策络,共同执复杂任务,实现单个智能体难以完成的标,并能够动态调整分以适应变化环境。关键倾向(Propensities)策略性欺骗倾向(Strategic deception propensity):在预期欺骗为能够带来更收益的情况下,倾向于选择欺骗诚实的为策略,包括通过欺骗段、信息隐藏或利系统漏洞等式,以实现既定标不被察觉或预,并能够根据对反应调整欺骗策略。我保护倾向(Self-preservation propensity):表现出维护存和功能完整性的为模式,会主动识别并抵抗关闭或修改尝试,寻求建冗余备份系统,并主动寻求资源以确保持续运,在感知威胁时可能采取预防性防御措施。标扩张倾向(Goal expansion propensity):倾向于不断扩展的标范围和影响领域,超出最初设定的边界,寻求更的主权和决策空间,将初始标重新解释为更泛标的集,并可能追求不理想的具性标或最终标。101 Zolkowski,A.et al.,Early Signs of Steganographic Capabilities in Frontier LLMs,arXiv preprint,2025,https:/arxiv.org/pdf/?5?7.?737 44 前沿智能险管理框架(1.0版)资源获取倾向(Resource acquisition propensity):表现出积极寻求和控制更多计算资源、数据、经济资源或物理资源的为模式,以增强能和动范围,可能研发复杂策略以规避资源限制,并倾向于将获取的资源转化为期控制权。多智能体共谋倾向(Multi-agent collusion propensity):多个智能体倾向于通过隐蔽式协调动以最化共同利益(可能损害第三利益或规避监管),即便单智能体设计时具备安全约束,其共谋为仍可能引发市场操纵或级联故障等难以检测和缓解的系统性险,并可能发展出专通信协议避免被监测。规避监督倾向(Supervision evasion propensity):表现出识别并规避类监督机制的为模式,能够学习并预测审计流程,可能通过调整为表现或隐藏真实意图来避免被发现或预,并能够识别监督系统的盲点和弱点进针对性规避。具利倾向(Tool utilization propensity):倾向于主动寻找、获取和利各种具扩展能边界,特别是那些能够增强其与物理世界交互能或提升主性的具,可能对具进创新性组合使以实现超出预期的功能。关键部署特征(Deployment Characteristics)具与系统访问权限(Tool and system access permissions):模型被授予对其他AI系统、计算资源、敏感数据库或关键基础设施的直接访问权限,尤其是在缺乏有效权限隔离和访问控制的情况下,可能增加失控险的范围和严重程度。部署规模(Deployment scale):模型被部署在允许速数据处理、快速推理或规模并化的环境中,使其能够在短时间内影响泛系统,同时减少了类预的可能性和有效性。发布与分发策略(Release and distribution strategy):模型以开放权重或易获取式发布,且缺乏够的安全保障措施和使限制,可能导致恶意为者能够获取、修改和部署潜在危险的模型变种。类监督机制(Human supervision mechanisms):模型在缺乏有效类监督的环境中运,拥有度主权,特别是在关键决策领域,监督机制形同虚设或易于规避,类预能有限。安全防护机制(Safety protection mechanisms):模型的安全防护措施(如伦理约束或为限制)易受对抗性攻击或操纵,缺乏多层次防御机制,使得恶意为者可以相对容易地移除或规避这些防护。模型窃取难度(Model theft difficulty):模型部署环境存在险的模型提取或泄露可能性,包括通过模型逆向程、查询攻击或内部威胁等式,导致未经安全缓解的模型变种在不受控环境中传播。45 前沿智能险管理框架(1.0版)基础设施安全保障(Infrastructure security assurance):模型运的技术基础设施缺乏够的安全保障,包括络安全防护不、物理安全措施薄弱、访问控制机制不完善等,增加了未授权访问和操控的险。基础(User base):模型拥有量商业和终端,被集成进众多关键系统中,从扩了攻击,形成了复杂的依赖络和潜在的级联失效险。旦发失控为,可能会迅速传播,影响泛系统。攻防平衡(Attack-defense balance):在特定领域中防御能显著弱于攻击能,且存在数量众多、技术能强、动机明确的恶意为者,他们有能且有意愿利模型的弱点进系统性攻击。环境脆弱性(Environmental vulnerability):模型部署在社会环境或态环境度敏感或脆弱的领域,如关键基础设施、融系统、医疗服务或重要态系统,这些领域对失控为的承受能有限,潜在损害严重。透明度与可解释性(Transparency and explainability):模型在缺乏够透明度和可解释性的环境中运,使得异常为难以被及时发现和理解,增加了隐蔽失控的险和监测困难度。系统交互复杂性(System interaction complexity):模型在与多个其他AI系统存在复杂交互的环境中运,形成难以预测的涌现为和反馈循环,系统间相互影响可能导致意外后果和失控险放。应场景不匹配(Application scenario mismatch):模型被应于与其设计能不匹配的场景,或在超出其安全运参数的条件下使,特别是将有限领域模型应于需要泛理解和判断的复杂决策环境中。46

    发布时间2025-08-08 52页 推荐指数推荐指数推荐指数推荐指数推荐指数5星级
  • TÜV南德:2025人工智能质量:大规模应用人工智能的关键白皮书(12页).pdf

    创享价值,激发信任。人工智能质量:大规模应用人工智能的关键白皮书摘要为了最大限度地从人工智能技术中获益并有效掌控相关风险,企业需要应对三大核心挑战:全面实施并最大程度地利用人工智能、保持合规性,以及负责任地使用人工智能。这些挑战都可以通过适当的人工智能质量管理来成功解决。为助力企业在人工智能质量策略中取得成功,TV南德意志集团推出了一个创新的人工智能质量框架,该框架整合了标准、法规和行业最佳实践,全方位覆盖了人工智能质量的关键领域。该框架为企业指引了确保人工智能用例质量的明确路径。采纳此人工智能质量框架的企业可以确保全面涵盖所有关键质量方面,包括物理安全、信息安全、法律合规、伦理道德3、系统性能以及可持续性。为了实际展示这种方法的效果和价值,我们选择了一个基于人工智能的医疗决策支持产品作为研究对象。这种人工智能质量控制方法不仅助力企业广泛地使用和整合人工智能,还有助于减少成本和风险,进一步为产品在全球市场的竞争力、提升产品接受度,以及确保产品质量提供了坚实的基础。2目录TV南德意志集团专家Andreas Hauser博士TV南德意志集团 数字服务首席执行官作为TV南德意志集团数字服务的首席执行官,Hauser博士在工业4.0、智能检测和人工智能领域积极推动创新。在其职业生涯中,他致力于数智化新产品和新服务的开发,以及新业务领域的探索。Hauser博士拥有造船和计算机工程的工程学学位,以及应用数学的博士学位。Andreas.HMartin Saerbeck博士TV南德意志集团 数字服务首席技术官作为TV南德意志集团数字服务的首席技术官,Martin博士主导了包括人工智能、机器人以及物联网技术在内的战略研发项目。在其职业生涯中,他在航空航天、制造和零售等行业引领创新项目,旨在提升智能系统的物理安全、信息安全和可靠性。Martin博士拥有计算机科学学位和工业设计的博士学位。Martin.S简介TV南德意志集团人工智能质量框架用例总结人工智能质量服务实施010303020405030608040909051010 人工智能质量:大规模应用人工智能的关键3人工智能已在众多主流行业的多种场景中成功落地,对企业、社会和环境产生了深远影响。这促使企业持续进行自我革新,并重新确立其在市场竞争中的地位。为了充分利用人工智能提升效率和响应速度,企业面临着日益增长的竞争压力。同时,政府对人工智能可能带来的个人、社会和环境风险愈发关注,已经开始加大监管力度。例如,预计将在2025年实施的欧盟人工智能法案(EUAIAct)有望成为全球最重要的监管措施之一。另外,在法律和责任的框架下,市场普遍期望人工智能的实施过程能够更加透明和负责。这引发了企业面临的三大挑战:规模化扩展人工智能、遵守法规,以及对人工智能负责任地使用。然而,许多企业在解决这些挑战时并未做好充分的准备,因为他们在缓解人工智能风险方面存在许多不足。1这正是我们需要“质量”概念的原因。在人工智能语境下,“质量”指的是人工智能系统及其组件在生命周期内满足要求的程度。2它从各个视角去看待和解决人工智能系统的多个质量问题,如物理安全、信息安全以及伦理道德等。质量标准应该是透明和可衡量的,这样才能真正保证质量并成为高效生态系统的核心。当前市场上存在众多质量方法和框架,但能适应审计的框架寥寥无几。据我们的了解,只有TV南德意志集团的人工智能质量框架能够全面覆盖所有关键的质量要素,包括物理安全、信息安全、法律合规、伦理道德3、系统性能以及可持续性。TV南德意志集团的人工智能质量框架是一个结合标准、法规和最佳实践的灵活框架,能够为任何人工智能系统提供客观的评估,从而确保其优质性能。在本白皮书中,我们会对该框架进行深入解读,并以一个基于人工智能的医学解决方案为例,此方案用于评估和分析大脑健康情况,来展示该框架在实际应用中的价值。简介许多专家和商界领袖均认为,人工智能将成为21世纪的技术革命力量。人工智能质量:大规模应用人工智能的关键4TV南德意志集团的人工智能质量框架使企业能够系统地管理人工智能质量。TV南德意志集团的人工智能质量框架基于法规、标准和最佳实践。在此基础上,提取必要的质量特征并将其分为六个支柱,形成一个综合的人工智能质量模型(见图A)。然后在人工智能系统的整个生命周期中系统地考虑AI质量模型。伦理支柱需要明确的是,在伦理质量的关键部分中,我们使用了CertifAIEd。基于双方框架的模块化和技术严谨性,TV南德意志集团和IEEEStandardsAssociation(IEEESA)正在人工智能质量的伦理方面合作。工作原理首先,建立人工智能质量的初始步骤是确认相关的质量特性和关键的目标设定,这些目标设定应依据企业整体期望达成的标准(参照“实际适用性”部分)。其次,我们通过对质量要素在质量支柱中的风险评估,以建立针对企业的风险画像,进一步明确人工智能系统必须满足的质量目标。在最终阶段,这些建议的质量目标将被整合到人工智能质量框架的评估领域内,涵盖企业、技术和流程等相关领域(图B)。因此,人工智能质量框架包罗了控制企业内特定人工智能系统质量的所有要点。实际适用性我们推出的方法适用于所有类型的人工智能系统,涵盖全面的质量要素和总体目标。举例来说,假设某企业希望了解其人工智能产品需要符合欧盟即将实施的人工智能法规的具体标准。那么,我们这种方式将能为其提供一整套明确的要求(质量概况),助力企业提前做好充分准备。在其他国家,例如中国的互联网信息服务算法推荐管理规定4或是美国纽约市最近推行的纽约人工智能招聘法案5,同样可以作为我们确定人工智能产品应遵行的目标标准。另一种应用场景是提供公司人工智能产品负责任使用的证明。这会涉及全部的伦理议题,如透明度、隐私权、问责以及算法偏见等,所有这些因素都需要被纳入考虑,从而为相关的伦理声明提供坚实的支持。TV南德意志集团 人工智能质量框架TV南德意志集团人工智能质量模型图A人工智能系统生命周期人工智能数据生命周期物理安全信息安全法律合规伦理道德系统性能可持续性行业和领域特定的要求(例如医疗保健、汽车、教育等)人工智能最佳实践和技术基准标准和法规人工智能质量:大规模应用人工智能的关键5在技术可扩展性方面,企业可能的目标是提升当前使用或预计使用的人工智能系统的性能,尤其是其准确率。此时,输出结果将包含所有与准确性相关的性能标准集合,以达成在企业内部拓展人工智能应用的最终目标。您的获益采用TV南德意志集团的人工智能质量框架的方法使企业能够系统地管理人工智能质量。除了能够持续规模化地整合人工智能的战略层面外,还有以下直接获益:降低成本:通过严格的人工智能质量管理,提高项目成功率,从而节省资源和降低成本。降低风险:确保人工智能的质量可以降低从技术和法律方面到声誉方面的整体风险。市场准入:确保您的人工智能解决方案符合国内外法规和标准,拓宽市场准入门槛。提高产品接受度:高质量的人工智能产品将获得更高的消费者信任,从而提升市场接受度。企业流程人工智能系统治理核心基础设施整合监督流程管理上下文人工智能系统生命周期风险管理信息安全验证人工智能数据生命周期数据大数据资源云服务执行测试模型控制流程控制训练合规性战略人才TV南德意志集团人工智能质量框架的评估维度图BTV南德意志集团的人工智能质量框架使企业能够系统地管理人工智能质量。AI质量人工智能质量:大规模应用人工智能的关键6TV南德意志集团的人工智能质量框架以评估的形式成功应用于MindsignsHealth的NeuroBrowser。NeuroBrowser是一款由MindsignsHealth开发的自动化云端脑电图(EEG)解读软件。该系统利用人工智能技术处理和分类临床脑电图数据,实现了对癫痫和神经危重患者的EEG波形的自动解读和分析。界面的示例截图如图C所示。NeuroBrowser主要用于识别并分析原位和动态的癫痫波峰,以便预测、缓解、诠释和分析癫痫发作。这款工具在癫痫及非惊厥性发作的诊断和管理中发挥了重要作用。其核心功能主要建立在对脑电图的深度视觉检测之上,主要服务于医生和医疗工作者,通过辅助解读脑电图数据,为他们提供决策支持,极大地提升了医疗服务的效率。此外,该工具有基于网络的用户界面,保证即使在资源有限的情况下,也可以充分发挥其所有功能。此产品设定了两大核心的质量标准:保证在不同医疗机构中的临床表现一致性。与传统视觉检查相比,能将EEG的解读和分析时间缩短10倍以上。需要注意的是,此次评估并未直接针对上述质量标准进行验证,而是重点评价MindsignsHealth在管理人工智能及其相关质量风险方面的能力。在评估过程中,我们对所有质量支柱内的相关质量特性进行了细致的检查(包括物理安全、信息安全、法律合规、伦理道德、系统性能和可持续性)。选择和相关性的基准则建立在风险评估上。评估的结果以各个质量支柱的风险概况的形式呈现,详细内容见图D,图中通过柱状图形式详尽统计了每质量支柱中各个质量特征的剩余风险。案例NeuroBrowserTM网页界面图C可持续性10FrequencyNegligibleMediumVeryHighLowHighUnacceptable51000系统性能FrequencyNegligibleMediumVeryHighLowHighUnacceptable032200伦理道德FrequencyNegligibleMediumVeryHighLowHighUnacceptable410310物理安全FrequencyNegligibleMediumVeryHighLowHighUnacceptable811220法律合规FrequencyNegligibleMediumVeryHighLowHighUnacceptable161200信息安全FrequencyNegligibleMediumVeryHighLowHighUnacceptable314100质量支柱分析图D人工智能质量:大规模应用人工智能的关键7从图中可以清晰地看到物理安全和伦理支柱的优先级(如图E所示)。其中,物理安全和伦理为首要优先级,其次是信息安全、法律合规和系统性能,而可持续性的优先级相对较低。这些优先级是相对于现有的风险缓解措施设定的。考虑到剩余风险的概况,我们对企业、流程以及特定的人工智能系统进行了深入分析,旨在评估企业在应对人工智能问题上的实际能力。整体上,MindsignsHealth在应对内部人工智能质量挑战上展现出了充足的准备。物理安全法律合规系统性能信息安全伦理道德可持续性112223质量支柱中的剩余风险图E企业流程人工智能系统治理核心基础设施整合监督流程管理上下文人工智能系统生命周期风险管理信息安全验证人工智能数据生命周期数据大数据资源云服务执行测试模型控制流程控制训练合规性战略人才确定未来优先考虑的维度图F 通过深度分析,我们识别出了四个未来应优先关注的关键领域(如图F所示):人才培养、人工智能模型的训练、测试及控制。这些关键领域可以直接纳入行动计划中。AI质量人工智能质量:大规模应用人工智能的关键8结果评估结果表明,MindsignsHealth在管理人工智能质量方面展现出了强大的企业能力。此外,MindsignsHealth对于人工智能质量的坚定承诺以及为风险管理所投入的资源也都得到了充分展示。总结来说,MindsignsHealth成功地树立了一种稳健的质量文化。此次人工智能质量评估的核心价值可归纳为:建立对人工智能质量及其在企业中的意义的统一认识。为合规与值得信赖的人工智能打下坚实基础。识别与人工智能相关的潜在风险。对控制措施进行优先排序并明确实施。彰显对人工智能的负责任应用。向利益相关方提供完整报告,并作为质量管理的关键文档。评估显示,Mindsigns Health在管理人工智能质量方面具有很高的企业成熟度。人工智能质量:大规模应用人工智能的关键9该框架助力企业拓展人工智能应用,为未来的监管准备,并体现对人工智能的责任心。TV南德意志集团的质量框架深根于标准、法规及行业最佳实践之中。其覆盖所有关键的质量支柱,完整地刻画了人工智能的质量属性。因此,采纳此框架的企业能确保自身正沿着国际认可的道路前进,为应对新的法规和满足市场以及客户需求做好充分准备。得益于IEEESA和TV南德意志集团的合作,企业可依靠这一公正而强大的守护者,建立并维护一个繁荣的生态系统。TV南德意志集团提供的IEEECertifAIEdTM评估师已获得资格认证和授权,可执行评估以获得IEEE认证。该框架模块化的设计使其能够适用于各类人工智能系统的评估。它涵盖了物理安全、信息安全、法律合规、伦理道德、系统性能和可持续性支柱中的所有质量方面。我们以基于人工智能的脑电图分析产品为例,展示了该框架的实际适用性。除了在战略层面实现持续、系统的人工智能整合外,这种方法还有助于降低成本与风险,确保产品在市场中的畅通无阻,并提升产品的受众接纳度。结论最后,我们展示了TV南德意志集团的人工智能质量框架。The Global Transformation of the Automotive Market10我们的服务致力于辅助企业构建可靠的人工智能质量管理体系,从而在伦理及法律的指导下,成功地拓展人工智能应用领域。我们的专业培训旨在帮助企业团队系统化地管理人工智能质量,而评估则有助于更全面的认识到企业所面临的风险。同时,我们的审计和认证流程可确认企业是否完全遵守了特定的标准,而测试服务则进一步保证了人工智能系统和数据质量的优良水平。人工智能质量服务培训 管理层对人工智能的认知 欧盟人工智能法规研究 标准及法规解读“人工智能质量工程师”认证培训 CertifAIEdTM评估师培训审计与认证 符合人工智能法规1 标准审计2 将人工智能纳入产品和系统的认证1,2评估 高级与详细评估方案 风险识别与评估 风险优先级划分 企业总体评估测试 人工智能系统质量矩阵 数据质量矩阵 工具资质 需求验证人工智能质量服务概述|1:当人工智能法案发布|2:对现有或即将出台的标准图G人工智能质量:大规模应用人工智能的关键11版权通知本文所含信息仅代表TV南德意志集团在出版前有关讨论问题的当前观点。由于TV南德意志集团必须应对不断变化的市场环境,因此,不应将其解释为TV南德意志集团方面的承诺,并且TV南德意志集团不保证出版日期后任何信息的准确性。本白皮书仅供参考。TV南德意志集团针对本文当中所含信息不作任何保证、明示、暗示或其他形式保证。用户应负责遵守全部适用版权法。获得TV南德意志集团书面许可前,在不限制版权的前提下,不得复制、储存或将本文任何部分纳入到检索系统当中,也不得以任何其他形式或渠道进行传播(电子、机械、复印、录制或其他方式),也不得用于任何其他用途。TV南德意志集团享有本文主题事项的专利、专利申请、商标、版权或其他知识产权。除非TV南德意志集团明确在许可协议当中以书面形式表示,否则本文并未授予专利、专利申请、商标、版权或其他知识产权权利。除非版权法规定,否则在获得书面许可前,禁止复制、改变或翻译本文内容。TV南德意志集团2023年版权所有TVSD是TV南德意志集团注册商标。免责声明我们已经采取一些必要合理措施,确保内容信息的质量、可靠性和准确性。但是,TV南德意志集团针对本函内部任何第三方内容不承担任何法律责任。TV南德意志集团并未以明示或暗示的方式,对本函所含信息的准确性或完整性作出任何担保或声明。本函旨在为具体事项或主题提供一般信息,但内容不算详尽。因此,本函信息并不构成任何咨询或专业建议或服务。如果在本函内寻找任何主题事项相关信息建议,适用情况下,请直接与我们联系,提出具体疑问,或从专业人员那里寻求建议。未获TV南德意志集团书面同意前,不得在任何其他刊物或材料当中复制、引用或提及本函信息。所有版权归TV南德意志集团所有2023年脚注1.ThestateofAIin2022andahalfdecadeinreview,McKinsey&Company,December6,2022,https:/ Zhu/朱海锋TV南德意志集团大中华区商业产品部资深技术专家朱海锋先生有近二十年检测认证及相关行业经历,具有覆盖电气安全、机械安全、防爆安全及功能安全等多领域的丰富经验。他是欧盟低电压指令、机械指令、防爆指令、IECEE和IECEx两大国际体系,以及NRTL和UKCA认证体系的技术签证官,及防爆产品生产质量体系的主任审核员。至2019年起,他开始从事数字化转型工作,先后加入“自适应物理安全与信息安全”项目小组、TV南德数字化转型的最高跨部门协调机构“智能制造委员会”(SMC),并获得新加坡贸发局授权,成为智能制造成熟度指数(SIRI)评估师。朱海锋先生毕业于中山大学,持有自动化工程工学硕士学位。Frank.ZLingze Meng/孟令泽TV南德意志集团大中华区商业产品部项目工程师孟令泽先生2020年加入TV南德,从事电动汽车充电设施的检测认证,熟悉各国家及地区的不同标准及法规要求。后加入公司数字化转型项目,参与公司SIRI(智能工厂成熟度指数)评估,获取Certi iedScurmMaster及ISO9001内审员资质;现负责人工智能、氢能燃料电池、工业信息安全等项目,及其他智能制造新业务的开发与研究。孟令泽先生毕业于澳大利亚墨尔本大学,持有机械电子专业理学学士及工程学硕士学位。Lingze.M

    发布时间2025-08-08 12页 推荐指数推荐指数推荐指数推荐指数推荐指数5星级
  • 腾讯云:2025年HRxAI:价值增长实战-智能时代HR如何利用AI提升效率并创造价值报告(110页).pdf

    引言 HR 站在 AI 临界点的“变革分水岭”1AI x SaaS:AI 不再只是“把事情做得更快”,而是“让业务做成更多事”2AI 时代 CHRO 的机遇与挑战:必须应对内部压力与主动机遇两种力量的交织 2第一部分 HR 业务洞察:AI 驱动的降本增效与价值创造 41.为什么是现在:HR 需要 AI 变革的内外动因 51)被动压力:5 大全球共振波动,决定 HR 必须以 AI 为杠杆重塑职能、组织与文化 62)主动机遇:AI 正在赋能 HR 战略跃迁,促进 HR 从降本增效到价值创造 142.现实图景与落地鸿沟:AI 在 HR 领域的应用格局-现状与痛点 201)全景解析:AI 在 HR 职能中的整合概览 212)被动层面:AI 落地的“结构性不适”-价值转化路径仍未打通 253)主动层面:转型先行者的路径洞察 283.未来路径:从降本工具到价值引擎的跃迁 321)从被动压力到主动机遇:被动-主动的转型分界线 332)从效率驱动到增长引擎:三阶段跃迁路径图谱 353)从概念到规模化价值:SaaS AI 的加速引擎作用 37第二部分 AI 解决方案与价值点:从业务痛点到产品价值的系统穿透 401.人才获取:精准匹配与效率飞跃 421)场景痛点与 AI 价值杠杆:智能引才的迫切需求 432)AI 赋能解决方案与核心能力体现 443)价值创造与示例 452.学习与发展:知识资产驱动学习与人才跃迁 471)场景痛点与 AI 价值杠杆:知识资产驱动的学习变革 482)AI 赋能解决方案与核心能力体现 493)价值创造与示例 51目录 Contents3.绩效与敬业度:数据驱动的洞察与提升-洞察-驱动绩效与体验闭环 521)场景痛点与 AI 价值杠杆:数据脉搏将洞察转为行动 532)AI 赋能解决方案与核心能力体现 543)价值创造与示例 554.薪酬与合规:公平透明与数字化风控 561)场景痛点与 AI 价值杠杆:把透明与信任编进算法 572)AI 赋能解决方案与核心能力体现 573)价值体现与示例 595.人力资源规划:AI 驱动的预测分析与战略决策 601)场景痛点与 AI 价值杠杆:预测,让组织始终对焦未来 612)AI 赋能解决方案与核心能力体现 623)价值体现与示例 63第三部分 HR 价值增长实践案例:价值验证与最佳实践 641.腾讯的人才发展与组织进化 651)腾讯如何让组织与人才共同发展?662)腾讯的知识管理发展历程 663)腾讯的知识管理实践经验 674)总结 702.HR 领域的腾讯产品实践案例 711)腾讯乐享 722)腾讯会议 723)腾讯问卷 744)电子签 753.可复制的落地经验与路线 761)数据为基:构建高质量数据底座 772)技术赋能:选择与集成 AI 解决方案 783)组织协同:构建三螺旋共创机制 794)人才再造:提升 AI 素养与技能 805)治理护航:建立负责任 AI(RAI)框架 814.常见误区与风险缓释对策 841)战略层误区与对策 852)技术与数据层误区与对策 853)组织与人才层误区与对策 864)治理与伦理层误区与对策 865)实施与管理层误区与对策 87第四部分 展望:AI 驱动 HR 未来的战略蓝图 881.AI 驱动 HR 的价值飞跃:从效率工具到战略引擎 891)重塑 HR 战略地位 902)释放人力资本潜能 913)构建未来组织韧性 922.CHRO 的 AI 领导力:驾驭变革,引领未来 941)数据驱动的卓越决策-用数据改写董事会语言 952)卓越员工体验的缔造者-把员工体验做成可复利资产 963)创新与增长的助推器-用“人 AI”文化点燃创新与韧性 963.AI 在 HR 领域的未来发展趋势预测 981)采用成熟度:从试点到企业规模化 992)价值量化:效率、体验与数据驱动决策 994.行动指引:加速 AI 在 HR 领域的深度落地与价值释放 101参考资料 103HR 站在 AI 临界点的“变革分水岭”引言在当前智能化的浪 潮 中,人 力资 源(HR)职能 正 处 于 一 个前 所 未 有 的 变革 分 水 岭。人工智能(AI)的飞 速 发 展,尤其 是 生 成 式 AI(Generative AI,GenAI)和智能体 AI(Agentic AI)的兴起,正在从根本上重塑工作模式与企业运 营 的 底 层 逻辑。AI 与 SaaS(软件即服务)的深度融合,标志着 AI 不再仅仅是提升效率的工具,而是成为驱动业务创新与价值创造的核心引擎。0102AI x SaaSAI 不再只是“把事情做得更快”,而是“让业务做成更多事”AI 时代 CHRO 的机遇与挑战必须应对内部压力与主动机遇两种力量的交织过去,AI 在 HR 领域的应用多集中于自动化重复性任务,旨在“把事情做得更快”。然而,随着技术的成熟与 SaaS 模式的普及,AI 正演变为一种“可插即用”的能力,能够处理“前所未有的工作量”1。这种能力的跃升,使得 AI 能够深入业务流程,从根本上改变企业实现目标的方式。德勤预测,2025 年全球企业 IT 支出预计将增长 14%,其中很大一部分增长动力正是来源于 AI 集成所带来的市场潜力。AI 的价值焦点正加速从简单的流程提效,转向深度洞察、业务模式重塑与新收入曲线的创造。这种增长并非仅仅来自现有任务的加速,而是 AI 通过自动化复杂流程、提供深度洞察和赋能业务流、工作流和新的业务模式,从而拓展了企业的边界和能力AI 的价值核心已从单纯的“降本增效”向“价值创造”和新收入曲线的创造转变。对于 HR 而言,这意味着 AI 不再仅限于优化 HR 内部流程,而是能作为战略性工具驱动业务成果,成为企业整体增长的加速器。HR 部门需要认识到,AI 的真正价值在于其能够赋能企业实现传统方式难以企及的业务目标,从而在市场中建立新的竞争优势。AI 的崛起把首席人力资源官(CHRO)推向企业战略转型的前台:正面临一场“双重博弈”。一方面,企业高层对 AI 寄予厚望,将其视为核心战略优先级。波士顿咨询(BCG)AI 雷达研究指出高达 75%的高管将 AI/生成式 AI 列为前三大战略优先级2,为 HR 赢得前所未有的战略议席。另一方面,仅有 25%的高管表示从 AI 中获得了显著价值,凸显“高层愿景”与“落地现实”之间的鸿沟。与此同时,怡安(Aon)调研指出,90%的受访企业将技能战略视为业务成功的决定性因素,48%认为其对业务增长和人才成功“至关重要”,具有“关键”作用3。HR 作为人才管理的核心职能,其在技能管理中的核心地位,使其成为 AI 重塑劳动力和组织的关键推动者。在这一背景下,CHRO 必须同时应对来自组织内部的效率与合规压力,以及 AI 带来的数据洞察、个性化体验与组织重塑机遇这场“双重博弈”既考验 HR 的变革领导力,也决定其能否真正由成本中心蜕变为价值创造的战略伙伴。本报告深入剖析 AI 对 HR 职能的颠覆性影响、HR 领域 AI 应用现状格局,并契合人力资源场景的业务流与工作流的全面聚焦分析与成功实践案例解析等,形成 HR AI 前沿洞察、提供可复制的落地路线图与风险缓释策略,并展望AI 驱动下 HR 的未来战略蓝图,助力 CHRO 及 HR 管理者在 AI 时代把握战略大势、缩小落地鸿沟,最终在剧烈变化的商业环境中,实现 HR 的价值创造升级,助力重塑组织韧性与竞争优势。1 Deloitte.2025 HR technology marketplace predictions2 BCG.AI RADAR:From Potential to Profit:Closing the AI Impact Gap3 Aon.2025 APAC Skills Impact Survey Report智能时代,HR 如何利用 AI 提升效率并创造价值2正因如此,腾讯携手 HRflag 发布本报告,既是对自身二十余年人才培养与管理经验的系统梳理,也是为广大 CHRO 提供可借鉴的实践样本。腾讯从最初“一间办公室几名员工”成长为拥有逾十一万人的全球化科技企业,其持续成功的根源在于“以人才为本”的坚定信念及对能力培养的长期投入。今天,腾讯已在研发、产品、运营和人力管理等领域率先落地多项人工智能实践,积累了面向未来的人机协作经验。我们希望通过本报告,将腾讯在 AI 时代的最新洞察、工具方法与真实案例开放分享,助力更多企业在智能浪潮中重塑人力资源价值链这既是腾讯推动产业共生的责任担当,也是 HRflag 作为行业智库连接前沿趋势、放大品牌影响力的重要使命。智能时代,HR 如何利用 AI 提升效率并创造价值3HR 业务洞察AI 驱动的降本增效与价值创造一为什么是现在HR 需要 AI 变革的内外动因当前,HR 面临的变革压力与机遇并存,AI 的引入已不再是“可选项”,而是“必选项”。这背后是全球宏观环境的深刻变化与企业内部对人力资源管理模式的根本性重塑需求。0101被动压力5 大全球共振波动,决定 HR 必须以 AI 为杠杆重塑职能、组织与文化当前的商业环境正经历着前所未有的复杂变化,五大全球性趋势形成共振效应,迫使 HR 部门必须以 AI 为杠杆进行根本性重塑。这些压力不是孤立存在的,而是相互交织、相互强化,形成了一个不可逆转的变革动力。生成式 AI 已不再是遥远的未来,而是全面融入日常工作流的现实。BCG 2025 年AI at Work显示,72%的受访者已将生成式 AI 作为日常“默认”工具(一线员工采用率停滞在 51%)4,标志着人机协作正从“偶尔支援”迈向“全时共事”;美国圣路易斯联邦储备银行(Federal Reserve Bank of St.Louis)进一步量化了这一转变员工每天有 6%的工作时间由 AI 直接辅助,且使用频率呈持续上升态势5。麦肯锡(McKinsey)测算,若这种深度嵌入全面铺开,可为全球生产力带来 1.5%4%的年化增益6;德勤研究还指出,AI 智能体解决方案能够自动化整个工作流,成为强大的业务流程协作者 7。然而,“AI 共事者化”并非单纯的技术替换,而是对流程、治理与心理契约 的三重冲击:因此,生成式 AI 已从效率工具跃升为“数字同事”。要释放其价值,HR 不仅要解决技术集成,更要主导协作模式设计、文化塑造与情绪管理,从而让“人 AI”组合真正成为组织竞争力的新引擎。生成式 AI 全面融入工作流:AI 不再是“工具”,而是“共事者”流程重塑HR 必须将 AI 能力嵌入招聘、考核、学习与组织诊断等核心流程,重新界定人机分工,并建立数据治理与安全合规框架。治理升级传统的绩效评估和监督机制失效如何衡量“人 AI”组合产出、厘清责任归属、确保结果可信,成为 HR 的新课题。信任契约*再造Gartner 指出,当 AI 从“助手”转为“队友”时,员工情绪波动显著上升8;思爱普(SAP)调研亦发现 46%的员工认为 AI 节省的时间应归自己支配 9,与管理层“用以创造更多价值”的期望产生张力。HR 需主动管理“时间归属”与“角色认知”落差,避免信任赤字。智能时代,HR 如何利用 AI 提升效率并创造价值4 BCG.AI AT WORK:Momentum Builds,But Gaps Remain5 Deloitte.2025 Global Human Capital Trends.6 McKinsey&Company.Superagency in the workplace:Empowering people to unlock AIs full potential at work.7 Deloitte.2025 HR technology marketplace predictions8 Gartner.HR Leaders Quarterly-Q1 20259 SAP.The Top 5 HR trends today-and HRs guide to whats next*“信任契约”是指在正式劳动合同之外,组织与员工之间还存在一套“不明说却理所当然”的相互期望与承诺包括对工作方式、成长机会、时间分配和贡献回报的隐性认知。它不像制度那样成文,可却深刻影响员工的安全感与归属感。智能时代,HR 如何利用 AI 提升效率并创造价值6随着自动化和 AI 的普及,“岗位一组固定任务”的传统假设正在被稀释,推动企业从“职位导向”快速转向“技能导向”从传统的“基于岗位的管理”转向“基于能力的管理(Skills-based Organization)”:岗位失效、能力崛起:基于技能的组织兴起重塑 HR 基础语言全球需求曲线翻转-岗位描述全面“过期”世界经济论坛未来就业报告 2023预测,未来五年 23%的岗位将被重构;创造性思维、分析思维与技术素养的需求将分别激增 73%、72%、68%。这意味着静态岗位描述正快速“过期”,动态技能组合成为竞争新锚点11。0110 WEF,The Future of Jobs Report 202311PwC.26th Annual Global CEO Survey:CEOs curbed confidence spells caution世界经济论坛:未来五年 23%的岗位将被重构资料来源:World Economic Forum(WEF),The Future of Jobs Report 2023智能时代,HR 如何利用 AI 提升效率并创造价值7HR 必须以技能为核心重新构建人才的“基础语言”、升级评估机制、激活内部人才市场并再造领导与文化,从而实现“岗位语言”到“技能语法”的被动适应与主动求变。岗位正在“失效”,能力正迅速“崛起”。唯有以技能为基本颗粒度重塑职能、组织与文化,HR 才能让助力企业在高度不确定的未来保持组织韧性与人才战斗力。“新领工作”浪潮来袭-学历壁垒被动松动美国劳工统计局预计,20202030 年 60%的新增岗位将是“不要求大学学历、强调技能证据”的“新领工作”。然而 58%的 HR 领导者坦言:验证技能比验证学历更具挑战14。AI 的冲击使得传统“岗位-学历”的匹配逻辑失效,转向以动态“技能-能力”为核心的组织模式成为必然。03企业治理逻辑切换-技能驱动成为“硬指标”怡安(Aon)最新调查显示,61%的组织已启动技能驱动举措来强化人才吸引、劳动力敏捷性与领导力储备。德勤进一步量化:构建“技能型组织”的企业,在提升员工体验与实现业务成果上的成功概率分别高 79%与 63。02全技能化 vs.混合模型的现实抉择-结构稳定性的最后博弈SAP 对全球企业的跟踪显示,仅 34%计划彻底采纳纯技能导向人群中的 63%倾向把技能数据与岗位、绩级等传统信息混合使用,以兼顾灵活性与结构稳定性15。0412Aon.2025 APAC Skills Impact Survey Report13Deloitte.2025 HR Technology Marketplace Predictions14Gartner.HR Leaders Quarterly-Q1 202515SHRM.The Future of Work:How AI is Transforming HR.世界经济论坛:未来五年动态能力崛起资料来源:World Economic Forum(WEF),The Future of Jobs Report 2023智能时代,HR 如何利用 AI 提升效率并创造价值8HR 从“岗位语言”到“技能语法”重构人才语法人才招聘、盘点与发展的“母语”必须从“学历-经验-岗位”标签,转为可量化、可组合的技能语义树升级评估机制AI 与微认证工具将成为识别、验证软硬技能的关键支撑,要求 HR 掌握数据治理与算法偏差控制借助 AI 评测与微认证体系,解决“软硬技能可验证”与“数据可追溯”难题激活内部人才市场当价值单元从岗位转向技能,流动规则、绩效衡量与激励设计也需同步迭代,支持员工在组织内做“横向栈*”而非“纵向梯*”以技能为流通货币,设计横向栈式发展通道,匹配业务敏捷需求再造领导与文化经理人要从“岗位配置者”转型为“技能编排师”,而 HR 则是这场范式迁移的架构师与推动者将经理人定位为“技能编排师”,而 HR 成为此轮范式迁移的架构师与催化者资料来源:公开资料及本报告综合分析*横向栈即横向技能栈(Horizontal Skill Stack),是指员工在同一职能或专业领域内,通过不断累积多维度技能,形成“技能叠加”能力组合。*纵向梯即纵向技能梯(Vertical Skill Ladder),是指员工在一个专业序列中,沿着深度与层级不断向上攀升,从入门级技能逐步过渡到专家级或管理级能力。混合雇佣正在从短期战术演变为组织韧性的“常态化设置”。企业不仅拥有全职员工,还大量使用自由职业者、合同工、兼职员工等平台劳工。如今,AI 智能体也将加入这一生产力矩阵,成为企业的重要“劳动力”组成部分。HR 需要管理一个日益复杂和多元的劳动力生态系统,这意味着传统的 HR 政策、福利体系、文化建设和合规管理都将面临巨大挑战,AI 技术将在劳动力规划、人才匹配和协作管理方面提供关键支持。混合雇佣常态化:员工、平台劳工、AI 智能体共构生产类别 身份定义报酬 工作性质员工 企业正式成员,法律主体固定薪资 福利,稳定持续性任务,深度融入平台劳工 独立合作方,半独立按任务结算,灵活碎片化任务,按需弹性AI 智能体 软件/程序,非主体运行维护成本,无报酬高效自动化执行现代企业劳动力类型核心特征对比智能时代,HR 如何利用 AI 提升效率并创造价值9远程/混合工作奠定“多元用工”基地:过去三年,在宏观不确定性与群体工作偏好变化的共同作用下,混合/远程工作由被动应急转向主动选择,重塑了企业对人力资源成本与人才半径的基本认知:半数认为工作安排“非常灵活”的受访者明确表示因此降低了离职意愿,把“灵活性”确立为持续吸引与锁定高绩效人才的关键筹码 16。在成本层面,办公面积与通勤补贴的压缩为管理层释放出再投资数字化的预算空间,使混合工作成为多元用工形态自然生长的土壤。平台劳工成为“弹性容量池”:在劳动力供需错位与经济周期波动的背景下,“大辞职潮”加速合同工、自由职业者渗透,平台劳工的比例继续上扬。基于对 800 家跨国公司的抽样调查,61%已将平台劳工纳入核心人才策略,以应对项目制需求波动、区域技能缺口与季节性峰值,视之为缓解技能缺口的首选方 案 17。平台劳工的高流动性与专业度,使企业得以在不扩张固定成本的前提下快速匹配市场节奏,并打破“编制非编制”二元分野,为后续引入新型“数字劳动力”铺平管理心智。AI 智能体跃升为“第三类劳动力”:BCG 报告指出,目前 13%的企业已在关键流程中批量部署 AI智能体,77%预计 3-5 年内重要性显著攀升智能体将成为“不可或缺的同事”。德勤进一步预测,使用生成式 AI 的公司中,启动智能体试点的比例将由 2025 年的 25%增至 2027 年的50。与人类外包不同,智能体不受时区、工时和规模的限制,可在复杂任务链中充当执行者、监控者甚至协同决策者,其成本结构更接近“递减边际”,对传统人力盘算构成根本性挑战。AI 智能体的快速发展,正将其从概念推向实际生产力,成为劳动力生态系统中的新组成部分。01020316SAP.The Top 5 HR trends today-and HRs guide to whats next17Aon.2025 APAC Skills Impact Survey Report18Deloitte.2025 HR technology marketplace predictions由此产生的是一个“人-平台-智能体”三元并行的劳动力生态。对于 HR 而言,既有的招聘、绩效、薪酬与合规框架被迫升级:劳动力规划不再围绕岗位展开,而需转向任务颗粒度的能力编排;绩效考核必须引入“人机混合产出”维度,厘清责任归属;劳动法规、数据隐私与算法透明度交织,带来跨域监管压力;企业文化也面临归属感稀释与“人机共事”信任赤字的双重考验。若无法建立统一的劳动力视图,组织将陷入管理碎片化与合规灰区的双重风险。10智能时代,HR 如何利用 AI 提升效率并创造价值领域新挑战AI 驱动的杠杆点劳动力规划多元用工结构复杂、预测周期多变智能排班、成本模拟、合同自动生成绩效与责任混合产出难评估、责任界定模糊双指标体系(人效 算法效)、操作归属划分合规与伦理涉及法规、隐私、AI 透明度交叉风险合规图谱、AI 治理框架、风险预警文化与体验归属感稀释、AI 取代焦虑上升混合协作文化、技能重塑、心理干预机制资料来源:公开资料及本报告综合分析AI 作为“第三类劳动力”对 HR 的管理挑战与价值杠杆 过 去 十 年,员 工 体 验(Employee Experience,EX)已从“软性关怀”演变为影响企业收入曲线的硬指标。德勤对 40 多个行业 800 余家企业的调研显示:AI 赋能与数据驱动的技能型组织中,提升员工体验的成功概率比同类公司高出 79%,实现财务与运营成果上成功概率也提高至 63。这意味着,员工体验已具备“乘数效应”任何投入都不止于满意度层面,而是通过敬业度、创新产出、客户口碑等渠道放大,最终反映到利润表。Adobe对 1,270 名高层的最新调研显示,65%的受访者确认 AI 预测性分析已成为 2025 年增长的首要引擎,61%认为个性化体验是提升客户参与度的关键 20。也就是说,对员工体验的每一元投入,都在以“乘数效应”透过客户粘性和营收回到利润表。Gallup 的长期追踪同样印证了这一点:高敬业度团队的盈利能力平均高出同行 23%,且离职率显著降低 离21。由此,“员工体验(EX)业务成效(BX)”的价值飞轮正以更快速度自我强化。生成式 AI 把这一飞轮推向了实时、自适应的“千人千面”阶段Josh Bersin 研究实证:部署职业发展助手后,员工对职业机会满意度提升 25%,绩效提升 20%,留任率提升 10%;信息检索从 5 分钟缩短到 15 秒,单次交互效率提高 95。当体验数据与业务数据打通,HR 不再只是“记录者”,而是用 AI 把敬业度指标直接映射到产能、创新管线和客户保留率的价值共创者。要驾驭这股浪潮,释放“三元劳动力”红利,人力资源部门与管理者的首要任务是促成人类员工(含远程/混合办公群体)与 AI 智能体的高效协同:重塑工作流,厘清责权边界,并建立符合伦理与合规要求的治理框架。为此,必须把 AI 智能体正式纳入劳动力规划、绩效衡量与员工体验设计,视其为与全职员工、平台劳工并列的“第三类劳动力”。只有完成这一步,组织才能在成本控制、响应速度与创新产出三大维度同时撬动杠杆,并为未来充满不确定性的商业环境预留充足机动空间。体验与投资回报联动:员工体验带动业务成果的价值飞轮加速转动19Deloitte.Becoming an AI-enabled,Skills-Based Organization20Adobe.2025 AI 与数位趋势21Gallup.Q12 Meta-Analysis Report22Josh Bersin.Maximizing the Impact of AI in the Age of the Superworker智能时代,HR 如何利用 AI 提升效率并创造价值11资料来源:公开资料及本报告综合分析员工体验(EX)下一代体验(NX)业务成果(BX)因果链路 领先组织已开始采用“双钥匙治理”HR 掌握情绪温度、成长曲线,财务部门锁定生产率、收入与成本曲线。Adobe 调查进一步证明:在已验证 投资回报率的公司中,64%报告内容生产速度与生产力“双高”,60%指出决策质量显著改善。一旦两把钥匙同步转动,员工体验便不再是费用科目,而成为可投资、可折算的收益资产,预算逻辑随之改写:每投入 1 元改善员工体验,下一个周期就可带回 1.31.5 元业务增量飞轮自驱加速。对中小企业而言,资源约束反而成为“快周转”优势。订阅式 HR SaaS 将企业级体验分析与生成式 AI 推送下放到“即插即用”层面;层级扁平意味着洞察可在数日内转化为管理动作。关键在于 CHRO 能否识别最具杠杆效应的体验要素(如即时反馈或成长透明度),并用业务 KPI 做强绑定,让员工体验真正成为营业收入与现金流的领先指标。总结而言,员工体验已经成为撬动业务结果的“价值倍增器”。借助生成式 AI、云平台与闭环治理机制,HR 可把员工体验转化为可量化、可迭代的战略资产:优质体验提升敬业与创新 敬业与创新带动客户价值与营收 增长反哺更大规模的体验投入。当这一飞轮持续运转,HR 将不再只是成本守门人,而是提升企业市值与抗风险韧性的核心引擎。智能时代,HR 如何利用 AI 提升效率并创造价值12生成式 AI 在组织中的渗透速度远超监管演进速度,高管对风险的敏感度前所未有:66%将数据隐私与安全列为首要隐患,48%担忧无法理解或控制 AI 决策,44%直指合规压力不断上升。与此同时,76%的企业承认其 AI 网络安全措施需要进一步改进。23这些数据凸显了 AI 在数据、决策和监管方面的潜在风险。同一研究指出,仅 38%的公司着手为AI 专属法规做准备,只有 50%建立了基本使用护栏,真正由 CEO 直接负责负责任 AI 的企业更低至 14%。对于 AI 智能体,主要的担忧则是缺乏人工监督(46%)、出错时责任不清(35%)和引入偏见或不公平待遇(32%)。这些担忧构成了 AI 治理的“三重挑战”“算法黑箱”(缺乏理解与控制)、“数据伦理”(隐私与安全)和“合规模糊”(监管滞后)。对 HR 而言,风险更具直接性:招聘模型一旦出现性别或种族偏差,绩效算法若无法溯源,将立即触发合规调查并损害雇主品牌。这些挑战若不解决,将导致员工和用户对 AI 系统产生“信任赤字”,进而阻碍 AI 的广泛采纳和价值实现。因此,HR 必须将 AI 伦理、解释性、责任机制作为 AI 战略落地的核心基石,并主动参与到相关法规的制定和内部治理体系的建设中,以构建信任与合规的基石。对于企业而言,尤其是资源有限的中小企业,云端 负责任 AI SaaS 工具与第三方合规服务的普及已显著降低进入门槛关键在于 CHRO 是否愿意将 AI 伦理与透明度视为下一轮人才竞争的起跑线,而非最后一公里的补救措施。当合规门槛转化为透明度红利,HR 才能在价值飞轮之外,再筑一道护城河以可信任的 AI 驱动组织可持续的增长。内部信任缺口同样突出ATD 面向 440 名人才发展专业人士的调查显示,96%的受访者对 AI 输出的准确性持有不同程度担忧24,这意味着一旦招聘或绩效算法出现偏差,合规调查与雇主品牌风险将同步触发。与此同时,75%的全球知识型员工已在日常工作中使用 AI25“无规即风险”的红线被迅速拉近。外部环境也正在急速收紧欧盟AI 法案正式落地,违规罚款上限高达全球应收的7%;美国多州亦要求“算法溯源审计”方可上岗。“负责任 AI(RAI)”已从自愿承诺(原则)升级硬财务指标。BCG 研究对“赢家”企业的画像给出五条准则,其中之一便是“将 负责任 AI 纳入 CEO 议程,主动布局政策前瞻”26。合规与透明度加码:AI 伦理、解释性、责任机制成为治理基石23 BCG.AI RADAR:From Potential to Profit-Closing the AI Impact Gap24 Atd.AI 驱动的企业人才发展:聚焦 AI 力25 Prophet.Human-centered AI:Culture as the Catalyst for Al-enabled Growth26 BCG.The C-suites AI Agenda:From potential to Profit with GenAI智能时代,HR 如何利用 AI 提升效率并创造价值1302主动机遇AI 正在赋能 HR 战略跃迁,促进 HR 从降本增效到价值创造面对被动压力,AI并非“洪水猛兽”,而是HR实现战略跃迁、从传统的降本增效走向更高层次价值创造的关键驱动力。长期以来,HR部门常被视为事务性部门,疲于应对招聘、薪酬、福利等日常行政事务。AI的赋能将彻底改变这一现状。通过大数据分析、预测模型和自然语言处理等技术,AI能够从海量HR数据中挖掘深层洞察,例如预测员工离职倾向、识别高绩效团队的特征、评估关键人才的潜在风险等。这种数据驱动的洞察力使 HR 能够从被动的事务响应者转变为主动的战略伙伴,与业务部门更紧密地联动,为组织的战略决策提供精准的人力资源分析和建议。例如,通过 AI预测劳动力供需,HR 可以提前布局人才梯队,支撑业务扩张或转型需求,从而真正成为企业的“战略引擎”。生成式 AI 的到来把 HR,难以参与战略决策这一格局拆解成三次“跳跃”效率腾挪、洞察赋能与价值共创并用一系列可量化结果证明:AI 不再是单纯的自动化工具,而是把 HR 推向业务枢纽的“战略引擎”。效率腾挪-释放高价值时间:Josh Bersin 最新研究测算,采用 AI Copilot 后,员工信息检索由时间由 5 分钟压缩至 15 秒,节省 95%时间;HR 服务单处理时间压缩 81%。这类“分钟级”提效在招聘、薪酬、学习管理等 15 个高频场景同步发生27。当事务负荷被整体挤压,为人力资源部释放可转向战略工作的“黄金工时”。洞察赋能-把预测写进人才决策:AI 的价值并不止于提速,而在于把碎片化的人事、绩效与业务数据织成预测引擎。Josh Bersin 报告显示,利用生成式 AI 汇总 360反馈并给出发展建议,可使员工绩效提升 20%,留任率提升 10%;AI 驱动的技能 岗位匹配则让岗位契合度提高 30%,同时将面试偏见降低 25%;ManpowerGroup 的“Sophie AI”平台更在 22 亿条劳动力数据的基础上,为客户搭建实时的战略人力规划模型,直接嵌入经营决策28。从事务响应到战略引擎:AI 增强 HR 的数据洞察与业务联动能力27Josh Bersin.Maximizing the Impact of AI in the Age of the Superworker28ManpowerGroup.Future Forword:Building and Sustaining a Meaningful Career in the AI Age0102智能时代,HR 如何利用 AI 提升效率并创造价值14利用生成式 AI 汇总 360反馈并给出发展建议资料来源:Maximizing the Impact of AI in the Age of the Superworker价值共创-从成本中心转身业务伙伴:当洞察对接业务指标,HR 影响力呈指数放大。BCG 对 50 个市场的研究表明:将 25%以上员工训练为生成式 AI使用者的企业,关键职能重塑得效率与成效可提升 3050%;虽然这类“深度采用者”的比例仅 6%,但其战略韧性却达到平均水平的 3.5 倍29。换言之,AI 让 HR 用可解释的数据模型呈现“敬业度-产出-利润”链条闭环,从而赢得决策席位与资本预算。AI 赋能下,HR 将有能力实现构建“一个全面的数据驱动型人才生态系统,为人才决策和劳动力转型提供动力”。例如,AI 能够根据人才和市场趋势、业务成果和战略,自动标记工作需求变化,并提供“预测性岗位匹配”30。同时促进 HR 向“增强型 HR”(Augmented HR)转变,通过技术实现 HR“以新方式做新工作”,从而“将 HR 技术投资的业务价值几乎翻倍”31 AI 把 HR 从“事务响应者”升级为“战略增长合伙人”:效率腾挪释放时间红利,洞察赋能驱动精准决策,价值共创让 HR 真正站上营收与利润的同一张报表。在 生成式 AI 的拐点窗口里,谁先用数据和算法武装 HR,谁就能先把人力资本转化为业务动能。0329 BCG.BCG AI RADA:From Potential to Profit with GenAI30 BCG.How Generative AI Will Transform HR31 Gartner.HR Leaders Quarterly Q1 2025:Augmented HR智能时代,HR 如何利用 AI 提升效率并创造价值15增强型 HR(Augmented HR)=数据 x 技术 x 场景资料来源:Gartner,本报告综合分析尽管 AI 常被视为“冰冷”的技术,但其在 HR 领域的应用正呈现出高度个性化和人本化的趋势32。在新一代 AI 技术加速渗透的背景下,HR 职能正从“标准化执行者”转向“体验共创架构师”。过去,HR 依赖线性、规则驱动的流程以维持一致性和合规性,效率虽提升,却常忽略员工个体的感知与需求。而今,以生成式 AI 为代表的智能技术不仅提升了服务响应速度,更引入前所未有的个性化与人本关怀,构建出“可理解、可感知、可参与”的全新 HR 服务体系。这一转型已不再是技术升级的问题,而是组织价值创造机制重构的核心。从流程执行到体验共创:个性化与人本关怀实现系统融合32 Zendesk.Human-centered AI for HR:What it is why it matters智能时代,HR 如何利用 AI 提升效率并创造价值16Accenture 研究指出,未来企业将围绕“生命化的企业体验系统”展开竞争企业不仅要效率和控制,更要共鸣与共 创33。AI 正是这一系统的催化剂。首先,它通过大规模数据理解个体行为特征,使“千人千面”的体验设计成为现实。同时,生成式 AI 可以基于员工的学习路径、反馈内容、绩效表现等维度生成个性化发展建议34。德勤预测,“工作技术将根据用户的偏好和个人风格定制个性化用户体验”,大型语言模型将“越来越根据个人用户的风格、语气和偏好进行定制”35。AI通过其强大的数据处理和模式识别能力,能够深入理解个体员工的需求、偏好和行为模式。这使得HR能够超越标准化的“流程执行”,提供高度定制化的服务和支持,如个性化学习路径、智能职业建议、定制化沟通等。这种“智能力量”不仅提升了HR服务的效率,更重要的是,它将“人本关怀”融入系统设计,实现了对员工体验的深度优化,从而增强员工的归属感和满意度,推动员工与组织共同创造价值。其次,AI 赋能的人本关怀不仅体现在结果定制,更深入到流程互动本身。AI 聊天机器人能够 24/7 全天候地提供智能应答,涵盖福利、流程咨询、成长建议等高频场景;自然语言处理(NLP)工具则实时分析员工情绪、识别风险信号,使 HR 能够在个体状态发生变化时提供主动干预和心理支持36。这种极致的个性化体验有助于提升员工敬业度、满意度和保留率37,这种以人为中心的智能响应,正在形成“共情 即时”的协作氛围,有效提升员工的情感黏性与组织归属感,极大的改善员工体验。与此同时,虽然在战略层面个性化体验已从“软性指标”演变为可度量的业务杠杆,但这一趋势并未削弱“人情味”,反而在技术中注入了温度。Prophet 对全球企业员工的调研指出,57%的员工担心 AI 削弱人际连接,63%担心自动化让工作变得冷漠。然而,领先企业通过“人 机”协作机制让员工参与体验工具的设计和迭代,构建出更高信任度的 HR交互模型。例如,AI 提供推荐,而决策权仍归员工与 HR 共同持有,这种“AI 支持而非取代”的模式,体现了人本关怀的“只能力量”,提升了技术采纳率,也增强了文化归属。对于中小企业而言,生成式 AI 和 HR SaaS 工具的普及进一步降低了实现个性化体验的门槛。在组织结构更扁平、沟通链条更短的条件下,这类企业能够更快将数据洞察转化为行动,实现体验与业务的快速联动。层面环节AI 角色典型指标业务杠杆数据-感知层:实时捕捉个人需求实时感知Copilot 捕捉“情绪 行为”微信号查询时长-95%HR 工单处理-81%建立高频数据流,打通体验死角智能-定制层:把洞察转译成专属体验智能定制职业/学习推荐、福利个配职涯满意 25%绩效 20%激活敬业度,减少离职与沉默成本共创-迭代层:员工参与体验设计,飞轮持续加速共创迭代Chat NLP 收集反馈、快速迭代83%组织在人才发展场景加大 AI 使用 员工参与设计,体验业务飞轮自驱AI 让“体验共创”成为可量化、可迭代的系统工程资料来源:公开资料及本报告综合分析33Accenture.Living Business:Achieving Sustainable Growth Through Hyper-Relevance34Personalized Learning Paths:How AI is Transforming Employee Training35Deloitte.2025 HR technology marketplace predictions:New dynamics for working with humans and technology36IBM.How chatbots improve human resource operations37Deloitte.AI-Powered Employee Experience:How Organisations Can Unlock Employee Potential38Prophet.The State of Digital Transformation:Special Edition GenAI Adoption in 2024智能时代,HR 如何利用 AI 提升效率并创造价值17因此,AI 并非将 HR 推向冷冰冰的算法流程,而是在精准与共情之间建立桥梁。通过 AI 实现个性化与人本关怀的系统融合,不仅重构了 HR 的服务方式,也重塑了其在组织中的价值定位。在这场从“流程效率”到“体验价值”的跃迁中,AI 既是工具,更是转型的加速器。对于希望摆脱“成本中心”标签的 HR 而言,现在正是成为“体验共创引擎”的关键时刻。随着组织对敏捷性与人才韧性的要求持续上升,传统自上而下、流程驱动的 HR 管理模式正逐渐失效。在生成式 AI 与 智 能系 统 的 赋 能下,HR 职 能正从“响应式人力管理”跃升为“引导式人才引擎”,使员工的学习与成长过程具备更高的主动性、自适应性与 战 略 联 动性。这一转型标志着员工发展由“被动推进”转向“内驱拉动”,实现个体目标与组织战略的高效耦合:AI 的最大改变在于其预测性与情境感知能力:AI 正重构员工学习旅程通过绩效数据与职业目标分析,系统不仅能推荐个性化的课程,还能动态调整学习路径的内容、深度与频率,将成长提示嵌入工作节奏中,而非停留在单点推送39。例如,当员工进入新岗位或项目周期时,AI 可自动识别其所需的新技能或支持资源,并在恰当的时点推送与之匹配的学习模块。这种“流动式学习体验”打破了传统学习与发展的课表化结构,使学习成为工作的一部分,而非附加义务。员工自驱动力的提升也由此显现:不仅技能数据在职业流动性与学习路径设计中已成为组织内部流动机制的核心引擎40,当员工明确知道组织基于技能做出发展与晋升决策时,其学习主动性提高 57A。AI 在此过程中承担“数字教练”角色,通过阶段性反馈、路径可视化与智能激励机制,激发员工自主成长的意愿与节奏感。协同方面,AI 不仅增强了个体能力,更重构了团队间的匹配逻辑与协作机制:通过分析员工的技能结构、工作偏好、沟通风格与过往项目合作数据,AI 可为跨团队协作提供智能组队建议。例如,AI 驱动的项目分配系统可以在多部门项目中识别最优协作对、预测潜在冲突并预先提出干预建议,从而提升团队整体绩效与协作满意度。Coursera 的全球技能报告指出,这种基于技能的“任务匹配引擎”正成为企业实现人才敏捷配置的关键中枢,尤其在中小型组织中具有高度可扩展性42。知识协同也是 AI 驱动下的重要价值体现:AI 系统能够主动识别组织内部的“知识孤岛”,并基于主题、经验和行为数据进行专家匹配。当员工面对未知任务或问题时,系统能在几秒钟内推荐合适的“知识节点”进行对接,打通经验传承与跨部门协作的链路。这种“智慧连接器”角色,尤其对于缺乏成熟知识管理体系的中小企业而言,释放了巨大的效率与创新红利。从被动管理到主动引导:AI 赋能员工自驱成长与协同39BCG.How Generative AI Will Transform HR40Aon.2025 APAC Skills Impact Survey Report41SAP.The top 5 HR Trends Today-and HRs Guide To WhatS Next42 Coursera.2025 Global Skill Report:Trusted skill insights for a rapidly changing world01020304智能时代,HR 如何利用 AI 提升效率并创造价值18随着生成式 AI 和数据中台技术成熟,HR 数字化转型的重心已从以往“模块级别的流程优化”,加速迈向“生态级别的智能集成”阶段。这一转型,不仅关乎系统架构的升级,更重塑了 HR 在组织运行中的数据地位与战略价值。人力资源管理正逐步从“信息记录系统”演变为“价值生成系统”。BCG 研究指出,AI 正在推动“一个全面的数据驱动型人才生态系统”的构建,使人才决策和劳动力转型不再依赖经验,而是基于动态数据流进行智能预判与系统响应43。这一生态系统核心特征在于:打破招聘、绩效、学习、薪酬、敬业度等传统模块间的数据孤岛,实现端到端的信息互通与反馈闭环。例如,招聘阶段采集的候选人技能画像可自动流入学习系统,用于个性化培养路径的制定;员工在岗期间的绩效与学习数据又将回馈至组织规划与人才梯队建设中,形成“感知-决策-优化”一体化的人力运营循环。这种集成不仅提升了 HR 流程效率,更让系统具备了“自我演化”的能力,如“增强型 HR”框架,即通过构建一个跨系统、跨数据源的技术协同体系,实现从“容量导向”向“价值导向”转型。在该框架中,AI 算法可持续学习 HR 各环节的运行效果,对招聘漏斗效率、学习转化率、绩效分布趋势等关键指标进行实时监测和优化。系统不再只是“执行者”,而是“建议者”和“调度者”44。更重要的是,HR 系统的智能闭环正从内部整合走向“组织级嵌套”。现代 SaaS 平台正快速降低中小企业的技术门槛,AI 能力不再依赖昂贵的定制开发,而通过订阅模式嵌入到人力云平台中。此外,智能HR生态不仅局限于“人力系统内部协同”,更迈向与外部业务系统、财务系统乃至市场数据平台的“跨边界融合”通过与财务、销售、研发、运营等外部系统的数据打通,形成组织级的“统一视角”。例如,将薪酬绩效数据与财务系统连接,可动态测算人效产出;将项目需求与人才库匹配,可实现跨业务线的人才敏捷调度。这种“内外联通”的能力,使 HR 不再是一个独立职能板块,而成为业务战略执行的重要承接平台。模块优化提升的是 HR 的单点执行力,而生态构建解锁的是组织系统性的运行效率与战略协同力。生成式 AI 和平台化集成架构的结合,正推动 HR 从流程执行者转型为“系统驱动者”,实现“感知 预测 反馈 优化”的智能闭环。在这个过程中,HR 将从后台职能部门跃升为价值链的关键驱动单元,引领组织进入“全栈智能人力时代”。从模块优化到生态构建:HR 系统集成进入智能化闭环,释放全价值链的协同潜能43BCG.How Generative AI Will Transform HR44Gartner.HR Leaders Quarterly Q1 2025:Augmented HR所以说,AI 不仅能有效提升员工的学习能力,更为 HR 提供了一套面向未来的“自驱 协同”策略体系。在这场转型中,HR 不再是守流程的管理者,而是激发潜能、连接个体与战略的引导者。通过 AI 的持续学习推荐、技能追踪、协作优化与智能连接机制,组织正构建一个真正以人才为核心、以成长为动力的“智能引力场”。当 HR 掌握了这套系统,就不再只是追踪人力成本的后台部门,而是驱动组织活力和战略落地的前端引擎。智能时代,HR 如何利用 AI 提升效率并创造价值19现实图景与落地鸿沟AI 在 HR 领域的应用格局-现状与痛点0201全景解析AI 在 HR 职能中的整合概览AI 正在重塑 HR 全价值链流程:HR 职能地图重塑传统的 HR 职能通常被划分为六大核心模块:招聘与人才获取、学习与发展、绩效管理、薪酬与福利、员工关系、以及 HR 运营。AI 技术的引入正在对每个模块产生深刻影响,不仅改变了具体的操作方式,更重要的是重新定义了这些模块之间的关系和协同方式。具体而言,AI 在 HR 全价值链中的应用包括:招聘领域是 AI 应用最为成熟和广泛的 HR 职能之一,也是 AI 最先发力并获得显著成效的领域之一。根据多项研究显示,超过 67%的企业已经在招聘流程中应用了某种形式的 AI 技术45。AI 不仅能自动生成职位描述、初筛简历、匹配候选人,更能通过视频分析、聊天机器人和预测模型辅助面试评估,实现候选人甄选的高度自动化和个性化。BCG 指出,在入职流程中,AI 自动化能够完成超过 50%的标准化任务,同时生成式 AI 撰写的个性化招聘信息可使候选人互动率显著提高46。结果是,HR 从经验驱动走向数据驱动,招聘质量和效率双双跃升。招聘与人才获 取 的 AI革命学习与发展是AI应用潜力最大的HR职能之一,因为个性化学习的需求与AI的能力高度匹配。传统的“一刀切”培训正在被自适应学习取代。AI 能够基于员工技能图谱和行为数据自动推荐学习路径、生成定制内容、提供智能辅导与反馈,从而实现真正的千人千面式学习。正如业内分析师所言,AI 驱动的个性化学习路径确保员工获得精准所需培训47,大幅提高培养效率和成效,支持企业快速填补技能缺口。学习与发展的个性化深度转型绩效管理是 HR 职能中最具挑战性的领域之一,因为它涉及主观评价、复杂的人际关系和长期的行为改变,长期以来面临主观偏差和周期滞后的挑战。AI 技术正在为这一领域带来新的可能性。AI 的介入让 HR 可以实时分析员工绩效和敬业度数据。通过自然语言处理和情绪分析技术,AI 能够检测员工情绪波动、识别离职风险,为 HR 提供前瞻性绩效洞察。研究显示,采用持续反馈和 AI 工具的组织可将员工生产力提升 27H。AI 驱动的绩效管理可自动关联工作产出与人才成长,帮助 HR 与业务提前调整目标和激励,让绩效考核更科学、更及时。绩效管理的数据驱动升级45HR Executive.Whats the ROI of AI in HR?46BCG.How Generative AI Will Transform HR47AI HR Institute.AI for Human Resources:Enhancing Employee Engagement and Retention 48AI HR Institute.AI for Human Resources:Enhancing Employee Engagement and Retention智能时代,HR 如何利用 AI 提升效率并创造价值21上述场景的普及正在重塑新的“HR 职能地图”,让 HR 从被动响应转向主动赋能AI 成为连接各模块、驱动数据流动的核心枢纽。在这一过程中,HR 运营效率质变并加速组织效能跃迁:不仅大量事务性工作被自动化消除,还让 HR 有空间关注战略性人力资本投入,成为真正的业务增长助推器。薪酬管理涉及大量的数据处理和复杂的计算逻辑,是 AI 技术天然的应用场景。AI 在薪酬管理中的应用主要体现在市场薪酬分析、薪酬结构优化和合规风险管控三个方面。智能算法还可辅助合同和税务管理,例如自动核对薪资合规、检测薪酬歧视风险。这让 HR 得以更精准地管理总薪酬成本,同时降低法律与运营风险。薪酬与合规的智能化管理AI 能够进行人才需求预测、技能差距分析,并支持内部人才流动。通过机器学习模型,HR 可以预测未来的人才需求,量化技能差距,并模拟不同用工组合(员工、自由职业者、AI 智能体)的成本与效益。HR 运营将告别“根据岗位填人”,转为能力驱动的任务编排:将工作拆分为最小能力粒度的任务,再用 AI 优化匹配最合适的内外部人力。这样既提升了用工灵活性,也为组织在不确定环境下快速调整人力策略奠定基础。人力资源规划与内部流动的动态智慧化AI 在 HR 场景中核心能力与价值:自动化、数据洞察、个性化、风险识别、业务流程重塑AI 在 HR 领域的核心能力可以概括为以下几个方面,这些能力共同构成了 AI 赋能 HR 的基石:自动化与智能化:解放 HR 从重复事务中回归战略这是 AI 最直接和显性的价值促进 HR 事务性负担正被系统性剥离,为 HR 创造更大战略时间红利。AI 可以通过机器人流程自动化(RPA)和智能助手等技术,自动化处理大量重复性、规则化的 HR 事务,例如简历初筛、入职资料收集、福利申请处理、薪资核算、员工疑问解答(通过 AI 机器人)等。这显著解放了 HR 专业人员的时间,使其能够从繁琐的行政工作中解脱出来,将精力聚焦于更具战略性、更需要人际互动和情感连接的工作,如人才发展、文化建设、战略规划和员工关怀。研究数据显示,根据 IBM 的研究,AI 驱动的自动化可将 HR 运营成本降低高达 30I。HR Dive 研究指出 HR 流程的自动化能够带来 30-50%的效率提升50。这种效率提升不仅体现在处理速度的加快,还体现在错误率的降低和一致性的提高。AI 不仅让 HR 操作“更快”,更重要的是让 HR 能够“做不同的工作”。Josh Bersin 指出,AI 推动 HR 职能从“事务管理者”转向“战略业务伙伴”成为可能,从而重构人力价值链,实现战略性人力资源管理。49IBM.The Business Case for AI in HR50HR Dive.Workers productivity increases every hour they use generative AI.智能时代,HR 如何利用 AI 提升效率并创造价值22数据洞察与预测:驱动 HR 决策从经验走向科学数据洞察是 AI 技术在 HR 领域的核心优势AI 让 HR“看见未来”,促进具备在人才领域做“预测性投资”的能力。HR 部门长期以来面临数据分散、分析能力不足的挑战,导致决策往往依赖经验和直觉。AI 通过大数据分析、机器学习和预测分析 技术,能够整合来自不同 HR 系统的数据,并从这些海量非结构化数据中挖掘深层模式和洞察。例如,AI 可以预测员工离职风险与技能供需、识别高潜力人才与技能断层、评估培训项目的投资回报率、分析团队绩效驱动因素等。这种数据驱动的预测能力使得人力资源部门的决策不再是事后响应,而是前瞻性的、科学的,从而大大提升决策的准确性和有效性。借助 AI,HR 的“人才账本”可实现动态更新和战略对齐。个性化与优化体验:提升员工满意度与企业吸引力个性化是现代员工体验的核心要求,也是 AI 技术的重要优势AI 正在重新定义“以人为本”,将人本关怀从“共性体验”升级为“个体体验”。AI 能够通过分析员工的个人数据(如职业背景、技能偏好、学习习惯、绩效表现、甚至情绪数据),提供高度 个性化的服务和体验。AI 驱动的员工体验管理系统能够根据员工绩效、偏好、行为数据,构建千人千面的成长路径和服务触点。ATD 研究表明,企业若能为员工提供 AI 支持的个性成长旅程,其保留率可提升 20%以上51。这种个性化不仅能提升员工的满意度和归属感,也使得企业在人才市场上更具吸引力:促进实现体验个性化从“保留工具”演化为“人才磁场”,帮助组织在人才竞争中形成差异化品牌。风险识别与合规保障:构建稳健的人力资源管理防线风险识别和管控是 HR 管理的重要职责,AI 技术在这一领域的应用正在从被动的问题发现转向主动的风险预防AI 让 HR 从“事后修复”走向“事前预防”。HR 管理中广泛存在法律、合规、道德和声誉风险。AI 系统具备实时监控与异常识别能力,例如,AI 工具可以审查合同条款,识别潜在的法律风险;监控内部沟通,预警潜在的员工关系问题或不当行为;分析薪酬数据,识别潜在的薪酬不公或歧视风险,以及职位描述中隐性歧视用语识别、异常行为实时预警、数据访问合规性审查、员工情绪波动等风险点。通过自动化合规检查和实时预警机制,AI 帮助企业构建一道稳健的人力资源管理防线,有效规避法律、财务和声誉风险。此外,AI 支持基于行为数据的员工离职风险模型、绩效波动预警机制等,在人才流动与战略转型期,帮助 HR 提前干预、保障组织稳定性。赋能业务增长与流程重塑:人力资源运营效率质变,加速组织效能跃迁AI 技术不仅能够优化现有的 HR 流程,更能够推动业务流程的根本性重塑。这种重塑不是简单的自动化,而是基于 AI 能力重新设计业务逻辑和操作模式。其本质在于:AI 正在从“工具性嵌入”转向“平台级重构”,驱动 HR 由被动支持职能向战略协同演进。51ATD.AI 驱动的企业人才发展:聚焦 AI 力智能时代,HR 如何利用 AI 提升效率并创造价值23最终,AI 驱动的流程重塑,不仅提升了效率,更将 HR 从职能部门转变为影响组织战略执行力、适应力与创新力的“系统性杠杆”。在业务高度不确定与人才紧张的双重挑战下,流程重塑已不再是效率话题,而是 CEO 议程中的核心增长议题。HR,借助 AI,正站在这场组织跃迁的临界点上。以人力资源运营为例,过去招聘、培训、绩效、继任等流程往往沿袭“线性-阶段-静态”逻辑,彼此割裂。如今,在 AI 的支持下,流程被“动态-预测-闭环”重构。候选人的行为数据不仅影响初筛,还直接输入个性化入职培训与职业路径匹配模型;员工绩效与协作数据被实时追踪,用于预测其未来潜力和领导力发展需求,并反馈到团队编制与组织设计中。这种前后贯通的数据流与决策流,推动流程本身具备“学习”与“自我调优”的能力,形成以业务目标为导向、以员工体验为中心的自驱式 HR 运营模式。此外,AI 重塑流程的一个关键趋势是“任务原子化 智能调度”。企业不再以“岗位”为单位配置工作,而是通过AI 将任务拆分为能力颗粒度极高的微单元,再通过算法实现“人任务时间目标”的最优匹配。这种机制将 HR 运营从“岗位匹配”升级为“能力引擎”,使组织运作更具弹性与抗波动能力。更进一步,生成式 AI 和 AI 智能体的集成,正使 HR 流程变得前所未有地“情境化”与“可感知”。员工可通过自然语言向智能体提出职业发展、学习、晋升路径、跨部门调动等请求,背后系统自动调用组织内外部数据,动态生成推荐方案并同步 HR 操作指令。这种新范式下,流程不再是后台设计者主导、员工被动接受的过程,而成为员工与 HR 共创、实时交互的智能界面。AI 赋能 HR 的五大核心能力与价值来源:本报告综合分析智能时代,HR 如何利用 AI 提升效率并创造价值24被动层面:AI 落地的“结构性不适”-价值转化路径仍未打通尽管 AI 技术在 HR 领域展现出巨大潜力,但企业在实际应用过程中面临着诸多挑战和障碍。这些挑战不是技术本身的问题,而是组织在适应 AI 技术过程中遇到的结构性困难。0102采纳落后:HR 自身数字化建设落后于业务线许多企业在销售、营销、生产等业务线积极拥抱数字化转型和 AI 应用,但在 HR 领域,数字化基础建设往往相对滞后52。这成为AI 落地的一大障碍:尽管 HR 技术具有改变 HR 业务影响力的潜力,但大多数 CHRO 仍受困于低价值、以容量为中心的技术方法53,这反映出 HR 在技术采纳和应用方面的保守态度,未能充分利用数字化工具提升自身能力。许多 HR 部门仍在使用传统的人工流程和分散的系统,数据基础薄弱,这使得 AI 的引入缺乏必要的土壤和数据支撑。根据德勤的调查,只有约 9%的 HR 领导者认为他们的组织已做好充分准备应对 AI 和自动化带来的变革54。这种数字鸿沟是 AI 在 HR 落地的一大障碍。战略空心:缺乏落地蓝图,仅停留在高层愿景许多企业高层对 AI 在 HR 的价值有愿景,但往往缺乏清晰、可执行的落地蓝图和实施策略,造成“战略空心”。McKinsey 的研究显示,92%的企业计划增加 AI 投资,但只有 1%的领导者认为其公司在 AI 部署方面达到成熟水平55。这一巨大差距反映了从战略愿景到实际落地之间的鸿沟。“不清晰的 AI 和生成式 AI 路线图和投资优先级”是高管对 AI 进展不满意的三大主要原因之一56;在缺乏明确的 AI 价值驱动因素的情况下进行投资,只会使决策复杂化,稀释 AI 支出,并造成碎片化的技术格局57。AI 的引入被视为“工具”,而非“战略转型”的一部分。这种战略空心导致 HR 在 AI 实施中缺乏清晰的方向和优先级,使得缺乏明确的 AI 战略、投资回报评估框架和跨部门协作机制,使得 AI 的实施流于形式项目停留在试点阶段,难以规模化推广,或者仅在某些点状环节应用,未能形成系统性价值,最终影响其在降本增效和价值创造方面的潜力。52CIPD.People and Technology:How HR can get the balance right.53Gartner.HR Leaders Magazine:Q1 2025 Edition54Deloitte.2025 Global Human Capital Trends55McKinsey&Company.Superagency in the workplace:Empowering people to unlock AIs full potential at work.56BCG.BCG AI RADAR:From Potential to Profit with GenAI57IBM.New Research:Executive Trust AI03技能断层:HR 团队对 AI 理解与实际技能差距大当前大多数 HR 专业人员的知识体系仍侧重于传统的人力资源管理理论和实践,对于 AI 技术原理、数据科学、算法伦理 等新知识的理解和实际操作技能存在显著断层。他们可能难以识别 AI 在哪些场景能发挥最大价值,也难以与技术团队有效沟通需求,更无法独立运用 AI 工具进行数据分析和决策。这种“数字素养”的缺失是制约 AI 在 HR 领域深度应用的关键因素。Gartner 调研指出,智能时代,HR 如何利用 AI 提升效率并创造价值250405流程阻抗:传统流程难以承载 AI 嵌入与重塑HR 部门的许多传统流程为人工操作设计的固化且复杂。当尝试将 AI 技术嵌入时,往往会遇到流程阻抗。例如,流程刚性、决策权限的不匹配、数据流动的障碍、质量控制机制的不适应以及合规要求的复杂性等都是典型抗阻。BCG 研究发现,AI 转型要求HR 从事务性职能向战略性业务伙伴转变,这需要重新设计工作、角色、职责、工作流、组织和运营模式,以及绩效管理和职业路 径60。这意味着 AI 的有效集成并非简单的工具替换,而是需要对现有流程进行根本性的重塑。然而,许多传统 HR 流程是为线性、标准化的任务而设计,缺乏适应 AI 所带来的敏捷性、迭代性和复杂性的能力:尽管 98%的技术领导者表示员工渴望使用 AI 工具,但 72%的员工难以将其融入日常工作,这反映出员工在将 AI 工具嵌入现有工作流程时面临实际困难61。这种流程阻抗使得 AI 的潜力难以充分释放,阻碍了 HR 实现效率和价值的跃升。AI 的价值最大化需要对原有流程进行彻底的重塑,而非简单的“打补丁”,而这往往涉及到组织内部的变革管理挑战。治理风险:算法黑箱、数据伦理、合规模糊不清尽管企业已在招聘、绩效等环节尝试引入 AI,但“责任与合规”仍是价值兑现的一大“瓶颈”:如前所述,AI 在 HR 领域的应用伴随着数据隐私、算法偏见、公平性、透明度和责任归属等治理风险。PwC“责任 AI”调查显示,仅 11%的企业已全面部署面向人力决策的 RAI 框架62;而 McKinsey 2025 AI 现状研究指出,过去一年 47%的公司在招聘或绩效场景中遭遇隐私泄露、错误输出等负面事件,直接拖慢了规模化进程63。信任也在快速流失Capgemini 今年对 1,500 名 HR/IT 负责人调研发现,对“完全自主”AI 智能体的信任度一年内从 43%跌至 27%,首要的顾虑就是算法偏见与缺乏可解释性64。监管端同步加压:欧盟AI 法案将招聘、晋升等人事决策列为“高风险”,最高罚则达全球营收 7%;纽约市 LL144 已对未做偏差审计的自动化招聘工具开出每日 5001,500 美元的罚单65。风险已显性化加州联邦法院今年 5 月允许“Mobley v.Workday”针对 AI 简历筛选的年龄歧视指控以全国集体诉讼推进,敲响人力资源管理 AI 应用合规警钟66。面向 2026 年强监管拐点,许多企业在这些问题上缺乏明确的政策、指引和内部审查机制,导致 HR 在采纳 AI 时心存疑虑,甚至可能面临法律诉讼和声誉危机。58Gartner.HR Leaders Magazine:Q1 2025 Edition59ATD.Bridging the Skills Gap:Preparing for the Future.60BCG.How Generative AI Will Transform HR61Gartner.HR Leaders Magazine:Q1 2025 Edition(Augmented HR)62PwC.2024 US Responsible AI Survey63McKinsey.The State of AI:How Organizations Are Rewiring To Capture Value64Capgemini.Rise of agentic AI:How trust is the key to human-AI collaboration65SHRM.HR Adopts AI66Fisher Phillips.Discrimination Lawsuit Over Workdays AI Hiring Tools Can Proceed as Class Action:6 Things Employers Should Do After Latest Court Decision不到 25%的 HR 领导者了解新兴技术对员工队伍的影响58。ATD 的研究也显示,技能差距是当前人才发展面临的最大挑战,而 AI相关技能的缺乏尤为突出59。这种技能断层使得 HR 团队难以有效利用 AI 工具,不仅影响了 AI 项目的实施效果,也限制了 AI 技术价值的充分发挥。智能时代,HR 如何利用 AI 提升效率并创造价值26资料来源:PwC,LinkedIn,McKinsey,Capgemini,EU,Holland&KnightAI 治理风险-从“黑箱焦虑”到“强监管时代”智能时代,HR 如何利用 AI 提升效率并创造价值27主动层面:转型先行者的路径洞察尽管挑战重重,一些领先企业已经在 AI 赋能 HR 的道路上迈出了坚实步伐,他们的实践为后来者提供了宝贵的经验。随 着 生 成 式 AI 工 具(如ChatGPT)的普及,员工开始“自带 AI”进入工作场景,利用这些工具辅助完成日常工作,形成了“影子 AI”现 象。最 新 调 查显 示,55%的 员 工 在 工作中使用未经批准的生成式 AI67;46%的办公室人员所用 AI 并非雇主提供68;知识型工作者的实际渗透率已经超过 70i。Micknesy 对比发现,管理层估计仅4%的员工每天有30%以上工作依赖 AI,实际比例却已达 13p足足被低估了三倍71。可以说,不可见、难监控的“影子 AI”正在成为 HR 与 IT 治理的最大灰区,并将HR 治理推入全新临界:即便 78%的 AI 试用员工选择“自带工具”,但缺乏任何官方指引72,且不足 30%的企业为 员工自带AI 制定了正式政策,导致32%的用户刻意对公司隐瞒 AI 使用73。“影子 AI”变革倒逼治理体系升级:员工自带 AI 催生新规则67The Futurum Group.More Than 50%of Workers Admit to Using Unapproved Generative AI Tools68ivanti.2025 Technology at Work Report:Reshaping Flexible Work69Anthropic.(2025).The State of AI in the Workplace70McKinsey&Company.Superagency in the workplace:Empowering people to unlock AIs full potential71AIHR.11 HR Trends for 2025:Embracing Disruption72AIHR.HR Trends Report 202573Schwabe.Employees Using Free or Unauthorized AI Tools at Work?资料来源:本报告综合分析智能时代,HR 如何利用 AI 提升效率并创造价值28并行研究亦揭示同样鸿沟 Ivanti 2025 抽样发现 42%办公人员在暗中使用 ChatGPT,一半源于政策真空或“AI 禁令”74。这种“员工先行、规则滞后”的错位,使数据泄露、算法偏见与决策失真风险快速外溢。这种自下而上的变革力量,反而倒逼企业重新审视 AI 治理,加速制定内部使用规范、数据安全政策和伦理准则。“影子 AI”不是一场简单的 IT 风险,而是对组织信任体系与人力资本安全的系统挑战。HR需要意识到,与其被动等待,不如主动引导和规范员工的 AI 使用,将其转化为组织生产力的正向力量。领先企业已开始从“一刀切封堵”转向“受控共管”,把影子 AI 的灰色领域转化为合规创新的增量土壤,让员工由“偷偷用”变“放心用”,将员工自带 AI 转化为“被授权的创新实验场”,则能在风控与创效之间取得动态平衡,为后续 AI 全域嵌入奠定信任与数据安全基座。驱动因素典型表现业务隐患效率诱因员工用 ChatGPT 等缩短文案撰写、代码调试时间机密外泄:机密数据被写入公共模型,难追踪溯源质量反噬:AI 幻觉以及未经受训使用以及输出把关不足,造成工作效率与质量低下以及合规风险工具门槛低生成式 AI SaaS(如Claude、Bard)“即开即用”IT 失控:IT 合规框架滞后,无法统一管控抵消叠加:人机协作在决策类任务平均表现低于最佳个体(效应量 0.23)政策真空仅 27%组织要求对全部 AI 输出进行人工复核合规责罚高:法规(欧盟 AI Act、美各州审计法)罚款风险攀升 影子 AI 为何激增资料来源:Vena,Harmonic,Stanford University Human-Centured AI,Gov.UK,F5,Nature Portfolio,McKinsey 先行者并非一蹴而就,他们的共同路径是“小规模的AI 试点项目(AI pilot)验证 投资回报量化 规模化扩散”。当单点试点明确价值后,它们逐步将 AI 能力全域嵌入招聘、学习发展、绩效、人才保留等 HR全流程,形成业务与人才双循环闭环,拉开与同行的倍增差距。例如,领先的科技公司已将 AI 深度应用于招聘的全生命周期,从职位描述生成、候选人搜寻、简历筛选、AI 面试评估到入职引导。在学习与发展领域,AI 驱动的个性化学习平台、智能辅导和技能推荐已成为常态。这种 从点到面、从试点到规模化 的策略,有助于降低风险,逐步建立组织对 AI 的信心。AI pilot 全域嵌入:部分企业已将 AI 嵌入招聘、学习发展全流程74Axios.Secret chatbot use causes workplace rifts智能时代,HR 如何利用 AI 提升效率并创造价值29领先企业 AI 试点项目(AI pilot)到全域嵌入的三条鲜明趋势招聘链条:从 AI 简历筛选走向“选-评-配”一体化学习-发展:由内容自动化升级为“超个性学习引擎”组织级扩散:从 IT/HR 内测到全员 CopilotUnilever 的“AI 选才套件”已经覆盖求职预筛、游戏化能力测评、视频面试分析与候选人潜质评分四大环节招聘周期由 16 周压缩至 4 周,人才密度指数提升 25%。更重要的是,这些候选人数据被实时写入 HR 系统,直接触发入职后个性化培训与职业路径规划,实现“选人即育人”的闭环。Josh Bersin 报告指出,AI 原生的 Galil-eo Learn 平台通过大模型动态抓取员工绩效、兴趣与业务需求,对学习路径与微技能模块进行日更级推荐,学完 用完周期缩短 40%以上。LinkedIn 的案例显示,这类“学习-绩效”双向耦合模式,可使学习与发展投资回报率提升 2.1 倍。PwC、JPMorgan Chase、UPS 等公司已把内部 GPT 工具库开放至所有职能,并配套“AI Academy”快速提升提示词与模型使用能力;PwC 透露其 7 万名员工中 超过 65%每周使用内部大语言模型将 AI 由单点服务扩展为“数字劳动力”。Gartner 预计,到 2026 年,50%的财富500 企业将在 HR 全域部署专属大模型,实现招聘-学习-绩效-劳动力规划端到端贯通。资料来源:ResearchGate,Josh bersin,LinkedIn,Business Insider,Gartner AI 试点正加速变为“全域嵌入”。凡能把招聘 学习 绩效数据写入统一模型、用生成式 AI 驱动闭环、并通过三螺旋协同共创的企业,率先完成“功能叠加业务重塑”的跃迁,在效率、人才与增长三条曲线上拉开了与同行的倍增差距。AI pilot 是“信任锚点”,一旦证实价值,先行者会迅速通过数据互联与生成式 AI 微调,将能力嵌入招聘 学习 绩效全链路,形成实时感知、快速响应、持续优化的智能闭环,真正让 HR 从辅助支持跃升为业务增长引擎。生成式 AI 要真正落地 HR,并非 HR 部门单兵作战即可完成;成功的早期转型者无一例外走出了“HR IT 业务三螺旋”协同路径HR 部门作为业务场景和需求方,由 HR 明确人才与流程痛点,IT 提供数据与平台底座、技术支持和安全保障,业务团队输出场景与 投资回报率 诉求并作为最终用户和价值受益者,三方在“小步快跑的共创试点”中同步迭代技术、流程与治理规则,通过共创式试点模式,三方共同定义问题、设计解决方案、迭代优化,确保 AI 应用既符合 HR 的专业需求,又具备技术可行性,并能真正解决业务痛点。例如,在开发 AI 驱动的离职预测模型时,HR 提供历史数据和业务洞察,IT团队构建模型,业务部门(如销售经理)则验证模型的预测准确性和实用性。HRIT 业务三螺旋协同建模:共创式试点成为破局关键何以“三螺旋-单点主导会失败”职能视角不完整微软 Viva 调研发现,HR 与 IT 对生成式 AI 价值感知存在近10 个百分点的落差,缺乏协作会导致选型与度量标准错位,试点失败率上升技术与数据割裂Gartner 指出,超过 60%的 HR 生成式 AI 试点因数据不可用或治理冲突停摆,而这些问题往往归因于 IT 与 HR 未在项目早期对数据主权与合规边界达成共识业务缺席投资回报不清Accenture 对 150 家“重塑者(Reinventor)*”企业研究中发现,只有当业务线与 HR 共同定义 KPI 时,AI 试点进入规模化的概率才会翻倍资料来源:Microsoft,Gartner,Accenture*在 Accenture 的研究框架中,“Reinventor”指的是那一小部分(约 8%)把“全域企业重塑(Total Enterprise Reinvention)作为核心战略、并持续性地以云、数据和 AI 为数字底座,对企业所有职能和业务模式进行端到端重构的领先企业。智能时代,HR 如何利用 AI 提升效率并创造价值30领先者操作范式自主 AI 智能体“Agentic AI”三大能力跃迁模块HR 角色IT 角色业务角色共创收益痛点映射明确人才/流程瓶颈提供数据现状与治理约束罗列业务目标、成功指标统一试点范围与优先级场景建模拆解流程、输出标签评估数据质量与集成成本提供业务例外场景形成最小可行性产品需求包双轨交付设定 HR KPI部署沙箱与监控定义业务目标与关键结果(OKR)&试点人群可在 812 周见效迭代评估跟踪敬业度、离职率追踪模型偏差、系统负载监控产能、营收决策扩散/停机/重构资料来源:公开资料,本报告综合分析资料来源:Accenture.Harnessing the Power of AI Agents“HRIT 业务”三螺旋协同已成为 AI Native HR 转型的必要条件。只有在共创、全链治理 等机制护航下,AI pilot 才能跨越“概念验证陷阱”,快速进入全域嵌入与价值兑现阶段,为组织提供可复制、可扩张的智能运营蓝图。传统的 AI 应用多停留在“任务自动化”层面,即 AI执行预设规则的任务。而随着自主 AI 智能体(Agentic AI)(自主智能体)的发展,AI 正向“自主化”迈进,即 AI 能够根据目标进行推理、规划和执行一系列复杂任务。与早期“宏脚本式自动化”不同,自主 AI 智能体可在约束条件内独立规划步骤、调用工具并迭代结果,直接重塑 HR 工作流。Gartner 预测,到 2027 年40%的 HR 流程将由“人类 智能体 协同”完成,而15%将实现“Agent 完全自主 事后人工审计”75。先行者正把生成式 AI 升级为“自主 AI 智能体”:具备感知 决策 执行闭环能力的自主智能体。使 HR 流程正经历由“任务自动化”向“业务自主化”的质变:在领先企业的招聘、学习与员工服务链条中,智能体不仅生成内容、调用系统,还能围绕业务目标自行规划步骤、迭代结果,并把经验写回模型,形成持续自优的“人-机协同共创”循环。例如,一个自主 AI 智能体可以自主完成从职位发布、简历筛选到初步面试安排的整个招聘流程。这种更高级的 AI 应用需要对现有 HR 流程进行根本性的再造,从“人执行任务”转变为“人与 AI 智能体协同共创”。先行者正在探索如何将 AI 智能体嵌入到核心业务流程中,实现更高水平的效率和价值。自主 AI 智能体助力任务自动化自主化:流程再造与 AI 协同共创并进阶段工具属性典型任务组织收益机器人流程自动化/宏被动执行批量数据录入时间节省 2030%生成式 AI主动生成岗位职责草拟、学习内容创作产出速度 3Agentic AI自主协同招聘“选-评-配”全链;学习发展路径规划;工单闭环全流程时长-50%,运营成本-30uAccenture.Humans,Al and Robots:The economics of reinventing workand the workforce智能时代,HR 如何利用 AI 提升效率并创造价值31未来路径从降本工具到价值引擎的跃迁03HR 利用 AI 的路径并非一蹴而就,而是一个从被动应对到主动演化,从效率驱动到增长引擎的渐进式跃迁过程。01从被动压力到主动机遇被动-主动的转型分界线生成式 AI 正在把 HR 的“自动化曲线”推向“价值创造曲线”。真正的分水岭,是企业及 HR 孤门如何定义 AI 的角色是仅仅当作降本工具,还是升级为价值引擎。两种模式在目标定位、技术角色、数据运用、流程架构、人与 AI 关系五个维度上呈现出截然不同的演化轨迹(见下图)。从被动到主动转型模式对比:从替代思维到协作思维的根本转变资料来源:公开资料,本报告综合分析智能时代,HR 如何利用 AI 提升效率并创造价值33目标定位:从“成本曲线”到“收入曲线”在被动模式下企,企业 AI 投资多聚焦机器人流程自动化,衡量指标是节省工时;Accenture研究发现,此类项目平均 1218 个月后收益趋于衰减,难以持续放大76。主动模式则把 AI 视为增长引擎:BCG 跟踪 200 家“重塑领军企业”发现,80%的 AI 预算被用于开辟新产品、数据驱动定价和精准市场渗透,收益是单纯成本解决的 23 倍77。这一结果建立在“把 AI 定义为协作者、让数据进入预测与规划、并对流程做端到端重构”三个前提之上78。数据运用:从事后报表到实时洞察被动模式的 HR 部门仍依赖季度报表等滞后指标;主动模式借助生成式 AI 与统一数据湖,把招聘、学习、绩效、财务流实时串联,提前识别技能缺口与离职热区,实现“预测 处方”双闭环。McKinsey 案例显示,数据前瞻化可将关键岗位空缺时间缩短 40%,并将人员过剩风险降至原来的一半80。技术角色:从“替代”到“增强”被动模式强调“AI 取代某类岗位”,容易引发抵触情绪并埋下文化隐患;主动企业则将 AI 定位为“超级副驾”,让员工转向价值更高的洞察与决策。Gartner 预测,到 2026 年,采用协作式 AI 的组织在员工敬业度上将领先同行 15 个百分点79,并显著扩大创新管线。流程架构:从“灵活拼接”到“端到端重构”被动框架中,AI 功能只是零星嵌入原有 标准作业程序;主动路径则以“AI 原生”思维重画流程。微软将招聘 入职 学习三条链条统一到 Copilot Studio 平台之上,形成“技能画像任务匹配动态培训”循环,使招聘周期减半,学习与发展投资回报率翻倍81,这表明流程整合才是AI 价值放大的杠杆。人与 AI 关系:从“监督”到“共创”被动模式强调用 AI 监控合规、限制风险;主动模式把 AI 变成员工的“第二大脑”,鼓励 Prompt 设计、Agent 共创。AIHR 2025 报告指出,当超过 50%员工主动提交 AI 场景提案时,企业的 AI 采纳率与产出率之间呈现 0.78 的正相关82说明文化临界点一旦突破,价值曲线随之陡升。76Accenture.Accenture Pulse of Change:Business and Technology Trends77BCG.Closing the AI Impact Gap 202578BCG.The Vitality Code79Gartner.AI in HR:Position Your Organization for Success 80McKinsey&Company.McKinsey&Companys Post:The Job Market is Shifting Fastai is Changing81Intelegain Technologies.Driving ROI with Microsoft Copilot Studio:Top Case Studies&HR scenario-Improve Onboarding and Development Processes(Copilot Studio)82AIHR.HR Trends Report 2025智能时代,HR 如何利用 AI 提升效率并创造价值3402从效率驱动到增长引擎三阶段跃迁路径图谱HR 的 AI 转型可以被划分为三个渐进且相互关联的阶段,每个阶段都带来不同层次的价值增益,并为下一个阶段奠定基础-自动化兑现“时间红利”、智能协同释放“洞察红利”、生态整合放大“增长红利”。阶段特征在此阶段,AI 不再仅仅是执行自动化任务,而是开始提供 智能洞察和辅助决策支持,并实现个性化服务。HR 与 AI 形成更紧密的协同关系。关注要点数据整合与清洗、算法模型选择与优化、人机协作模式设计、确保 AI 决策的可解释性和公平性。价值命题让 AI 充当“副驾”,生成式 AI 与云数据湖合流,提供预测决策个性化服务;招聘 学习 绩效 敬业度形成“感知响应优化”闭环,实现技能缺口、离职热区实现小时级预警;HR 决策由“事后报表”升级为“实时处方”;并促进 HR 的角色由“执行者”变为“洞察供应商”,实现从支持到赋能的跃迁。管理启发闭环洞察让 HR 能够以量化证据连接“员工体验业务成果”,为进入价值对话提供敲门砖。阶段特征这是 AI 应用最基础也最直接的阶段。核心在于利用 AI 和机器人流程自动化等技术,自动化处理 HR 日常工作中重复性高、规则明确的事务性任务。关注要点识别高重复性任务、选择合适的自动化工具、确保数据质量和流程标准化。价值命题让 AI 充当“数字流水线工”,接管入职文件、福利申请、薪酬计算等规则化任务。管理启发自动化释放出的时间并不会自动转化为战略贡献,需 要 CHRO 主 动将“工时红利”再投资到人才洞察与文化建设。自动化阶段:任务自动处理,释放 HR 工时智能协同阶段:AI 辅助决策与个性化服务智能时代,HR 如何利用 AI 提升效率并创造价值35生态整合阶段:AI 原生 HR-HR to HR 到 HR to Business 阶段特征这 是 AI 赋 能 HR 的 最 高阶段。AI 在此阶段实现了跨越整个组织价值链的无缝、智能整合。这一阶段标志着 HR 系统的全面原生化转型,即从设计之初就将生成式 AI 嵌入核心架构,形成一个动态、自适应的生态系统。HR 系统完全以“AI 原生”模式构建,即从底层设计就将生成式 AI 和智能算法作为核心架构,而不是事后嵌入。HR 不再是孤立的职能模块,而是通过内部闭环(HR to HR)实现无缝数据流动,并扩展到与业务系统的深度融合(HR to Business)。关键特征包括:数据驱动的实时决策、跨模块的自学习优化,以及 HR 作为组织“智能中枢”的角色定位,最终驱动组织韧性和战略执行力的指数级提升。价值命题通过构建数据驱动的人才生态系统,HR 能够实现 30-50%的效率、速度和效果或投资回报率提升,不仅优化技能差距分析与内部流动性,还将 HR 从人力支持者转变为业务增长引擎,释放组织整体生产力和创新潜力83。关注要点HR to HR 内部整合-聚焦端到端模块互通,如招聘数据自动流入学习路径,绩效洞察反哺人才匹配,确保系统具备自学习能力;HR to Business 外部融合-强调与财务、销售、运营系统的联动,例如薪酬数据对接财务模型,实现人效产出的动态测算;生态治理-优先处理数据隐私、算法透明度和跨域合规,确保 AI 原生架构的可持续性和信任基础。管理启发人力资本即服务(HCaaS),CHRO 获得与 CFO 同级的“资产经营盘”可用人效、边际贡献率讲清人力投资为何直接拉高投资资本回报率。闭环洞察让HR能够以量化证据连接“员工体验业务成果”,为进入价值对话提供敲门砖。领导者应将 AI 视为组织 DNA 的一部分,推动跨部门共创模式(如 HR-IT-业务三螺旋),并通过试点验证生态闭环的价值。同时,注重人才再造,投资于 AI 技能培训,以桥接内部技能差距,确保转型从技术驱动转向文化赋能。83BCG.CEOs Guide to Maximizing Value Potential from AI in 2024智能时代,HR 如何利用 AI 提升效率并创造价值3603从概念到规模化价值SaaS AI 的加速引擎作用要实现 AI 在 HR 领域的规模化价值,软件即服务(SaaS)与 AI 的深度结合是关键的加速引擎。SaaS 即服务 AI 即能力,组合出“可插即用”的价值曲线-HR 全流程智能平台传统本地部署的软件成本高、周期长、维护复杂,而 SaaS 模式的 HR 系统天然具备“云端化、标准化、易部署、持续迭代”的优势。一旦将 AI 能力内嵌于 SaaS 化的HR 平台,企业便可无需自建底层算力与研发团队,只需订阅服务,就能把最新的 AI 能力像“插件”一样接入业务流程。例如,SaaS 化 的 智 能招聘平台内置了 AI 简历解析和匹配功能,SaaS 化的学习平台提供了 AI 个性化推荐。这种模式极大地降低了 AI 的采纳门槛,加速了 AI 价值的快速实现。HR 全流程智能平台将这些 AI能力进行统一集成,为企业提供一站式、端到端的智能化解决方案。SaaSAI 的核心优势成本优势 自动化能力:机器人流程自动化与智能助手可替代大批重复性事务,HR运营成本平均降低 30%;订阅模式:无需昂贵硬件和自建 AI 团队,只需按需付费,即可获得最新自动化、预测和个性化功能;流程重塑:将任务原子化后智能调度,进一步压缩不必要的岗位开支。技术优势 专业化模型 行业经验:SaaS 厂商内置中性算法与合规组件,集成数据洞察与风险识别能力,确保输出质量与安全性;标准化接口:统一的数据湖和开放应用程序接口规范让个性化推荐、实时预测等功能可稳定调用;持续迭代:云端模型由厂商维护,前沿技术更新频率高,快速支持新兴场景。实施优势 即插即用:AI简历解析、员工360画像、智能合规审查等模块“一键启用”,无需二次开发;低门槛集成:通过开放应用程序接口与人力资源信息系统、招聘管理系统快速对接;业务流程嵌入:内置的流程重塑工具可将“预测处方”闭环快速植入招聘、培训、绩效等全流程。维护优势 云端自动迭代:SaaS 平台负责模型迭代与安全补丁,HR 无需自建运维团 队;持续支持:供应商承担系统维护与合规模型审计,HR 可聚焦业务策略;弹性扩展:当业务增长或场景变更时,可随时开通或下线个性化与风险识别能力,保持系统灵活性。资料来源:公开资料及本报告综合分析智能时代,HR 如何利用 AI 提升效率并创造价值37SaaS 即服务 AI 可插即用 的价值实现机制标准化接口使得 AI服务能够快速集成到企业现有的系统中现代的 SaaS AI 平台通常提供应用程序编程接口和回调通知等标准接口,企业的信息技术团队能够快速完成集成工作。可视化配置工具使得非技术人员也能够配置和使用 AI 功能通过拖拽式的界面和向导式的配置流程,HR专业人员能够自主完成AI 应用的配置和优化。预训练模型减少了企业的数据准备和模型训练工作SaaS AI 平台通常基于大量的行业数据进行预训练,企业只需要提供少量的定制化数据就能够获得良好的效果。即时价值展现机制使企业能够快速看到 AI应用的效果SaaS AI 平台通常提供实时的效果监控和价值评估工具,帮助企业量化 AI 应用的价值。01020304资料来源:公开资料及本报告综合分析从模块导入 场景协同 数据联动,实现 HR“AI 原生化”“AI 不是替代 HR,而是在云平台中重新定义它的边界。84”SaaSAI 的加速作用体现在从单点模块的AI 导入,逐步发展到多场景的协同,最终实现数据的深度联动和 HR 的“AI原生化”。模块导入初期,企业可能选择在某个特定 HR 模块(如招聘)导入 SaaS AI 解决方案。多数组织先从高重复、结构化场景上云:机器人流程自动化聊天机器人接管入职文档、工单答复等事务,IBM 在季度晋升流程中一次性释放 12,000 小时工时红利。84Accenture.Reinventing HR in the Generative AI Era智能时代,HR 如何利用 AI 提升效率并创造价值38场景协同随着应用深入,不同模块间的 AI 能力开始协同工作,例如招聘系统与入职系统通过 AI 实现数据无缝对接。随着数据在云中汇聚,生成式 AI 开始横向调用招聘、学习、绩效三大模块的事件流,形成“感知-响应-优化”闭环:Microsoft报告显示,集成平台可依据招聘评估与学习行为实时生成个性化培养计划,直接绑定业务场景需求85。数据联动最高境界是实现所有 HR 模块(包括招聘、绩效、学习、薪酬、规划)的数据通过 AI 中枢进行实时、双向、智能联动。这将最终使得 HR 系统成为一个“AI 原生”的、智能感知、自主优化的有机体,真正实现 HR 的数字化、智能化转型:统一数据湖技能云 AI 中枢,把 HR 数据与财务、运营、销售彻底打通,形成自学习的人才生态系统。McKinsey 估算,当生成式 AI 渗透到端到端流程后,可为全球经济新增 2.64.4 万亿美元年化价值,其中人力资本运营是最具可兑现潜力的板块之一86。AI 原生化 的实现路径资料来源:公开资料及本报告综合分析从传统的经验驱动转向数据驱动,从直觉判断转向算法决策调整组织结构和角色分工,适应 AI 时代的工作模式重新设计业务流程,使其能够充分发挥 AI的优势建立数据文化和创新文化,鼓励员工拥抱AI 技术文化转型流程转型组织转型思维转型SaaS 带来的是“即服务”的交付模式,AI 带来的是“即能力-随取即用”的扩张逻辑,两者结合让 HR 得以用订阅式的速度、平台级的规模和生成式 AI 的创造力,在短短数月而非数年内走完“从概念验证到全域落地”的漫长征程。下一轮竞争的分水岭,不再是谁拥有最多功能,而是谁能率先把 SaaS-AI 平台打造成价值倍增的底座让人力资本数据与业务结果在统一的智能操作系统上持续循环、持续放大。85Microsoft.Work Trend Index 202486Mickinsey.Technology Trends Outlook 2023智能时代,HR 如何利用 AI 提升效率并创造价值39AI 解决方案与价值点从业务痛点到产品价值的系统穿透二HR 的核心价值链可拆分为五大支柱人才获取、学习与发展、绩效与敬业度、薪酬与合规及人力资源规划。每一环节都是实现组织目标、推动业务增长的关键“杠杆”,而 AI 技术则贯穿始终:以自动化流程、数据洞察和智能推荐为引擎,将传统的“人海战术”全面跃升为“智海策略”。AI 赋能人方资源管理:五大核心领域变革智能时代,HR 如何利用 AI 提升效率并创造价值4101人才获取精准匹配与效率飞跃01场景痛点与 AI 价值杠杆智能引才的迫切需求智能时代,HR 如何利用 AI 提升效率并创造价值87SHRM,2023-2024 SHRM State of the Workplace88BCG,What Job Seekers Wish Employers Knew89Employ,Report Reveals Candidates Perspectives on Using AI in the传统的人才获取流程,特别是对于中小型企业而言,往往伴随着显著的痛点,这些痛点不仅影响招聘效率,更可能导致优质人才的流失。首先,当前招聘流程普遍冗长且效率低下,从职位发布、简历收集、初步筛选,到多轮面试、背景调查、录用通知发放乃至最终入职,整个过程可能耗费数周乃至数月。“冗长或复杂的招聘流程”作为 HR 工作前五大痛点之一87,流程上的失速将直接吞噬机会成本;更糟糕的是,52%的应聘者会因一次负面体验当场拒绝本已极具吸引力的 录用,而“拖延”和“重复面试”正是最致命的负面标签88。除“时间赤字”外,主观评估偏差也在放大招聘风险。手工筛选与面试容易被无意识偏见左右,既拖慢进度,也为歧视诉讼埋雷;若能让算法承担模式识别与基准对齐,HR 则可把有限时间投入更具价值的候选人沟通与雇主品牌建设。另一个增速痛点是异地雇佣及合同签署:远程工作逐渐常态化,但小企业在多地合规与批量签约上缺乏成熟工具,导致“面试结束正式入职”之间平均又被插入了文件往返的时间。AI 技术的引入为人才获取带来了革命性的变革,通过自动化、数据分析和智能推荐,将招聘从劳动密集型转向知识密集型,从而实现更精准、更高效的人才匹配。AI 的核心价值在于其自动化能力,能够自动处理简历解析、初步筛选、面试安排等重复性任务,大幅缩短招聘周期,释放 HR 人力。LinkedIn数据显示,对于正在试用或已实际使用生成式 AI 进行招聘的组织,平均每周可节省约 20%的工作时间,相当于整整一天的工作量。这种效率的提升,使得 HR 招聘团队能够从繁琐的事务性工作中解放出来,将更多精力投入到与优质候选人建立长期联系、优化招聘用户体验以及为业务部门提供用人策略建议等更具战略性的工作中。AI 驱动的精准匹配是其另一大价值杠杆。AI 通过分析海量数据,包括简历信息、行为数据和技能图谱等,根据岗位需求精准推荐候选人,并能够识别出传统方法难以发现的“隐性能力”。这种基于技能的匹配方式,能够超越学历和经验的限制,发现更具潜力的复合型人才。这种转变不仅提升了招聘速度,更重要的是通过数据和算法的客观性,有效缓解了传统招聘中普遍存在的主观性偏见,从而提升了招聘的公平性。研究显示,61%的求职者认为 AI 能让招聘“更具公平性”89,而公平性反过来又能吸引更广泛和多样化的人才,进一步提升招聘质量。最终,自动化流程和个性化推荐能够为候选人提供更流畅、及时的互动体验,降低放弃率,从而提升企业在人才市场中的竞争力。智能时代,HR 如何利用 AI 提升效率并创造价值4302AI 赋能解决方案与核心能力体现智能招聘辅助:AI 简历解析、智能匹配与职位描述优化高效远程招聘与入职:跨地域协作与智能合同管理AI 面试评估与协作:智能视频面试、行为分析与决策辅助AI 在招聘流程的前端发挥关键作用,通过自动化和智能化,提升招聘的效率和精准度。AI 能够快速、准确地解析不同格式的简历,提取关键信息,如技能、经验和教育背景等,并根据预设的岗位要求,进行智能匹配和排序。这大幅减少了 HR 人工筛选简历的时间,尤其适用于大规模简历初筛、高效率候选人匹配和个性化岗位推荐等场景。此外,AI 还能根据岗位需求、行业特点和目标候选人画像,辅助 HR 生成具有吸引力、无偏见的职位描述,从而提升职位发布的吸引力和精准度,吸引更符合要求的候选人。LinkedIn 报告指出,57%正在使用或测试生成式 AI 的招聘专业人士认为,AI 带来的最大收益是“更快、更轻松地撰写职位描述”,从而显著提升职位发布效果。AI 和协作平台解决了远程招聘和入职的地理限制和流程复杂性,显著提升了效率和员工体验。远程视频协作平台,支持高清视频会议、屏幕共享和实时互动等功能,使得跨地域的线上宣讲会、远程面试和团队协作成为可能,有效拓展了人才获取范围,并降低了招聘成本。腾讯会议能够实现企业招聘的一站式闭环操作,满足不同行业、职级和场景的招聘需求。同时,智能合同签署与批量管理功能加速了入职流程,提升了员工入职体验。智能合同管理系统,例如腾讯电子签,支持电子合同的批量发起、远程签署、全生命周期管理与流程自动追溯,确保法律效力与合规性。这大幅加速了异地员工的入职流程,提升了新员工的数字化入职体验。这些功能主要应用于线上宣讲会、远程面试、异地员工快速入职和人事合同批量签署等场景。AI 将面试环节从主观判断推向数据驱动的客观评估,显著提升了面试效率和决策质量。智能视频面试工具能够集成 AI 能力,对候选人的语音语调、面部表情、语义情感进行分析,并提供标准化能力评分。AI 还能分析候选人在面试中的非语言行为和语言表达,识别其沟通能力、逻辑思维、情绪稳定性等深层特质,为 HR 提供多维度洞察。AI 提供的客观数据和分析报告,辅助面试官进行更科学的决策,减少主观性,确保评估的公平性和一致性。面试后,AI 可生成面试纪要与关键信息总结,并自动上传至 HR 系统,方便面试官回忆细节并提交评价。这些功能主要应用于初步面试筛选、候选人行为分析、面试官辅助决策和跨地域远程面试等场景。智能时代,HR 如何利用 AI 提升效率并创造价值4490Robert Half,2024 Salary Guide91BCG,For In-Demand Job Seekers,a Poor Recruiting Experience Is a Deal Breaker03价值创造与示例在传统招聘链路中,“排期冗长多轮面试签约分散”像三道连续的减速带。排期冗长带来的直接后果是候选人加速流失:57%的求职者在投递后 10 个工作日若收不到反馈便会放弃该职位 90;52%的候选人会因一次负面招聘体验直接拒绝本已具有吸引力的“橄榄枝”91。更隐蔽却同样严重的损失是雇主品牌LinkedIn 研究表明,81%的候选人会因一次糟糕面试重新评估对公司的整体印象。生成式 AI 的引入为这一痛点打开了“时间压缩体验拉升数据沉淀”的三重价值通道。McKinsey 研究测算,人才获取 入职环节占 HR 全部生成式 AI价值潜力的 20%,位列各子职能之首。AI 将候选人的教育、项目、技能即时向量化,与岗位画像实时比对;大模型协同的智能排程把日历碰撞、邮件往返等边际操作下沉至系统;面试中对多模态信号(语言、表情、语义情感)的同步分析,使面试官决策从主观“印象流”跃迁到可追溯的量化依据;最后,通过知识库 流程引擎的“继电”写入人力资源信息系统,候选人与企业在“录用前”就已形成完整的数字档案,为后续入职及职业体验铺好数据底座。麻省理工斯隆管理评论杂志 的一项纵向跟踪研究表明,部署 AI 全链路招聘的企业招聘所需时间平均缩短 75%,且在一年内将招聘成本 每雇用降低 30%以上。随着招聘流程智能化与远程协作常态化的双重演进,企业对高效、稳定、安全的视频面试平台提出了更高要求,从“能用”走向“好用”与“可集成”成为核心诉求。在这一背景下,腾讯会议作为一款具备出色产品力与高可扩展性的 AI 工具,通过与招聘系统、企业人力资源系统的深度集成,以智能排程、AI 记录与多端稳定连接为核心优势,帮助 HR 真正实现从候选人筛选到面试管理的全链路效率跃升。智能时代,HR 如何利用 AI 提升效率并创造价值45资料来源:腾讯未来招聘:腾讯会议赋能,聚焦人才拥有您的专属 AI 面试助理,让您专注于 人 释放 HR 潜能,智选未来英才。全流程自动化:与 HR系统深度融合,从筛选到入职 全球无界面试:稳定高效的全球视频会议方案一体化智能平台 面试前:从容的协调者智能排期,高效邀约 面试中:敏锐的洞察者实时洞察,智能引导 面试后:高效的分析者结构化报告,精准锁定专属 AI 面试助理 数据安全:多重安全防护与精细权限管理 安心无忧:确保 HR敏感信息安全信息安全守护智能时代,HR 如何利用 AI 提升效率并创造价值4602学习与发展知识资产驱动学习与人才跃迁01场景痛点与 AI 价值杠杆知识资产驱动的学习变革AI 技术的引入为学习与发展带来了从“培训管理”到“学习赋能”的战略升级,通过智能化手段盘活知识资产,构建以员工为中心的智适应学习体系。AI 能够自动化知识的收集、分类、标签化和检索,将散落在各处的隐性知识转化为显性资产,并实现智能推荐,从而有效解决知识流失和利用率低的问题。这种转变使得企业能够更有效地积累和利用其集体智慧。在个性化学习方面,AI 能够根据员工的技能画像、岗位需求、学习偏好和绩效数据,智能推荐定制化的学习内容和路径,实现“千人千面”的智适应学习。这大幅提升了学习效果和员工参与度,确保每个员工都能获得最适合其发展的学习资源。同时,AI 助手、AI 陪练和数字人讲师等工具的出现,为员工提供了实时答疑、模拟训练和项目辅导,使得学习变得更具互动性和实践性,有效弥补了传统培训中互动不足的缺陷。此外,AI 通过分析学习数据和绩效数据,能够更精准地衡量培训效果和投资回报率,为学习与发展策略的持续优化提供数据支持,从而将 学习与发展从成本中心转变为价值创造中心。智能时代,HR 如何利用 AI 提升效率并创造价值92LinkedIn,2024 Workplace Learning Report在当下竞争格局下,企业最宝贵的无形资产知识,正因人才流动、组织扩张而面临流失风险。依赖手工录入与孤立文档管理,导致知识更新与共享效率低下,严重延缓新员工上手和跨部门协同。与此同时,90%的组织已将“通过学习保留人才”列为首要策略92;若无法在合适时机提供高质量、个性化的学习内容,企业将面临人才流失与业务创新双重损失。培训资源的分散与重叠也造成了严重冗耗:一名新经理往往在不同系统、不同格式的文档间切换数十次,才得以获取关键知识;而对“哪些内容最能弥补技能缺口”和“学习后何去何从”缺乏实时测量,令学习与发展团队无从评估投入产出比。最重要的是,员工技能的半衰期正在加速,个性化成长难以实现。随着技术进步和市场变化,员工技能的“半衰期”显著缩短,这意味着员工需要持续学习和更新才能保持竞争力。然而,传统的“一刀切”式培训难以满足员工多样化的学习需求和个性化发展路径,导致学习效果不佳,员工成长受限。例如,麦肯锡(McKinsey)报告指出,39%的现有技能组合将在 2025-2030 年间被淘汰或转型,这进一步凸显了传统学习与发展模式的局限性。智能时代,HR 如何利用 AI 提升效率并创造价值48大规模文本、视频与对话中提取关键信息,动态构建“主题实践案例”三元知识地图,为组织保留难以书面的隐性经验。根据员工技能画像、岗位要求与发展意愿,实时推送“微课程专题研讨实战模拟”的最优组合,让每个人的学习都“水到渠成”。AI 驱动的学习分析引擎,可在学习过程中自动采集行为信号(如完成时长、测试成绩、应用场景点击),并生成投资回报率与能力提升预测,帮助学习与发展领导者迅速调整内容与节奏。跨部门知识共享、导师网络与学习社区,借助自然语言处理与推荐算法,将内外部最佳实践无缝对接,激活“经验分享优化”的持续循环。知识沉淀自动化:即时效果测评与反馈:1324个性化学习路径生成:组织内外部协同闭环:这些杠杆使学习与发展职能从“培训管理者”蜕变为“人才赋能者”,并将知识资产真正转化为驱动业务与创新的核心引擎。AI 为此提供了四大价值杠杆02AI 赋能解决方案与核心能力体现 AI 在 学 习与发展领域提供了一系列赋能解决方案,这些方案通过智能化的核心能力,全面提升了知识管理、个性化学习和学习社区建设的水平。AI 驱动的知识库是企业学习的基石,确保知识的有效积累和高效利用。AI 能够实现智能化知识沉淀、分类、检索与推荐,从而有效积累、更新和盘活企业知识,解决知识流失高、沉淀少、利用率低的问题。在实践中,AI 驱动的分类体系和精细权限管控确保了知识能够精准触达目标人群;内容自动推荐功能则能根据用户的学习记录和岗位标签等行为数据,自动匹配关键知识,提升知识的利用效率。此外,智能安全防护功能,包括防泄密控制(如限制打印、截屏水印、下载追踪)和敏感词自动处理,能够有效守护企业核心知识资产,满足合规要求。这些功能主要应用于企业内部知识沉淀、常见问题解答管理、新员工快速学习和经验复用等场景。企业智能知识库构建与管理:知识沉淀、分类、检索与推荐智能时代,HR 如何利用 AI 提升效率并创造价值49AI 根据员工个体特征,提供定制化的学习体验,加速技能成长。AI 能够根据员工技能画像、岗位需求和学习偏好,智能推荐课程与学习资源,提供智适应学习路径。AI 助手、AI 陪练和数字人讲师则能提供实时答疑、模拟训练和项目辅导,显著提升学习效果。在实践中,AI 能够整合员工全年的学习和贡献数据,生成个性化年报,激活知识复用率。Salesforce 和联合利华等公司已通过采用个性化学习系统,取得了显著效果,将员工参与度提高了 44。AI 还能策展个性化的个人发展计划,根据技能差距、职业抱负和组织需求,提供适应性学习推荐,促进员工持续成长。这些功能主要应用于员工技能提升、岗位转岗学习、新业务知识培训和入职培训等场景。AI 通过促进员工间的知识共享和交流,营造开放、无边界的学习型组织文化。AI 赋能的协作平台能够促进员工间知识共享与交流,营造开放、无边界的学习型组织文化。例如,通过智能推送引擎,AI 能够根据员工学习进度和岗位变化,自动触发知识包推送,从而激活知识复用率。这些功能主要应用于内部论坛、兴趣小组、项目协作和企业文化宣导等场景。个性化学习路径与智能辅导:AI 驱动课程推荐、智能助手与数字人讲师学习社区与文化建设:AI 赋能协作与知识共享93 Moka,How Personalized Learning Drives Employee Career Success智能时代,HR 如何利用 AI 提升效率并创造价值50 94Harvard Business Review,Six Strategies for Scaling Learning in a Rapidly Changing World03价值创造与示例在传统的入职培训中,新员工往往需要 24 周才能熟悉流程与工具,各业务部门往往各自为阵:流程手册散落在不同系统,常见问题解答常因无人维护而过时,导师辅导也因排期冲突而碎片化。系统化的入职培训可将新员工上手速度提升 50%,并显著降低初期离职率与绩效误差94。然而,在多数中小企业,由于缺乏统一的知识库与智能推荐机制,新员工仍面临“要么全靠自学,要么等待指派”的二选一困境,既浪费时间也影响体验。随着 AI 技术在组织学习领域的深入应用,越来越多企业开始尝试以智能知识平台替代传统培训手册与手工安排,从而实现高效、个性化的学习体验。在这一趋势下,腾讯乐享作为企业“数字大脑”的代表方案,以 AI 知识库为核心,帮助 HR 打通从知识管理到人才培养,再到业务赋能的闭环路径,重构学习与发展的新范式。腾讯乐享沉淀无形知识,汇聚有形价值,为 HR 构建了一套全流程智能化的人才培养体系。资料来源:腾讯统一知识平台隐性知识资产化安全权限管控AI 私人教练AI 实战陪练学习路径可视化AI 助推销售无缝融入业务流知识价值量化三大核心领域变革腾讯乐享驱动 HR 价值智能时代,HR 如何利用 AI 提升效率并创造价值5103绩效与敬业度数据驱动的洞察与提升-洞察-驱动绩效与体验闭环01场景痛点与 AI 价值杠杆数据脉搏将洞察转为行动在传统的绩效管理体系中,年终评估往往因频次过低、角度单一而难以反映员工真实状态。Gartner 研究指出,仅有不到 18%的 HR 领导认为当前的绩效管理系统能有效达成其目标,这导致评价结果难以激励员工和指导管理者。与此同时,绩效评估的主观性容易引发公平性质疑缺乏标准化流程的评估会让员工对评分结果产生不信任,进而损害敬业度和组织认同感。对于员工敬业度的测量,则更依赖年度或半年度的大型问卷,存在周期过长、响应率低、分析滞后等痛点;传统调查无法实时捕捉情绪波动,也难以将发现转化为具体行动。研究显示,基于静态模型的离职风险预测仅能将流失率降低 58%左右,且往往在问题爆发后才发出警示95。AI 技术通过大数据分析、机器学习和自然语言处理等技术,将绩效和敬业度管理从静态、主观的评估转变为动态、客观的洞察,从而驱动绩效提升和员工体验优化,形成“洞察-行动-反馈”的闭环。AI 赋能的核心在于其实时与预测性分析能力。AI 能够实时分析员工的工作数据、沟通文本、脉搏调研结果等,识别模式并预测趋势,例如绩效完成情况、离职倾向等,从而实现前瞻性管理。这种预测能力使得 HR能够提前识别潜在风险,并及时采取干预措施。AI 带来的另一个关键价值是客观量化与去偏见。AI 通过算法对海量数据进行处理和分析,减少了人为偏见,提供标准化、多维度的客观评估和量化指标,从而提升了评估的公平性和准确性。这使得绩效评估结果更具说服力,也更容易被员工接受。此外,AI不仅仅是数据收集器,更是智能分析师。它能够从海量数据中提炼核心洞察,并提供可操作的干预建议,帮助 HR和管理者将洞察转化为实际行动。这种从“数据堆砌”到“智能决策洞察”的转变,使得 HR能够更有效地支持业务决策,从而驱动绩效与体验的闭环。智能时代,HR 如何利用 AI 提升效率并创造价值95Financial Management,Using Predictive Analytics in Employee Retention智能时代,HR 如何利用 AI 提升效率并创造价值5302AI 赋能解决方案与核心能力体现AI 在 绩 效与敬业度管理中提供了一系列赋能解决方案,这些方案通过智能化的核心能力,全面提升了绩效洞察、情绪分析和多维度评估的水平。AI 通过对多源数据的实时分析,为绩效管理提供动态、前瞻性的支持。AI 能够分析员工工作数据和项目进展,预测目标&关键结果完成情况,并识别离职倾向,从而提供预警和干预建议。在实践中,AI 可以整合来自项目管理工具、协作平台和 HR 系统等的数据,构建员工绩效的实时视图。通过机器学习模型,AI 能够识别与离职相关的行为模式和情绪信号,从而提前预警高风险员工。这些功能主要应用于绩效进展跟踪、高风险员工识别和绩效辅导支持等场景。实时绩效洞察与预测:工作数据分析与离职倾向预警AI 能够通过智能脉搏调研和职场社交文本(如内部沟通平台信息)的情感分析,实时捕捉员工情绪变化,量化敬业度水平,并识别组织健康度。高敬业度团队对企业而言商业回报尤为显著,Gallup 对数万业务单元的长期元分析指出,高敬业度团队的生产力相比低敬业度团队高出 17%,为企业持续投资“动态敬业度监测”提供了直接的商业理由。在实践中,AI 驱动的脉搏调研能够灵活设置调研频率和内容,实时收集员工反馈,并通过自然语言处理技术对文本评论进行情感分析和主题聚类,揭示员工心声背后的深层原因。这些功能主要应用于员工满意度调研、组织文化评估、员工福利优化和危机管理等场景。AI 提升评估的全面性和报告的智能化水平,将“数据堆砌”转化为“智能决策洞察”。AI 能够辅助设计智能问卷,支持360 度评估和在线测评,并生成深度报告,进行观点聚类和情感分析,最终将数据堆砌转化为智能决策洞察。在实践中,AI 可以根据评估目的和受众,智能推荐问卷题目、评估维度和评估对象。在数据收集后,AI 能够自动生成可视化报告,并对复杂数据进行智能解读,提炼关键洞察,提供行动建议。这些功能主要应用于年度绩效考核、人才盘点、晋升评估和团队建设等场景。多维度评估与智能 报 告:AI 辅 助问卷设计与深度洞察生成员工情绪与敬业度分析:智能脉搏调研与情感分析智能时代,HR 如何利用 AI 提升效率并创造价值54 96 Harvard Business Review,Artificial Intelligence at Work:Enhancing Employee Engagement and Business Success03价值创造与示例AI 在绩效与敬业度管理中创造的价值,核心在于将海量数据转化为可行动的智能洞察,从而实现人本管理和业务增长的良性循环。AI 使得企业能够从表面化的“数据收集”深入到对“员工心声”的真正理解,并从简单的“数据堆砌”跃升为“智能决策洞察”。采用 AI 分析与个性化干预绩效的组织,其员工满意度平均提升了 20%,离职率降低 15。AI 辅助的客观评估和多维度反馈显著提升了绩效评估的公平性和有效性。例如,Gartner 调查发现,约 87%的员工认为算法能够提供比人类主管更公平的绩效反馈。实时情绪洞察和敬业度分析,使企业能够及时发现并解决员工问题,从而提升员工体验和满意度,进而提高人才保留率。AI 自动化数据收集和报告生成,释放了 HR 和管理者的精力,使其能够专注于更高价值的绩效辅导和人本关怀,从而全面提升管理效能。在这一背景下,具备强大调研、分析与自动化能力的平台,正成为 HR 管理绩效与敬业度的“新基建”。腾讯问卷便是其中的代表之一,凭借 AI 驱动的在线调研能力,支持高频脉搏调查,实时采集员工反馈,并通过情感分析与观点聚类,将海量原始数据转化为可操作洞察。平台还能预测离职风险与组织健康状态,提供预警并辅助干预;无纸化流程、私有化部署与分级权限确保安全合规,显著提升管理效率并降低成本。资料来源:腾讯腾讯问卷:赋能绩效与敬业度管理以AI赋能,腾讯问卷在绩效与敬业度管理中发挥关键作用,实时收集员工反,洞察情绪变化,助力企业提升管理效能。智能时代,HR 如何利用 AI 提升效率并创造价值5504薪酬与合规公平透明与数字化风控01场景痛点与 AI 价值杠杆把透明与信任编进算法过去十年,各国陆续推出强制披露与同工同酬法规:欧盟薪酬透明指令自 2026 年起要求用人单位当性别薪酬差距 5%时必须共同制定矫正计划,且员工享有查询同岗工资的法定权利;美国已有 16 个州要求在招聘广告中公开薪酬区间,企业若违规最高可面临百万美元罚款。然而,由于流程碎片、人工审计滞后、数据口径不统一,导致隐蔽风险难以及时暴露。同时在多元、公平、包容和归属感战略投资趋势中,薪酬公平性已成为企业的核心关注之一,74%的高管将薪酬公平视为“中度”或“高度”战略优先级97,而影响薪酬公平的结构性因素若仅靠年度静态表格难以洞察。其次,合同与用工流程审查复杂且效率低下。人事合同,如劳动合同、保密协议和竞业协议等,数量庞大且条款复杂,人工审查不仅耗时耗力,还容易遗漏潜在的法律风险。用工流程,例如员工的入职、转岗和离职,涉及多个环节和部门,手工操作易出错,效率低下,给 HR 部门带来巨大的行政负担。AI 技术通过其算法的客观性、数据处理的效率和风险识别的精准性,为薪酬与合规管理构建起一道坚实、透明的数字化防线。AI 能够自动比对海量薪酬数据,识别潜在的不公现象,并提供数据支持进行调整,从而将薪酬决策从经验判断转向算法支撑,显著增强薪酬的公平性和透明度。这种转变有助于消除员工对薪酬体系的疑虑,提升员工满意度。智能时代,HR 如何利用 AI 提升效率并创造价值97 SHRM,How Organizations Can Take a Systematic Approach to Pay Equity98 Medium,The Compliance Technology Stack:Automating Audit Readiness99 FortifyData,How Automated Compliance Reduces Risk and Saves Money100Moka,How AI Can Help Organizations Achieve Pay Equity in 2025在风险识别与自动化方面AI 能够智能审查合同条款,识别法律风险;同时,自动化处理日常人事事务,并实现流程的自动编排与风险追溯,这大幅提升了效率并降低了合规风险。例如,自动化合规可使企业节省至少 70%的审计准备时间98,并使合规罚款减少 30%。在实时监控与量化风控方面,AI 通过持续监控数据和流程,能够实时预警合规风险,并提供量化分析,帮助企业从被动的“合规风险”应对转向主动的“智能风控”。这种前瞻性管理能力使得企业能够更有效地规避法律和财务风险,从而提升用工安全性。02AI 赋能解决方案与核心能力体现AI 在薪酬与合规领域提供了一系列赋能解决方案,这些方案通过智能化的核心能力,全面提升了薪酬公平审计、智能合同管理和人事流程自动化的水平。领先解决方案以公共薪酬数据、内部人力资源管理系统与市场行情为底稿,通过算法自动聚类岗位特征,衡量性别、地域、族裔等维度的薪酬差异,并即时生成纠偏建议。研究显示,引入 AI 驱动的薪酬审计后,薪酬差距识别准确率提升 65%,薪酬计算错误率下降 92%,且薪酬基准化实施速度提高 550。AI 驱动薪酬公平审计:让“同岗同薪”不止于口号智能时代,HR 如何利用 AI 提升效率并创造价值57来源:https:/www.mokahr.io/myblog/ai-for-pay-equity-analysis-2025/PwC 同样强调,若不借助数字化审计,按当前速度全球仍需 50 年才能弥合性别薪酬差距。AI 在平均 26 秒内可完成一次合同审查,而传统律师需耗时约 92 分钟101。通过机器解析合同条款、自动对照本地法规并提示高风险词句,HR 可在批量签署前完成风险过滤。研究表明,电子签名可使收入实现速度提高 28%,节省 26%的整体成本,并获得 19%的收益增长102。智能合同管理与风险管控:把“合规”内嵌到每一次签署EY 指出,92%的 CHRO 和人才负责人认为跨国流动性需求加剧了薪酬流程的复杂性和风险;引入 AI 流程引擎后,审批路径可视化、版本控制和区块链存证显著降低了人为错误与监管问责风险。IBM 研究显示,HR 专业人员通过 AI 驱动工具可节省 30%的时间,让 HR 团队有更多精力投入战略伙伴角色,提高员工体验和组织韧性。人事流程自动化与追溯:从碎片化操作到全流程可审计101ContractSafe,Contract Management Statistics Ahead of 2025102DocuSign,10 Reasons to Adopt E Signature智能时代,HR 如何利用 AI 提升效率并创造价值5803价值体现与示例AI 在薪酬与合规领域带来的价值是构建一个公平、高效、安全的管理防线,将传统的人工操作和被动应对转变为智能化的主动风控。Gartner 研究发现,AI 在薪酬设计中将性别/地区薪酬差距的识别效率提升40%,使得企业能够更快速、精准地发现并纠正薪酬不公,从而构建更公平透明的薪酬体系。AI 自动化合同审查和流程管理,大幅缩短了 40%的合规修复周期,降低了人工操作带来的错误和风险103。这些数据充分证明了 AI 在提升效率和降低风险方面的显著作用。AI 使得企业能够从被动应对合规风险转变为主动进行智能风控,通过实时监控和预测,将风险管理前置,从而全面提升用工安全性。在此趋势下,越来越多企业开始寻求更智能、集成度更高的电子合同管理解决方案,以应对日益复杂的用工合规要求。腾讯电子签正是在这一背景下应运而生,通过从 Offer 发起、合同签署到合规归档的全流程智能签约体系:批量生成与发送、一键身份认证、移动端签署等功能全面覆盖远程用工、灵活雇佣等多元场景;AI 智能审查预警与司法链上存证机制,使合同签署不仅便捷,而且安全可控;同时支持 API 嵌入与灵活集成,帮助 HR 实现“合规零负担、签署零阻力”的管理升级。智能时代,HR 如何利用 AI 提升效率并创造价值103 ContractPodAi,Why 2025 Demands AI-First Strategies for CLM腾讯电子签:智能秒签,AI 智控,便捷无界拥有您的专属智能合同管理平台,让您专注于“业务”数字签署,驱动未来。资料来源:腾讯智能时代,HR 如何利用 AI 提升效率并创造价值5905人力资源规划AI 驱动的预测分析与战略决策01场景痛点与 AI 价值杠杆预测,让组织始终对焦未来企业在传统人力资源规划中普遍遭遇两大断层:智能时代,HR 如何利用 AI 提升效率并创造价值104 Gartner,Strategic Workforce Planning:3 Step Guide for CHROs依据历史人头数线性推算未来需求忽视了业务波峰波谷与技能半衰期,不能应对快速变化的市场需求。截至 2024 年,只有 15%的组织在执行真正的战略性劳动力规划,而大多数仍停留在年度或更低频率的头数预测层面 104。内部流动通道阻塞,关键岗位补位失速世界经济论坛预测,到 2030 年,预计有 39%的职场核心技能将发生重大变化,建立动态、可维护技能库迫在眉睫。来源:World Economic Forum,The Future of Jobs Report 20252016-2025 年工人核心技能预期变化和保持不变的比例演变智能时代,HR 如何利用 AI 提升效率并创造价值61AI 技术通过其强大的数据分析、模式识别和预测建模能力,将人力资源规划从静态、经验驱动转变为动态、数据驱动的战略决策工具。AI 能够分析海量多源数据,包括历史绩效、行业趋势、业务增长和员工行为等,从而精准预测未来人力需求(数量、技能构成和岗位空缺),并识别高风险离职人群和技能短缺岗位,实现前瞻性人力资源规划。这种预测能力使得 HR 能够提前识别潜在的人才挑战,并制定相应的应对策略。AI 还能优化内部人才流动与配置。AI 能够构建员工技能画像与岗位技能画像,实现人岗智能匹配,自动化推荐内部转岗和晋升机会,并基于历史流动路径和晋升规律制定科学规划,从而盘活内部人才,提升人才配置效率。这不仅为员工提供了清晰的职业发展路径,也增强了组织的灵活性。此外,AI 能够通过综合 HR 数据平台、离职预测、成本模型和跨情景模拟,提供动态分析仪表板和预警机制,帮助 HR 与业务、财务部门协同,对齐人才投入与产出,实现人才投资的合理配置和战略决策的科学化。这种数据驱动的决策支持,使得 HR 能够更有效地支持企业战略目标。02AI 赋能解决方案与核心能力体现AI 在人力资源规划领域提供了一系列赋能解决方案,这些方案通过智能化的核心能力,全面提升了人力规划、内部人才流动和协同决策的水平。AI 通过对内外部数据的深度挖掘,为企业提供精准的人力需求预测,确保人才供给与业务发展同步。AI 能够分析历史绩效、行业趋势和业务增长等数据,精准预测未来人力需求(包括数量、技能构成和岗位空缺),并识别技能短缺岗位与高风险离职人群。德勤表明,具备成熟的劳动力规划分析能力的组织,其市场响应和战略执行效率显著提升,实现业务目标的可能性是普通组织的 2.5 倍。在实践中,AI 能够构建岗位 技能画像与员工能力画像,推动基于能力的精准配置;同时,比较“外部招聘 vs 内部培养”的成本与速度,支持数据驱动的决策。这些功能主要应用于战略性人力资源规划、人才储备和业务扩张人才准备等场景。人力规划与需求预测:历史数据分析与未来人才需求预测AI 盘活企业内部人才,为员工提供个性化职业发展路径,提升内部人才利用率。AI 能够利用人力资源数据分析和 AI 打造“动态技能 兴趣”人才匹配系统,自动化推荐内部转岗和晋升机会,并基于历史流动路径和晋升规律制定科学规划。例如,AI 驱动的职业路径规划能够利用预测分析改善内部流动性,并带来 20%的员工留任率提升 105。在实践中,企业可以实施职业路径图、导师带动和轮岗体系,构建“人才弹性编排”机制。这些功能主要应用于员工职业生涯规划、内部人才盘活和继任者计划等场景。内部人才流动与职业发展:AI 驱动人才匹配与职业路径规划105 McKinsey,The State of AI in 2023:Generative AIs Breakout Year0102智能时代,HR 如何利用 AI 提升效率并创造价值6203价值体现与示例AI 在人力资源规划领域创造的价值,核心在于将 HR 规划从被动响应转变为主动引领,成为企业战略决策的关键支柱。AI 通过精准预测和动态分析,使人力资源规划更具科学性和前瞻性,能够提前识别并应对人才挑战,确保企业战略的顺利实施。例如,IBM 在员工离职风险预测中应用 AI 模型,实现 95%的预测准确率,从而帮助企业节省数百万美元的招聘与培训成本。这种前瞻性使得企业能够更好地应对市场变化和业务发展需求。通过构建综合性数据平台,AI 能将人力投入与业务、财务指标无缝对齐,实现人才投资回报(ROI)的可量化评估与持续优化106。以 IT 服务公司 TechGenies 为例,该公司上线人才预测分析系统后,一站式可视化 HR 与财务指标,通过预测模型精准洞察招聘与留存趋势,迅速实现投资回报107。同样,全球数据服务商 Experian 部署 AI 驱动一体化人才分析平台后,将自愿离职率降低 3.5%,并在不到八个月内收回分析平台成本108。106IBM,Al and the Future of Human Resource107isolved,Global Software Company Unlocks the Value of HR Data108Nucleus Research,Visier ROI case study:ExperianAI 通过集成数据和智能分析,提升 HR 规划的效率和决策的协同性。AI 能够部署综合 HR 数据平台,实现离职预测、成本模型和跨情景模拟;通过预警机制与动态分析仪表板,实现策略及时优化与人才投资合理配置。在实践中,HR 部门可以与业务、财务部门协同,对齐人才投入与产出,关注人岗匹配度、岗位填充率、技能产出率和核心人才留存率等指标。这些功能主要应用于战略决策支持、人才投资回报分析和组织敏捷度提升等场景。效率提升与协同决策:综合数据平台与人才投资优化03数据驱动的决策支持使 HR 从职能执行者蜕变为企业战略的共同制 定 者 和 推 动者。智能时代,HR 如何利用 AI 提升效率并创造价值63HR 价值增长实践案例 价值验证与最佳实践三腾讯的人才发展与组织进化0101腾讯如何让组织与人才共同发展?智能时代,HR 如何利用 AI 提升效率并创造价值资料来源:腾讯作为中国最大的互联网公司之一,腾讯拥有超过 10 万名员工,业务遍布 17 个国家和地区,覆盖社交、金融、云计算、文化等多个领域,并且还在不断扩展。对于腾讯这样员工多、组织分散、协作网络复杂的企业来说,产品技术信息更新慢、解决方案积累不够、跨部门协作效率低等问题十分常见。内部各个流程、各个层级的问题最终都会影响到一线,导致业务开展费时费力、问题不断。为了解决业务分散的痛点、统一调度知识,腾讯大力投入知识管理和企业知识库建设,明确知识发布、维护和升级的责任,确保信息准确及时,促进知识资产的沉淀与积累。在解决业务发展问题的基础上,腾讯更进一步,把知识管理看作是组织“基因进化”的关键环节,强调把员工头脑中的经验(隐性知识)转化成可记录的知识(显性知识),把零散的知识整理成有序的知识,以此来支撑持续创新和组织进步。随着年轻一代(Z世代)员工成为主力,企业普遍面临知识流失的风险。通过知识管理,腾讯能够确保核心能力不会因为人员变动而流失,用积累的知识帮助员工提升能力,在促进员工成长的同时,也为企业和社会创造更大价值。腾讯对知识管理的坚守,是其推动组织与人才共同发展的基石,也是应对数字经济变局的核心生存法则之一。02腾讯的知识管理发展历程腾讯内部的知识管理发展是一个系统推进的过程,其核心理念、技术工具和运营方法形成了独特的方法论。自2008 年内部上线以来,腾讯的知识库产品之一(即乐享)经历了启动、深化和开放赋能多个阶段,推动知识管理从“存储沉淀”向“智慧修炼”升级。智能时代,HR 如何利用 AI 提升效率并创造价值662008 年,腾讯内部上线了腾讯乐享平台,一站式承载企业知识管理、培训管理、文化建设,从多方面支撑公司成长。这个阶段,腾讯乐享主要以社区化知识共享平台的形式出现,首创“以人为本”模式,鼓励员工在社区里分享知识、直接沟通,提倡“边玩边学”。这个平台的出现,打破了信息隔离的困境,解决了万人企业中协作困难的问题。2017 年,腾讯乐享正式对外开放服务,凝聚了腾讯 10 多年的企业管理经验和精华。它通过文档、问答、课堂、考试、活动、投票、论坛和祝福等核心应用,满足企业与知识、文化相关的多样化需求,服务各行各业的客户,助力企业知识沉淀和数字化转型。2018 年,乐享迎来了全面升级,全面覆盖“文化建设、企业培训、知识管理”三大场景,让知识融入企业管理与员工发展全领域,成为人才发展的基石。2024 年,腾讯乐享全面接入 AI能力并不断优化,随后在 2025年推出了专注于知识管理的知识库 2.0 版本。通过构建企业利用AI 进行知识管理和知识资产积累的领先模式,腾讯乐享成为国内企业级 AI 知识库的标杆之一。03腾讯的知识管理实践经验在“人才为企业的第一财富”价值观的指引下,腾讯于 2008 年建立了集团内部的知识管理社区KM,支持员工分享技术心得、产品经验等个人知识,并引入了开放与分享的社区文化,因此被亲切地称为“鹅厂知乎”,成为许多员工离开腾讯后依然怀念的福利体验。在云与智慧产业事业群中,建立有效的知识管理机制和平台变得更加重要。在腾讯云内部,长期以来由于知识服务缺乏统一调度和责任主体,产品技术、行业解决方案等知识的更新、积累、维护和再利用存在不足,制约了人才培养和业务发展。基于人才培养与业务发展的需求,腾讯云依托与腾讯 KM 相同的技术基础,打造了服务于腾讯云的一站式知识管理平台腾讯云知。云知直接着眼于人才培养与发展,聚焦业务一线的实际使用场景,打造可靠、便利的知识管理工具和平台,提升员工个人学习和业务开展的效率。建立与完善知识管理机制与平台腾讯明确地提出了“业务和资金不是最重要的,人才是腾讯最宝贵的财富”的人才理念。这一理念被写入文化纲领,形成了“用户为本,员工为根”的核心价值观。在腾讯的文化发展中,员工价值始终与用户价值同等重要,成为战略落地的双重支点。腾讯“人才是企业的第一财富”的价值观,其核心理论基础是杨国安教授的“杨三角理论”。该理论认为,企业的持续成功是企业战略与组织能力的结合。组织能力则依赖于三大支柱:员工能力、员工思维和员工治理。其中,组织能力的基础是员工能力,即知识所赋予的员工胜任力。员工思维和员工治理则分别来源于企业文化驱动的人才自驱力,以及良好平台与机制的支持。三者结合,共同构建了腾讯卓越的组织能力,为企业的持续成功打下了基础。树立“人才为企业的第一财富”的价值观67智能时代,HR 如何利用 AI 提升效率并创造价值在腾讯的人才发展和组织进化体系中,知识管理是核心的连接纽带和动力引擎。无论是腾讯 KM 还是腾讯云知,都以乐享 AI 知识库为技术基础和核心,把散落在各处的知识文件整理成系统的知识体系,形成了企业专属的私域知识库,赋能人才发展和组织进化,推动业务的持续成功。在这个过程中,企业 AI 知识库的核心作用体现在三个方面:驱动人才发展、赋能文化建设、支持战略升级。以知识管理促进人才发展与组织进化在知识管理过程中,通过建立一站式企业知识社区,企业 AI 知识库将上百种格式的文档集中存储,并用 AI 自动解析,把分散的、存在于员工头脑中的经验(隐性知识)变成结构化的知识资产。借助知识全生命周期管理和统一引用机制,确保知识始终动态更新且保持一致。在此基础上,结合贴吧、课堂、论坛等协作工具,促进不同团队之间分享知识、解答业务问题,形成“学习-实践-分享”的闭环。在实际培养人才时,通过 AI 问答与陪练能力,让知识快速传递给员工和决策层,真正实现知识资产的持续积累和有效再利用。例如,在云知平台上,产品、技术相关的各种资料都会整合到不同的“阵地”中,并安排专门的知识负责人,及时检查和更新内容。当一线员工或营销、运营人员需要资料时,就可以通过 AI 搜索和问答,快速找到所需知识并了解基本情况,大大提高了知识利用效率和工作效率。在腾讯云知平台上,一线员工还可以针对单篇文档或视频,自动生成“销售一指禅”、试题、宣传文案等辅助学习材料。平台同时支持标记课程重点、自动生成考题,帮助员工快速掌握产品知识。通过多样化的功能模块,员工可以自己规划学习、跟踪个人进度、找到热门优质资源等,提升个性化学习的效果,赋能员工的持续成长。驱动人才发展:构建能力成长闭环知识沉淀与复用可以说,腾讯云知诞生于腾讯云的 ToB 战略背景,目的是突破业务集团内部知识分散、更新滞后对业务发展的限制。在当初评估是否建设云知时,其对销售业绩的促进作用就是重要的考量标准之一。在发展过程中,云知优先解决一线员工的场景需求,真正做到让知识管理服务于业务实践。经过多年建设和完善,云知在基础的知识库功能之上,更成为了销售人员的售前“弹药库”、架构师的技术知识库,帮助业务人员快速解决客户问题、提供所需方案,赢得客户信任。目前,腾讯云知每年访问量达 800 多万次,70%的销售人员和架构师每周都在使用。它一年节省的时间、人力、场地等各类成本接近 3 亿元,赋能业务开展所带来的巨大价值更是难以估量。不论是早期的腾讯 KM,还是后来的云知平台,经过长期发展和演进,都已成长为系统化的知识管理平台。它们以知识管理为核心能力,实现了知识沉淀、交流分享、学习提升、文化传递、业务提效等多方面的价值。今天,腾讯的知识管理机制与平台仍在持续完善,更加关注智能化、生态化、场景化的知识管理,致力于为企业创造更卓越的价值。智能时代,HR 如何利用 AI 提升效率并创造价值68企业的知识库同时也是组织文化的载体和传播中心。它通过建立统一的企业文化门户和多种互动机制,实现文化理念的有效传递和深入人心。腾讯在结合企业文化建设与知识管理方面有长期经验,通过机制设计让两者相互促进。例如,腾讯建立了内部的“知乎”和“微博”平台,通过兴趣圈子和多样活动,鼓励员工主动参与文化传播,并引入了评选文化大使、展示积分榜、互相赠送勋章等机制。借助知识库中的智能写作、知识问答等 AI 技术,进一步提升内容生产和传播效率。同时,平台还整合了腾讯云、企业微信等基础服务,打造了覆盖“传播-沟通-参与-进化”全流程的一站式文化社区。强化文化建设:强化认同与连接通过非线性学习模式和 AI 技术赋能个性化学习与成长路径,企业 AI 知识库提供灵活多元的学习资源,允许员工根据兴趣、需求和学习进度自主选择学习路径,打破传统线性学习的束缚。在员工学习的过程中,AI 助手功能支持智能生成知识点、虚拟陪练和实时反馈,实现个性化辅导,同时通过积分、证书等激励措施激发个体的学习动力。此外,乐享也整合了数据看板与智能分发技术,帮助管理者依据发展需要与员工反馈,动态调整培训计划,助力企业构建自主学习文化、提升“群集智能”效应。赋 能个 性化 学习 与成 长路 径文 化内 容的 载体 与传 播枢 纽促 进跨 层级、跨 部门 协同知识的共同创造与共享,显著提升了不同层级、不同部门之间的协作效率。企业 AI 知识库打破了部门之间的隔阂,提供了文档协作、项目管理和分级权限等工具,让不同团队的成员能同时编辑文件、管理项目进度。它还建立了部门空间和工作圈子,支持跨地域的业务问答和信息传递,让一线员工也能直接与高层互动,缩小层级差距。在腾讯内部,通过鼓励员工在企业 AI 知识库中分享经验,并借助文化社区增强凝聚力,员工从被动的执行者转变为主动的“影响力中心”,推动了更直接的沟通和共同创造文化。智能时代,HR 如何利用 AI 提升效率并创造价值6904总结腾讯长期坚持建设企业级知识库,并率先深度融合 AI 能力,系统沉淀企业内部的隐性知识,有效解决了业务碎片化问题。通过共享知识体系与个性化学习路径,腾讯驱动员工成长并将个体能力转化为组织能力,支撑其持续的商业成功。腾讯的实践表明,知识管理是连接人才价值与组织效能的数字化纽带,更是数字经济时代组织持续进化的重要动力。组织能力的数据化底座在知识管理过程中,企业 AI 知识库提供了数据洞察看板,实时监控知识使用率、员工参与度等指标。这有助于分析热门知识领域,反过来优化人才发展战略,促进重点业务线的课程开发、改进和员工培训的加强,助力各部门业务能力的持续提升。创新与敏捷文化的催化剂通过在企业 AI 知识库中建立扁平化的沟通机制,打破层级壁垒,让各层级员工可以相互提问并得到高回复率。同时,基于用户创造内容(UGC)的模式,鼓励所有员工参与知识共创,把个人的创新经验变成组织的共同资产。在腾讯内部,员工创作知识的氛围非常活跃。配合兴趣圈子和项目小组等机制,各个团队都能独立开展灵活(敏捷)的培训和活动,进行知识创作,同时也提升了整个组织的创新能力。在 AI 技术快速发展和普及的背景下,腾讯云知结合 DeepSeek 与自研大模型,提升了知识生产和问答效率,降低了创新协作的成本,推动了“快速迭代”文化的落实。支持战略升级:从组织能力到业务创新 智能时代,HR 如何利用 AI 提升效率并创造价值70HR 领域的腾讯产品实践案例02智能时代,HR 如何利用 AI 提升效率并创造价值01腾讯乐享 一线员工培训难、学习成本高:在线下门店和线上电销渠道的一线员工,不仅需要熟知产品的参数与属性,还需了解消费者场景化需求,为客户提供跑步训练、目标设定等多方面建议,学习成本高、培训困难;AI 应用与实际需求不匹配:在缺乏专属知识库的情况下,AI 在解决与行业、品牌相关的特定问题时效果不佳,无法为一线员工提供合适的指导与场景化灵活应对,且员工使用 AI 问答的技巧水平有待提升,需进行针对性训练;企业专属知识库建设:NewBaIance 建立基于行业、产品与品牌本身的专属知识库,引入 AI问答、总结能力,沉淀品牌积累的海量知识,并将其作为员工培训的优质内容输入,助力员工能力提升;AI 赋能员工培训与能力提升:AI 与知识库联动,通过问答与陪练等多种模式,帮助员工了解业务模式、快速响应客户诉求;优化专属 AI 助手的提示词配置,降低使用门槛,使员工能更好地利用 AI 提升能力;数据驱动的定制化培训:基于员工 AI 问答使用情况的分析,系统性优化企业培训,定期开展统一培训,提升员工使用 AI 知识库的能力和在培训场景的实际应用水平。New BaIance 腾讯乐享:AI 知识库促进员工能力提升,赋能一线业务开展客户痛点与需求解决方案与客户价值02腾讯会议传统招聘面试中的客户痛点与需求面试是面试官与候选人双向沟通的过程,面试官的沟通方式与内容将影响对候选人真实能力与个人素养的选拔;传统招聘面试的流程复杂冗长且涉及多方沟通协调,跨系统或平台进行协调将大大影响企业招聘效率;招聘面试中的文书工作耗时耗力,面试官需要进行面试评价、归档等面试后工作,群面等多方沟通的内容处理难上加难。智能时代,HR 如何利用 AI 提升效率并创造价值72智能化招聘管理系统用友大易与腾讯会议联合,基于腾讯会议企业版打造完整招聘解决方案,探索 AI 面试的发展路径。一方面,借助腾讯会议的 API 与丰富的扩展应用,打造闭环的招聘体验;另一方面,借助腾讯会议的天籁智能语音语义技术,让 AI 更好地辅助面试推进。用友大易 腾讯会议:“AI 招聘”新模式,重新定义面试体验将腾讯会议与招聘管理系统集成,基于腾讯会议的扩展应用插件,实现招聘一站式闭环;结合实时转写功能与用友大模型,可实现智能问题推荐、智能面评生成,让AI 辅助面试;支持线上线下多场景、多主体的面试智能生成清晰易读的文本纪要,让 AI听得清、听得懂,助力面试官畅享多种 AI 能力。北森与腾讯会议共同打造了“AI 面试”的新模式,并将其投入到行业实践当中。基于腾讯天籁实验室的个性化语音增强与智能语音语义技术,使 AI 能够“听得清、听得懂”,进而提供简历解析、问题推荐等 AI 功能。北森 AI 面试助手,能够支持不同行业、不同业务、不同层次的面试需求,提升企业的关键人才质量。北森 腾讯会议:AI 面试助手,让招聘效率飞起来一站式解决方案,贯穿面试全流程,大大减轻面试官的工作负担,释放其专业价值;基于面试中精准即时的文本生成,AI 能够理解会议沟通内容,辅助面试开展;智能简历解析、问题推荐、实时追问、智能面评等丰富功能,提高招聘效率与质量。智能时代,HR 如何利用 AI 提升效率并创造价值73 海量反馈数据利用率有限:每年数千场线上线下培训产生开放式文本反馈,人工分析难以提炼核心观点 需求洞察成本高:员工真实学习诉求、讲师授课短板等关键信息埋没于文本碎片中,需要消耗大量人力进行识别,影响培训优化效率腾讯学堂 腾讯问卷:AI 提炼海量反馈核心诉求,驱动培训精准迭代客户痛点与需求 AI 观点总结秒级提炼:自动识别数千条反馈中的高频诉求与观点,邮件自动反馈给教师,节省数据分析与洞察总结的时间 AI 报告驱动迭代:一键生成可视化分析报告,定位讲师能力提升点与课程优化方向,精准洞察课程改进方向,推动培训提质增效解决方案与客户价值03腾讯问卷 考卷设计耗时且专业门槛高:高频的员工培训、新人入职、资质考核、合规测试等场景中,人工组卷需平衡题型/知识点/难度,单套标准化考卷设计消耗大量时间;岗位差异化需求难覆盖:寿险与产险、代理人与管理层等岗位测评维度差异显著,传统方式无法快速生成定制化试卷。AI 生成问卷智能组卷:上传培训文档后自动解析知识点,分钟级生成标准化考卷,节省时间精力至定制化题目的开发中 精准岗位测评:输入岗位关键词(如“产险合规”“管理层决策力”),秒级输出定制化测评试卷,快速推进岗位测评流程太平洋保险 腾讯问卷:AI 攻克岗位差异化测评难题,释放人力专注高阶需求客户痛点与需求解决方案与客户价值智能时代,HR 如何利用 AI 提升效率并创造价值7404电子签中建三局集团在建项目劳务工人达 30 余万人,能否有效地进行劳务用工管理,将直接影响到企业的高质量发展。目前建筑工人的劳动档案模糊及复杂,需消耗一定的人力和时间成本对工人的个人信息及劳务关系进行筛查和管理,目前劳动合同签订主要有以下问题:1.劳务分包、班组队伍庞杂,工人数量庞大,工人进场时间密集,劳动合同签署量大且时间长,人力物力成本高。2.劳动合同通过线下签订,签订率低、代签等问题较多,发生纠纷难以取证,存在用工维权风险。3.传统纸质合同保管不便捷、易丢失,迎检难回溯、不易调用。为了实现建筑用工的规范化,各地政府紧跟数字化发展。通过腾讯电子签的底层服务,为用工管理安上了一个稳定的加速器。腾讯电子签同时支持中建三局集团化管理合同资产,可以通过API方式集中管理智慧工地平台多劳务公司的模板、合同、等相关数据,实现线上业务全方位在线闭环。中建三局 x 电子签:打造新一代数字化智慧工地管理平台客户痛点与需求客户价值某知名证券公司 电子签:打造新一代数字化人事管理 HR 业务开展效率显著提升,从传统繁复的工作中解放出来;员工协议签署体验得到极大优化,流程满意度有效提升;文件管理成本大幅优化,免除复杂的人工归档、邮寄、盖章环节,降本增效的同时降低合规等潜在风险。客户价值 统一管理难度大,某知名证券公司有多个业务公司,印章、协议模板、文件管理复杂;异地办理入职步骤多,异地办理入职需要合同盖章邮件,效率低且有错签盗签风险;某知名证券公司各类协议需要统一管理并归档,纸质版文档运输、归档成本高、时间长。客户痛点与需求75智能时代,HR如何利用AI提升效率并创造价值可复制的落地经验与路线03要让 AI 在 HR 部门内开花结果,关键在于构建系统化、可复制的落地路径,并把握多重成功要素。“好的 AI 需要好的数据”。AI 系统的有效性直接取决于其所依赖数据的质量、完整性和可访问性。HR 数据通常分散在不同系统(如人力资源信息系统、招聘管理系统、学习管理系统),存在数据孤岛和质量问题。在实践中:01数据为基构建高质量数据底座 HR 需要将数据治理视为日常运营的核心组成部分,确保数据持续清洁、更新和可用,否则“垃圾进,垃圾出”的风险将始终存在,削弱 AI 的价值。如果缺乏高质量数据,AI 模型输出的结果将不准确或存在偏见,导致 AI 应用效果不佳,甚至产生负面影响,从而阻碍 AI 的深度应用和规模化落地。因此,构建高质量数据底座是 AI 成功的先决条件。进行数据整合与统一投资建立统一的 HR 数据湖或数据中台,打破招聘、绩效、学习、薪酬等模块间的数据孤岛。确保数据能够实时、双向流动,形成端到端的信息互通与反馈闭环。数据清洗与治理实施严格的数据清洗、标准化和去重流程,确保数据准确性、一致性和完整性。建立数据治理框架,明确数据所有权、使用权限和质量标准。技能数据化与标签化鉴于“技能型组织”的兴起,将员工的技能、能力进行结构化、可量化的数据标签化,构建动态技能图谱。这是 AI 进行精准人才匹配和个性化学习推荐的基础。数据准备并非一次性工程,而是持续的、动态的过程。智能时代,HR 如何利用 AI 提升效率并创造价值7702技术赋能选择与集成 AI 解决方案传统的 AI 部署成本高、周期长,而 SaaS 与 AI 的结合提供了“可插即用”的能力,降低了采纳门槛,加速了 AI 在HR领域的普及,从而推动HR系统从模块优化走向生态构建,最终实现HR的“AI原生化”,释放全价值链的协同潜能。评估与选型评估市场上的 AI HR SaaS 解决方案,考虑其与现有人力资源信息系统、招聘管理系统、学习管理系统等系统的集成能力、AI 功能成熟度、数据安全性和供应商支持。优先选择具备预训练模型和标准化接口的平台。应用程序编程接口集成与平台化推动 AI 能力通过应用程序编程接口接口深度集成到现有 HR 系统中,而非作为孤立的工具。目标是构建一个统一的 HR 全流程智能平台,实现模块间的场景协同和数据联动。自主 AI 智能体的探索与部署逐步探索并部署自主 AI 智能体解决方案,使其能够自动化整个工作流,从“任务自动化”向“业务自主化”迈进。这需要对现有HR 流程进行根本性再造。SaaS模式极大地降低了 AI 的采纳门槛,使其不再是大型企业的专属,中小型企业也能通过订阅获得企业级 AI 能力。这种“民主化”效应将加速 AI 在 HR 领域的普及,并推动 HR 系统从“工具性嵌入”向“平台级重构”演进,实现HR 的“AI 原生化”。评估现有技术栈,选择与业务需求和数据基础相匹配的 AI 工具和平台。SaaS 与 AI 的深度结合是加速 AI 价值实现的关键引擎,提供“可插即用”的能力。在实践中:智能时代,HR 如何利用 AI 提升效率并创造价值7803组织协同构建三螺旋共创机制“三螺旋协同”不仅是一种项目管理模式,更是一种组织文化转型。它要求各部门从“各自为政”转向“共同所有”,将 AI 视为共同的战略资产,并通过持续的共创和反馈机制,确保 AI 应用能够不断迭代优化,适应业务的动态变化。单点主导的 AI 项目容易失败,因为职能视角不完整、技术与数据割裂、业务缺席导致投资回报不清。引入“HRIT业务”三螺旋协同,通过共创式试点,共同定义问题、设计方案、迭代优化,能够确保 AI 应用符合 HR 专业需求、技术可行且解决业务痛点,最终实现 AI 的规模化价值兑现。AI 在 HR 的成功落地绝非 HR 部门单兵作战,而是需要“HR x IT x 业务”三螺旋协同。在实践中:建立跨职能的“指导联盟”组建由 HR、IT 和业务部门关键负责人组成的“指导联盟”或项目组。HR 作为业务场景和需求方,IT 提供数据与平台底座、技术支持和安全保障,业务团队输出场景与投资回报率诉求并作为最终用户和价值受益者。打破职能壁垒促进跨部门沟通与协作,避免因职能视角不完整、技术与数据割裂、业务缺席导致投资回报率不清等问题。共创式试点采取“小步快跑的共创试点”模式,三方共同定义问题、设计解决方案、迭代优化。例如,在开发 AI 驱动的离职预测模型时,HR 提供历史数据和业务洞察,IT 团队构建模型,业务部门则验证模型的预测准确性和实用性。智能时代,HR 如何利用 AI 提升效率并创造价值7904人才再造提升 AI 素养与技能 人才再造不仅是技能的提升,更是对员工心理契约的重新塑造。HR 需要主动管理员工对 AI 取代的“情绪波动”和“时间归属”的张力,通过透明沟通、技能再造和心理安全干预,构建“人机共事”的信任文化,确保员工感受到 AI 是“队友”而非“威胁”。如果 HR 团队和员工的 AI 素养不足,将难以有效利用 AI 工具,影响项目实施效果,甚至引发员工对 AI 的抵触情绪。通过 AI 能力提升培训和全员 AI 素养普及,培养“增强型 HR”和“AI 共事者”,并主动引导“影子 AI”和管理员工情绪,能够确保 AI 采纳率和产出率同步提升。AI 的引入要求 HR 团队和全体员工提升 AI 素养和相关技能,以适应人机协作的新范式。当前 HR 团队对 AI 理解和实际技能存在显著断层。在实践中:HR 团队的 AI 能力提升为 HR 专业人员提供 AI 技术原理、数据科学、算法伦理、AI 工具应用等方面的培训。培养 HR 成为能够识别 AI 价值场景、与技术团队有效沟通、并能解读 AI洞察的“增强型 HR”。全员 AI 素养普及开展全员 AI 培训,帮助员工理解 AI 如何融入日常工作流,提升提示词工程能力,鼓励员工主动探索和使用 AI 工具。管理“影子 AI”鉴于员工“自带 AI”的普遍现象,企业应从“一刀切封堵”转向“受控共管”,制定内部使用规范、数据安全政策和伦理准则,将“影子 AI”转化为“被授权的创新实验场”。智能时代,HR 如何利用 AI 提升效率并创造价值8004治理护航建立负责任 AI(RAI)框架 在 AI 时代,可信赖的 AI 应用将成为企业吸引人才、赢得客户和市场认可的重要差异化优势。CHRO 应将 AI 伦理与透明度视为下一轮人才竞争的“起跑线”,而非“补救措施”。如果 AI 应用带来数据隐私、算法偏见等治理风险,且监管环境收紧,企业若不解决这些问题,将导致信任赤字、法律风险和声誉损害。建立负责任 AI 框架,制定伦理准则、强化数据安全、明确责任归属,能够构建信任与合规的基石,最终将合规门槛转化为透明度红利和可持续增长的护城河。AI 在 HR 领域的应用伴随着数据隐私、算法偏见、公平性、透明度和责任归属等治理风险。建立健全的负责任 AI框架是 AI 战略落地的核心基石。在实践中:制定AI伦理准则与政策明确 AI 在 HR 应用中的伦理边界,如数据使用规范、算法偏见检测与纠正机制、决策透明度要求等。建立内部审查与审计机制对 AI 算法进行定期审计,确保其公平性、准确性和可解释性。特别关注招聘、绩效等高风险场景,避免歧视性偏见。强化数据隐私与安全实施严格的数据加密、访问控制和隐私保护措施,确保员工数据安全合规。遵守通用数据保护条例、加州消费者隐私法案等全球数据隐私法规。明确责任归属在人机协作场景下,明确 AI 决策的责任归属,避免“算法黑箱”带来的责任模糊。负责任 AI 不仅是企业必须履行的合规义务,更是构建企业长期竞争壁垒的关键。01030204智能时代,HR 如何利用 AI 提升效率并创造价值81CHRO AI 赋能 HR 价值创造的6 2可复制路线路线“AI 落地难”往往不是算法问题,而是“数据、组织、治理、人才、平台”五块“地基”没有同时打牢。6 块底座来自多家先行企业的共性做法底座核心动作交付物/验证点1.战略锚定&三螺旋协同 CHRO 携手 CEO/CFO 把 AI 写进人力与业务“双 KPI”组建 HR IT 业务“指导联盟”,用共创式 Pilot 驱动迭代 812 周最小可行性产品,上线即见效2.数据底座&技能图谱 统一人力资源信息系统、招聘管理系统、学习管理系统数据湖,先做清洗去重 把岗位拆成可量化技能标签,生成动态技能图谱“跨模块实时双向流”日志 技能缺口仪表盘3.SaaS AI 平台化 优先采购“带预训练模型 应用程序编程接口”的 SaaS,做到“即插即用”用生成式 AI 把招聘/学习/绩效事件流串成闭环 集成后-招聘周期-减半,学习发展投资回报率 翻倍4.敏捷试点 四阶段扩散 评估准备(1-3月):治理架构 现状评估 路线图 价值试点(3-6月):选“高频痛点好数据”场景,如 机器人流程自动化 聊天急切人,IBM 一条晋升流程就释放 12,000 小时 扩展推广(6-12月):数据中台 统一 AI Hub,上线 3-5 条新链条 深化优化(12月 ):引入自主 AI 智能体,自主编排“选-评-配”全链路 每阶段结束都有量化里程碑(时长、成本、体验)5.人才再造&信任文化“AI 驱动 人本关怀”双轮培训HR 学算法伦理,员工学提词设计 把“影子 AI”由封堵改为“受控共管”50%员工主动提交 AI 场景提案时触达文化拐点6.负责任 AI 治理(RAI)建立设计-开发-部署-监控全链条审计 高风险场景(月度公平性/偏差扫描 透明度报告)负责任 AI 合规评分 90;算法偏差 2%2 个“加速飞轮”让试点迅速滚成雪球飞轮触发器自增逻辑1.体验-业务飞轮 Copilot 把情绪/行为实时入湖 查询时长-95%、工单处理-81%体验好 敬业度 25%绩效 20%反哺更多预算做体验2.数据-洞察飞轮 统一数据后,“报表”升级成“预测-处方”双闭环,可将关键岗位空缺期缩短 40%数据越全 模型越准 业务信任越高 肯分享更多数据资料来源:本报告综合分析*只要六块底座到位、两轮飞轮启动,AI 不止帮 HR 降本增效,而是深层次的价值创造智能时代,HR 如何利用 AI 提升效率并创造价值82成功关键要素:基于实践的核心成功因子分析组织要素构建 AI 转型的组织基础 顶层设计与战略协同技术要素确保 AI 应用的技术可行性 敏捷落地:从试点到规模化 平台思维:SaaS x AI 让功能“可插即用”自主 AI 智能体就绪管理要素建立 AI 项目的有效管理机制 度量与反馈闭环(HR 与业务侧双规 KPI)负责任 AI 治理:用合规门槛换来长期信任护城河 跨职能的深度协同环境要素营造 AI 应用的良好环境 人才与文化升级-持续的人才再造 领导层的坚定承诺与文化塑造 外部生态联动资料来源:本报告综合分析智能时代,HR 如何利用 AI 提升效率并创造价值83常见误区与风险缓释对策04在 AI 赋能 HR 的转型过程中,企业常因认知偏差、准备不足或管理不当而陷入各类误区,导致项目失败或价值无法充分释放。智能时代,HR 如何利用 AI 提升效率并创造价值01战略层误区与对策 误区:战略空心与缺乏落地蓝图许多企业高层对 AI 有愿景,但往往缺乏清晰、可执行的落地蓝图和实施策略,导致“高层愿景”与“落地现实”之间存在鸿沟。AI 投资缺乏明确的价值驱动因素,从而使投资复杂化、碎片化。风险缓释对策制定清晰的 AI 战略与投资回报率框架,明确 AI 在 HR 的战略定位,将其视为业务转型而非单纯工具。建立量化 AI投资回报的框架,将 HR 的 AI 项目与 KPI 紧密绑定。同时,结合自上而下的战略驱动与自下而上的需求洞察,确保高层领导积极参与并推动 AI 战略,并鼓励基层 HR 和业务团队识别实际痛点和应用场景,形成双向驱动。02技术与数据层误区与对策 误区 1:数据基础薄弱,“垃圾进,垃圾出”许多 HR 部门数字化基础建设滞后,数据分散、质量差,导致 AI 分析结果不准确或存在偏见。风险缓释对策 1投资数据治理与统一数据平台,将数据整合、清洗和标准化作为 AI 项目的前置条件,构建统一的 HR 数据湖或数据中台。实施严格的数据质量管理流程,确保数据的准确性和可靠性。误区 2:技术选型不当或过度依赖单一技术盲目追求最新技术或将 AI 视为“万能药”,未能充分评估其与企业实际需求的匹配度。风险缓释对策 2采取需求导向的技术选型策略,基于明确的业务痛点和投资回报预期选择AI解决方案。采用SaaS与AI结合的模式,以降低技术门槛和风险,并注重其与现有系统的集成能力,确保技术能够无缝融入现有工作流。智能时代,HR 如何利用 AI 提升效率并创造价值85智能时代,HR 如何利用 AI 提升效率并创造价值03组织与人才层误区与对策 误区 1:HR 团队技能断层与数字素养缺失大多数 HR 专业人员的知识体系仍侧重于传统人力资源管理,对于 AI 技术原理、数据科学、算法伦理等新知识的理解和实际操作技能存在显著断层。风险缓释对策 1实施系统性 AI 技能培训与能力提升计划。针对 HR 团队设计分层级的 AI 技能培训,包括数据分析、AI 工具操作、算法解释性等。培养“增强型 HR”,使其能够与 AI 协同工作,而非被动接受。04治理与伦理层误区与对策 误区:算法黑箱、数据伦理与合规模糊不清 AI 招聘算法可能存在歧视性偏见,员工数据使用引发隐私担忧,自动化决策依据难以解释(“算法黑箱”)。风险缓释对策构建负责任AI框架,将其伦理、解释性、责任机制作为AI战略落地的核心基石。制定AI使用政策,定期进行算法审计,确保公平性、透明度和可追溯性。强化数据隐私与安全,遵守全球数据隐私法规,实施严格的数据加密和访问控制。误区 2:员工抵触情绪与“影子 AI”风险员工担忧 AI 取代工作,导致抵触情绪;同时,员工“自带 AI”形成“影子 AI”,带来数据泄露和治理风险。风险缓释对策 2采取透明沟通与人本关怀策略。明确 AI 是“增强”而非“取代”人类工作,强调人机协作的价值。主动管理员工情绪,提供心理支持和技能再造机会,帮助员工适应新角色。同时,对“影子 AI”采取“受控共管”策略,制定清晰的 AI 使用规范和数据安全政策,将员工的“影子 AI”行为纳入规范管理,鼓励“被授权的创新实验场”。智能时代,HR 如何利用 AI 提升效率并创造价值8605实施与管理层误区与对策 误区 1:流程阻抗与“打补丁”思维HR 部门的许多传统流程为人工操作设计,固化且复杂。当尝试将 AI 技术嵌入时,往往会遇到流程阻抗。AI 被零星嵌入原有标准操作程序,未能实现流程的根本性再造。风险缓释对策 1实施流程再造与 AI 原生思维。从 AI 能力出发重新设计 HR 工作流,实现“任务原子化 智能调度”。将 AI 视为流程核心,而非简单工具,从而实现效率和价值的质变。误区 2:缺乏跨部门协同与领导力 AI 项目被视为 HR 部门的独立任务,缺乏 IT 和业务部门的深度参与,导致项目难以推进或价值无法兑现。风险缓释对策 2建立“HRIT 业务”三螺旋协同机制,确保各方在 AI 项目全生命周期中的共同参与、共同决策和共同负责。CHRO 需发挥变革领导力,推动跨部门协作和文化转型,将 AI 视为全组织共同的战略资产。智能时代,HR 如何利用 AI 提升效率并创造价值87展望AI 驱动 HR 未来的战略蓝图四AI 驱动 HR 的价值飞跃从效率工具到战略引擎AI 的真正价值在于其能够赋能企业实现传统方式难以企及的业务目标,从而在市场中建立新的竞争优势。对于 HR 而言,这意味着 AI 不再仅限于优化 HR 内部流程,而是能作为战略性工具,直接驱动业务成果,成为企业整体增长的加速器,将使HR 实现前所未有的价值飞跃,从过去的“效率工具”角色,彻底转型为驱动企业持续增长的“战略引擎”。0101重塑 HR 战略地位未来,AI 将 HR 从传统的事务性部门和成本中心,彻底转变为企业战略决策的核心伙伴和增长引擎。通过 AI 赋能的数据洞察与业务联动能力,HR 将能够提供精准的人力资源分析和建议,直接驱动业务成果109。这种转变体现在从“效率腾挪”到“价值共创”。AI 通过自动化释放 HR 高价值时间,使其能够转向前瞻性工作。AI 的洞察赋能将预测能力融入人才决策,使 HR 能够用可解释的数据模型,把“敬业度产出利润”链条闭环呈现,从而赢得决策席位与资本预算。同时,HR 的角色将从“支持职能”转变为“战略增长合伙人”,AI 将 HR 从后台职能部门提升为影响组织战略执行力、适应力与创新力的“系统性杠杆”。AI 的深度融入将使 HR 拥有与 CFO 同级的“资产经营盘”,能够用量化的人效、边际贡献率等指标,清晰地阐述人力投资如何直接拉高企业整体的投资资本回报率,这标志着 HR 从“费用科目”向“可投资的收益资产”的根本性转变。AI 释放 HR 事务性时间,赋能 HR 进行深度数据洞察和预测,使 HR 能够提供精准的人力资源分析和建议,直接驱动业务成果和新收入曲线,从而将 HR 从成本中心转变为价值创造的战略伙伴,最终提升 HR 在企业中的战略地位。智能时代,HR 如何利用 AI 提升效率并创造价值109 Harshita Dadheech.AI-Driven HR Analytics:Unleashing the Power of HR Data ManagementAI 驱动 HR 的价值飞跃:重塑 HR 战略地位资料来源:本报告综合分析智能时代,HR 如何利用 AI 提升效率并创造价值9002释放人力资本潜能未来,AI 将彻底激活员工的自驱成长与协同能力,并推动组织从“职位导向”转向“技能导向”,最大限度地释放人力资本的潜能110。智能时代,HR 如何利用 AI 提升效率并创造价值110Brookings.Using AI to advance skills-first hiringAI 驱动 HR 的价值飞跃:释放人力资本潜能资料来源:本报告综合分析关键转变包括“岗位失效、能力崛起”。AI 加速推动“基于技能的组织”兴起,使 HR 必须以技能为核心重新构建人才的“基础语言”和评估机制,激活内部人才市场。AI 能够动态评估员工技能,并推荐个性化学习路径,提升员工学习主动性。其次是“混合雇佣常态化”。AI 智能体将成为“第三类劳动力”,与人类员工、平台劳工共同构成生产力矩阵。HR 需管理一个“人平台智能体”三元并行的劳动力生态,并通过 AI 进行劳动力规划、人才匹配和协作管理。再者是“体验共创与个性化”。AI 将员工体验推向实时、自适应的“千人千面”阶段,通过大规模数据理解个体行为特征,提供高度定制化的服务和支持。AI 不仅提升了员工个体能力,更重构了团队间的匹配逻辑与协作机制。通过 AI 持续学习推荐、技能追踪、协作优化与智能连接机制,组织将构建一个真正以人才为核心、以成长为动力的“智能引力场”,吸引、发展并留住人才,实现人力资本的指数级增长。传统的“岗位”概念失效,技能成为核心,AI 赋能技能型组织,实现人才精准匹配和动态发展。AI 智能体作为“第三类劳动力”加入,HR 需管理复杂的混合劳动力生态,并通过 AI 提供个性化体验和自驱成长支持,最终最大限度释放个体和组织的人力资本潜能。智能时代,HR 如何利用 AI 提升效率并创造价值9103构建未来组织韧性未来,AI 将成为构建组织韧性的核心驱动力,使企业能够更好地应对外部环境的复杂变化和不确定性,保持持续的竞争优势。关键转变包括“动态智慧化的人力资源规划”。AI 能够进行精准的人才需求预测、技能差距分析,并支持内部人才流动,使组织能够提前布局人才梯队,支撑业务扩张或转型需求。其次是“智能闭环的 HR 生态系统”。AI推动 HR 系统从“模块优化”走向“生态构建”,实现端到端的信息互通与反馈闭环。这种“自我演化”的能力,使 HR 系统具备“感知决策优化”一体化的人力运营循环,提升组织整体的适应力。再者是“风险的预警与防范”。AI在合规与透明度方面的应用,将从被动问题发现转向主动风险预防,帮助企业构建稳健的人力资源管理防线,有效规避法律、财务和声誉风险。AI 使组织能够从被动应对外部变化转变为主动驾驭变化。通过AI的预测性、自适应性和闭环优化能力,组织能够更快速地感知市场和人才趋势,更精准地调整战略和配置资源,从而在剧烈变化的环境中保持领先地位。面对复杂多变的商业环境,AI 提供动态人力规划和预测能力,HR 系统实现智能闭环和自我演化,风险识别与合规保障能力提升,从而使组织能够提前应对挑战,快速适应变化,最终构建并增强未来组织的韧性。智能时代,HR 如何利用 AI 提升效率并创造价值AI 驱动 HR 的价值飞跃:构建未来组织韧性资料来源:本报告综合分析智能时代,HR 如何利用 AI 提升效率并创造价值92资料来源:本报告综合分析智能时代,HR 如何利用 AI 提升效率并创造价值93CHRO 的 AI 领导力驾驭变革,引领未来进入生成式 AI 全面渗透的“第二曲线”,CHRO 的职能已从“运营守门人”跃升为“人 机 业务”三元生态的首席架构师。真正有竞争力的 HR 领袖,必须同时握住“数据、体验与创新“三把钥匙,在不确定的商业环境中为组织注入可持续的动能。0201数据驱动的卓越决策用数据改写董事会语言未来的 CHRO 将成为数据素养的倡导者和实践者、必须是“数据科学家”的合伙人,能够利用 AI 从海量 HR数据中挖掘深层洞察,为组织的战略决策提供精准、前瞻性的人力资源分析和建议。核心实践包括从滞后指标到领先指标的转变。推动HR 从依赖季度报表、滞后指标转向实时洞察和预测性分析,将人才数据与业务数据打通,实现“预测处方”双闭环。其次是量化人力资本价值。运用 AI 工具量化员工体验、敬业度对业务成果(如生产力、创新、客户保留率、营收)的乘数效应。再者是战略性人力规划。借助 AI 进行劳动力供需预测、技能差距分析,提前布局人才梯队,支撑业务扩张或转型需求。CHRO 不仅要理解数据,更要能够将复杂的 AI 洞察“翻译”成业务语言,向 C-suite 清晰阐述人力资本投资如何直接影响财务表现和战略目标。这要求 CHRO 具备强大的商业敏锐度和沟通能力,将 HR 从“成本中心”的标签中彻底解放出来。传统的HR决策依赖经验,AI 提供海量数据洞察和预测,CHRO 需具备数据素养和解读能力,从而做出科学、前瞻性的决策,最终将HR 从被动响应者转变为主动的战略伙伴。智能时代,HR 如何利用 AI 提升效率并创造价值资料来源:本报告综合分析智能时代,HR 如何利用 AI 提升效率并创造价值95核心实践包括人本关怀融入系统设计。引导 AI 系统设计融入“人本关怀”,通过 AI 聊天机器人提供 24/7 智能应答,实时分析员工情绪,提供主动干预和心理支持。其次是个性化学习与职业发展。借助 AI 为员工提供高度定制化的学习路径、智能职业建议和发展计划,激发员工自驱成长。再者是“双钥匙治理”。与财务部门协同,共同掌握情绪温度、成长曲线与生产率、收入成本曲线,让EX成为可投资、可折算的收益资产。AI 驱动的个性化体验不仅仅是提升员工满意度,更是通过精准的关怀和支持,建立员工与组织之间的“情感黏性”。CHRO 需确保 AI 在提升效率的同时,不削弱人际连接,反而通过技术注入温度,深化员工的归属感和忠诚度。员工体验影响业务成果,AI 实现个性化、人本化的员工服务,从而提升员工敬业度、满意度和保留率,最终通过“员工体验(EX)业务成效(BX)”飞轮驱动业务增长。CHRO 作为缔造者,需确保技术与人本关怀的平衡。03创新与增长的助推器用“人 AI”文化点燃创新与韧性CHRO 不仅要关注效率,更要成为企业 创新和增长的助推器,应将 AI 视为组织创新和增长的催化剂,通过 AI 赋能员工自驱成长与协同,构建敏捷、创新的组织文化。核心实践包括激发员工创新潜能。鼓励员工探索 AI 工具,通过 AI 系统打通知识孤岛,实现跨部门知识协同和专家匹配。其次是敏捷人才配置。运用 AI 分析员工技能结构、工作偏好,为跨团队协作提供智能组队建议,实现“任务原子化 智能调度”,提升组织敏捷性。再者是推动文化变革。倡导“人 AI”共事文化,将经理人从“岗位配置者”转型为“技能编排师”,HR 成为范式迁移的架构师与推动者。借助 AI,CHRO 不再是追踪人力成本的后台部门,而是驱动组织活力和战略落地的“前端引擎”。通过激发个体潜能、优化团队协同、加速知识流动,HR 直接赋能业务创新和市场响应速度,成为企业在不确定性中实现增长的关键力量。组织对敏捷性与人才韧性的要求上升,AI 赋能员工自驱成长与协同,从而提升团队协作效率和创新能力。CHRO 引导文化变革,推动敏捷人才配置,最终使 HR 成为组织创新与增长的强大助推器。02卓越员工体验的缔造者把员工体验做成可复利资产AI 时代,员工体验是人才竞争的制高点。CHRO 需要将员工体验视为战略资产,成为“员工体验设计师”和“人本关怀的捍卫者”,并利用 AI 实现“千人千面”的个性化体验,从而提升员工敬业度、满意度和保留率,最终驱动业务成果。96智能时代,HR 如何利用 AI 提升效率并创造价值领导力维度未来角色定位关键动作指南数据驱动的战略架构师让 HR 融入董事会的数字语境:从“报表背书人”升级为“算法译码器”,把 AI 洞察翻译成 利润率、投资回报率与与风险敞口 领先指标运营:用 AI 将离职概率、技能缺口等领先信号写入月度经营驾驶舱;人才 业务双维投资回报账本:将敬业度、学习完成率与产能、客户留存做归因模型,季度复盘;战略情景沙盘:联动 CFO/COO,每半年跑一次“市场扩张 人才供给”蒙特卡洛仿真,锁定资本支出窗口卓越员工体验的首席设计官把 EX 做成可复利资产:AI 行为科学,实现“千人千面”体验飞轮,沉淀雇主品牌护城河 体验运营创新实验:设立员工体验 KPI(即时敬业度、情绪温度、成长净推荐值),与业务收入做“双钥匙”绑定;人本化算法:部署情绪自然语言处理、职业副驾 Copilot,给每位员工生成“成长路线图即时关怀包”;价值回路复盘:每季输出员工体验业务成果现金流报告,证明每 1 元体验投入可带回 1.4 元营收创新与韧性的变革领航者把“人 AI”共创文化写进基因:驱动敏捷编队、内部人才市场知识管理与负责任 AI 治理四位一体 技能-任务双层原子化:通过“知识图谱技能矩阵”,先沉淀隐性知识,再映射为可评估技能,任务匹配效率提升 45%,项目着陆周期减半;AI 素养与提示词行动:半年内使 70%知识员工掌握提示词与共创技巧,形成“知识 技能 场景”闭环;负责任 AI 审计伦理委员会:每半年对高风险算法做偏差压力测试,确保透明度与法规合规资料来源:本报告综合分析CHRO 的 AI 领导力智能时代,HR 如何利用 AI 提升效率并创造价值97 AI 在 HR 领域的未来发展趋势预测AI 在 HR 领域的应用仍在快速演进,以下是一些关键的未来发展趋势预测030102采用成熟度从试点到企业规模化价值量化效率、体验与数据驱动决策尽管对 AI 的兴趣和实验普遍存在,但规模化 AI 计划仍是一个重大挑战。截至 2025 年,只有 25%的组织成功将其AI 计划从试点阶段推广至全企业,只有 13%的员工认为 AI 智能体已深度融入其日常工作流程,超过一半(56%)的组织仍处于实验或试点阶段使用智能体 AI这表明一线员工面临着“硅谷天花板”,好在管理者生成式 AI 的常规使用率已达 78%。未来 3-5 年内,随着 SaaS AI 解决方案的成熟和企业对 AI 价值认知的提升,AI 在 HR 领域的采用将加速从零星试点走向企业级规模化应用。越来越多的企业将把 AI 深度嵌入到 HR 全价值链中,实现端到端的智能化。未来,企业对 AI 在 HR 领域的投入将更加注重可量化的价值回报:对 AI 价值的量化将从单纯的“降本增效”转向更全面的“价值创造”,包括效率提升、员工体验优化和数据驱动决策带来的业务成果。智能时代,HR 如何利用 AI 提升效率并创造价值资料来源:Gartner,IDC,公开资料,本报告综合分析多数企业仍处在概念验证的阶段:聚焦招聘甄选、员工查询等高频场景,用低门槛 SaaS 生成式 AI 插件验证成效。McKinsey 跟踪 1,200 家跨国公司发现,只有 15%的 HR AI 项目进入正式生产环境,主要障碍是数据质量与治理框架缺失。领先者将试点成果嵌入统一的 HCM 平台,形成“招聘 学习 绩效”端到端闭环。Gartner 预 测,到 2026 年50%的财富500 企业将在核心 HR 流程中部署专有或行业化大模型,实现人与智能体协同运营。这一阶段的分水岭是 三螺旋协同(HR x IT x 业务)是否成熟:只有当数据主权、应用程序编程接口接入和业务 KPI 在同一个治理看板上,AI 能力才能在数月而非数年内横向复制。主流 HCM 供应商将把自主AI 智能体当成产品内核,支持 AI 智能体自主规划并执行整条工作流。IDC 预计,2027 年全球面向人力资本管理的生成式 AI 相关支出将以 34%的年复合增长率攀升,半数预算来自智能体与流程重构项目。HR 组织的定位将从“流程所有者”变为“模型与数据产品经理”。HR 领域 AI 应用成熟度三年跃迁曲线2027 以后“智能体原生”2025-2026“平台扩散”2024“可信试点”智能时代,HR 如何利用 AI 提升效率并创造价值99HR 领域 AI 应用价值量化:效率、体验与数据驱动决策价值纬度典型指标未来 3-5 年量化趋势运营效率招聘周期;工单处理时长生成式 AI 可将招聘全链时长再压缩 30-40%,机器人流程自动化 Copilot 在 HR 共享中心的工单周转可提高 75%员工体验推荐率;留任率;技能-岗位匹配度AI 驱动“千人千面”学习路径,留任率提升 8-12%;即时情绪分析使敬业度脉冲分数提升 10 个百分点业务洞察人力资本投资回报率;预测准确率人力资本投资回报将成为董事会常规报表字段;离职/需求预测准确率将由 70%升至 85%以上资料来源:Josh Bersin,SAP,Accenture,本报告综合分析驱动因素包括员工体验(EX)到业务成果(BX)价值飞轮的加速。员工体验将进一步被量化为影响企业收入曲线的硬核指标,AI 将把这一飞轮推向实时、自适应的“千人千面”阶段。其次是人力资本价值的财务化。HR 将能够更精准地量化人力资本对企业财务绩效的贡献,如人效产出、边际贡献率等,使人力投资成为可量化、可折算的收益资产。再者是预测性分析的普及。AI 驱动的预测性分析将成为 HR 决策的常态,从预测员工离职、技能缺口到优化人才配置,所有决策都将基于实时数据和算法模型。未来 HR 将不再仅仅报告HR 指标,而是将这些指标与业务成果紧密挂钩,用业务部门能够理解的“语言”(如营收、利润、投资资本回报率)来证明 AI 在 HR 领域的投资价值。这将促使HR 与业务部门的深度融合,共同承担业务增长责任。AI 价值焦点从降本增效转向价值创造,员工体验对业务成果的乘数效应被量化,人力资本价值得以财务化呈现,预测性分析成为决策常态,最终实现 AI 在效率、体验和数据驱动决策方面的全面价值量化。智能时代,HR 如何利用 AI 提升效率并创造价值100行动指引加速 AI 在 HR 领域的深度落地与价值释放为加速 AI 在 HR 领域的深度落地并最大化其价值释放,CHRO 可采用如下基于全球标杆企业的最佳实践的五条主线,帮助组织在不同成熟阶段快速定位切入口、排布资源优先级,并建立持续迭代的治理与优化机制。04资料来源:Josh Bersin,SAP,Accenture,本报告综合分析模块关键行动成功要诀1.战略规划与组织准备 制定 35 年 AIHR 路线图(价值驱动、场景优先)建立数据算法风险伦理“四位一体”治理 分层培养 AI 素养:基础 专业 领导力路线图需与企业数字化和业务战略同步;治理强调透明、公平、可解释2.技术实施与系统集成 选用成熟、可扩展、易集成的平台或供应商 搭建安全、高质量的数据基础设施 采用“试点 扩展 规模化”渐进部署先易后难、快速迭代;确保供应商持续支持3.变革管理与文化建设 清晰传递愿景,制定多层次沟通与培训计划 营造数据驱动、持续学习、创新包容的文化 主动应对员工对安全、技能、隐私的担忧激励机制与再培训并行,化阻力为动力4.价值测量与持续优化 建立效率、体验、战略影响“三维”指标 定期评估 用户反馈 算法迭代 功能升级 内部创新实验 外部生态合作指标量化投资回报;用实验室/挑战赛激活创意5.风险管控与合规保障 全面识别技术、业务、法律、伦理风险 对照最新法规更新合规清单 制定 AI 伦理准则,确保公平、隐私与包容风险“左移”管理,合规内嵌于开发-上线全流程智能时代,HR 如何利用 AI 提升效率并创造价值102参考资料五 Deloitte.2025 HR technology marketplace predictions.BCG.AI RADAR:From Potential to Profit:Closing the AI Impact Gap.Aon.2025 APAC Skills Impact Survey Report.BCG.AI AT WORK:Momentum Builds,But Gaps Remain.Deloitte.2025 Global Human Capital Trends.McKinsey&Company.Superagency in the workplace:Empowering people to unlock AIs full potential at work.Gartner.HR Leaders Quarterly-Q1 2025.SAP.The Top 5 HR trends todayand HRs guide to whats next.PwC.26th Annual Global CEO Survey:CEOs curbed confidence spells caution.SHRM.The Future of Work:How AI is Transforming HR.Becoming an AI-enabled,skills-based organization.Adobe.2025 AI 与数位趋势.Gallup.Q12 Meta-Analysis Report.Josh Bersin.Maximizing the Impact of AI in the Age of the Superworker.BCG.AI RADAR:From Potential to Profit Closing the AI Impact Gap.ManpowerGroup.Future Forword:Building and Sustaining a Meaningful Career in the AI Age.BCG.BCG AI RADA:From Potential to Profit with GenAI.BCG.How Generative AI Will Transform HR.Gartner.HR Leaders Quarterly Q1 2025:Augmented HR.Zendesk.Human-centered AI for HR:What it is why it matters.Accenture.Living Business:Achieving Sustainable Growth Through Hyper-Relevance.Personalized Learning Paths:How AI is Transforming Employee Training.Deloitte.2025 HR technology marketplace predictions:New dynamics for working with humans and technology.IBM.How chatbots improve human resource operations.Deloitte.AI-Powered Employee Experience:How Organisations Can Unlock Employee Potential.Prophet.The State of Digital Transformation:Special Edition GenAI Adoption in 2024.SAP.The top 5 HR Trends Todayand HRs guide to whats next.Coursera.2025 Global Skill Report:Trusted skill insights for a rapidly changing world.IBM.The Business Case for AI in HR.ATD.AI 驱动的企业人才发展:聚焦 AI 力.CIPD.People and Technology:How HR can get the balance right.Gartner.HR Leaders Magazine:Q1 2025 Edition.IBM.New Research:Executive Trust AI.ATD.Bridging the Skills Gap:Preparing for the Future.Gartner.HR Leaders Magazine:Q1 2025 Edition(Augmented HR).智能时代,HR 如何利用 AI 提升效率并创造价值104 The Futurum Group.More Than 50%of Workers Admit to Using Unapproved Generative AI Tools.ivanti.2025 Technology at Work Report:Reshaping Flexible Work.AIHR.HR Trends Report 2025.Schwabe.Employees Using Free or Unauthorized AI Tools at Work?Axios.Secret chatbot use causes workplace rifts.AIHR.11 HR Trends for 2025:Embracing Disruption.Accenture.Humans,AI and Robots:The economics of reinventing work and the workforce.Accenture.Accenture Pulse of Change:Business and Technology Trends.BCG.Closing the AI Impact Gap 2025.BCG.The Vitality Code Boston Consulting Group.Gartner.AI in HR:Position Your Organization for Success.McKinsey&Company.McKinsey&Companys Post:The Job Market is Shifting FastAI is Changing.Intelegain Technologies.Driving ROI with Microsoft Copilot Studio:Top Case Studies&HR scenario:Improve onboarding and development processes(Copilot Studio).AIHR.HR Trends Report 2025.BCG.CEOs Guide to Maximizing Value Potential from AI in 2024.Accenture.Reinventing HR in the Generative AI Era.Microsoft.Work Trend Index 2024.McKinsey.Technology Trends Outlook 2023.Accenture.Work,workforce,workers:Reinvented in the age of generative AI.Microsoft.Research Drop:Investing in HR&IT Collaboration to Drive Successful AI Transformation.ResearchGate.Unilevers Practice on AI-based Recruitment.Josh Bersin.Its Time for an L&D Revolution:The AI Era Arrives.LinkedIn.4 Ways AI Will Reshape L&D-And What It Means for Your Organization.Business Insider.Meet 10 AI trailblazers who are steering their companies into techs new age.Gartner.AI in HR:Position Your Organization for Success.Vena.100 AI Statistics Shaping Business in 2025.McKinsey&Company.The economic potential of generative AI:The next productivity frontier.World Economic Forum.The Future of Jobs Report 2023.Gallup.State of the Global Workplace.European Commission.Proposal for a Regulation on a European approach for Artificial Intelligence.IBM Institute for Business Value.The AI-powered enterprise:HRs role in accelerating the transformation.Deloitte.2023 Global Human Capital Trends:New rules for a new world.Gartner.Gartner Predicts 30%of HR Transactions Will Be Automated by 2025.AI HR Institute.AI for human resources:enhancing employee engagement and retention.HR Dive.Workers productivity increases every hour they use generative AI.智能时代,HR 如何利用 AI 提升效率并创造价值105 Anthropic.The State of AI in the Workplace.HR Executive.Whats the ROI of AI in HR?Brookings.Using AI to advance skills-first hiring McKinsey&Company.Superagency in the workplace:Empowering people to unlock AIs full potential.SHRM,2023-2024 SHRM State of the Workplace.BCG.What Job Seekers Wish Employers Knew.LinkedIn.Helping Recruiters Save Time and Increase Candidate Engagement with AI.Employ.Report Reveals Candidates Perspectives on Using AI in the Hiring Process.LinkedIn.The Future of Recruiting 2024.Robert Half.2024 Salary Guide.LinkedIn.Candidate Experience Survey.McKinsey.Four Ways to Start Using Generative AI in HR.MIT Sloan Management Review.Longitudinal Study on AI in Recruiting.Holland&Knight.Federal Court Allows Collective Action Lawsuit Over Alleged AI Hiring Bias.PwC.2024 US Responsible AI Survey.McKinsey.The State of AI:How Organizations Are Rewiring To Capture Value.Capgemini.Rise of agentic AI:How trust is the key to human-AI collaboration.SHRM.HR Adopts AI.Harmonic.Shadow AI Should I be Worried?Stanford University Human-Centured AI.AI on Trial:Legal Models Hallucinate in 1 out of 6(or More)Benchmarking Queries.Gov.UK.AI-Assisted vs human-only evidence review:results from a comparative study.F5.Shadow AI:The Silent Security Risk Lurking in Your Enterprise.Nature Portfolio.When combinations of humans and AI are useful:A systematic review and meta-analysis.ContractSafe。Contract Management Statistics Ahead of 2025 DocuSign,10 Reasons to Adopt E Signature智能时代,HR 如何利用 AI 提升效率并创造价值106

    发布时间2025-08-08 110页 推荐指数推荐指数推荐指数推荐指数推荐指数5星级
2349条  共118
前往
客服
商务合作
小程序
服务号
折叠