1、演讲嘉宾:黄裕城-腾讯黄裕城腾讯海外游戏算法研究员 2022年加入腾讯IEG Global,主要从事游戏出海场景NLP&Speech算法的研究与落地 研究方向:多模态理解,大语言模型,AI智能体等1角色扮演的数据构造流程是什么?2角色扮演大模型如何进行训练?3角色扮演的评测体系如何构建?1游戏场景下机器翻译的挑战有哪些?2机器翻译如何有效利用大模型能力?3游戏场景下机器翻译怎么持续优化?1角色扮演的数据构造流程是什么?2角色扮演大模型如何进行训练?3角色扮演的评测体系如何构建?角色扮演大模型通用大模型的答案具有一种浓浓的Assistant语气,具体来说就是很官方、书面,具有强烈的说教口吻,不够
2、口语化角色扮演大模型旨在为游戏中的 NPC(非玩家角色)提供可定制的、高度拟人化的有情绪、有温度的交互维度通用AI角色AI句式表达句式完整;书面语非统一格式;口语化情绪无有立场中立有偏好道德约束高随人设,不设限角色档案 角色设定“5+3”原则:基本要素:姓名、性别、年龄、性格和背景附加要素:动作表情、对话风格和角色知识 场景构建三要素:对话场景+对话者+对话者关系角色扮演数据集构建数据来源 多来源人设的角色数据,包括小说、剧本、游戏等 针对游戏特定的情境,采集相关的类别数据,如奇幻、科幻、历史、二次元等题材Stage I:Supervised FTStage II:Retrieval Augm
3、ented FT+知识注入对话数据角色扮演对话数据Stage III:Preference FT+偏好拒绝对话数据通用世界知识角色特定知识安全问题防越狱认知边界懂拒绝角色扮演大模型训练:Staging Train小说剧本对话抽取对话改写和用户一起完成某个虚拟情节的演绎强化角色的逻辑性和知识表达能力会造成一定的角色扮演能力的损失+情节、旁白描述性文本角色扮演超拟人通用指令语料相似问答检索角色对话改写剧情片段剧情对话访谈角色对话改写强化模型的角色知识和RAG能力角色扮演丧失逻辑能力角色扮演无所不知百晓生安全问题收集多回答生成边界问题构造DPO专家校验纯对话语料打分模型评估评估准则1.Convers
4、ational Ability(评价角色的基本语言能力)a)Language Fluency:语言的流畅程度,原则让人感觉到流畅,拟人,不生硬,不严格考虑语法。b)Language Relevance:角色是否能正确对当前话题做出反应,不谈无关的信息,即Instruction Following 的能力。2.Character Consistency Ability(评价角色的基本特点)a)Role-specific Tone:具有角色特点的用词和口吻,以及产生恰当的描述性旁白b)Role Knowledge:主要包含2部分,对基础知识的掌握,以及角色知识的掌握3.Character Attr
5、activeness(评价角色的高级特点)a)Emotional Expression:在恰当的情形下,表现符合角色特点的情绪和性格。b)Interactive Engagement:沉浸感强,让人有继续沟通下去的冲动角色扮演评估框架搭建角色扮演Benchmark评估评分是0-3之间的值,以下为每个类别的区分点的整体性定义:0 -针对某条评价准则,对话中存在负向表现1 -对话不涉及这条评价准则,或者勉强涉及但基本不能满足2 -对话涉及这条评价准则,且基本满足3 -对话涉及这条评价准则,且完美满足这条评价标准He,Huang,et al.Crab:A Novel Configurable Rol
6、e-Playing LLM with Assessing Benchmark.角色扮演对话案例对比1游戏场景下机器翻译的挑战有哪些?2机器翻译如何有效利用大模型能力?3游戏场景下机器翻译怎么持续优化?随着全球市场的扩展,本地化已成为游戏开发不可或缺的一部分。游戏本地化的需求主要源于全球市场的广泛覆盖和文化差异的适应,旨在提供符合当地文化习惯和语言的游戏体验。游戏本地化翻译游戏版本内翻译用户社交翻译运营活动翻译离线短文本离线长文本实时对话文本系统类用词固定剧情类偏创意性要求克服文化差异文本风格差异性大拼写、语法错误术语俚语和习语传统的翻译解决方案比如 Google 翻译、DeepL 翻译使用中小