1、创业黑系博特智能AIGC安全实验室5BotSmartBot AIGC SecurityLAEAIGC安全研究报告AIGC Security Research ReportsAIGC安全实验室博特智能创业黑马联合发布2023年6月#page#CONTENTS3.4提示泄露攻击目录3.5越狱攻击1.AIGC研究背景3.6数据投毒攻击1.1AI技术框架安全3.7模型投毒攻击1.2AIGC内容安全3.8拜占庭攻击1.3数据安全3.9定向投毒1.4国内监管政策3.10模型萃取攻击1.5国外监管政策4.AIGC内容安全2.AIGC技术框架4.1内容安全2.1 AIGC4.2伦理安全2.2 Prompt4.
2、3安全合规2.3 chatGPT2.4ChatGPT技术架构5.AIGC数据安全2.5ChatGPT内部执行逻辑5.1数据泄露2.6 TAMER5.2数据污染2.7 Transformer5.3数据合成2.8深度学习框架6.AIGC安全产品2.9大模型2.10上层应用7.AIGC安全实验室介绍3.AIGC框架安全8.博特智能介绍3.1A供应链安全9.创业黑马介绍3.2Langchain安全3.3提示注入攻击10.参考资料AIGC安全研究报告#page#创业黑有BRAICC安全实验室XWwwAIGCL01AIGC研究背景1.1AI技术框架安全01AIGC安全研究报告#page#创业黑有B3AIG
3、C安全实验室www.AIGCLAIGC内容安全1.2AIGC通过大语言模型学习输出各种各样的内容。这些内容的合规性是一个比较大的安全合规问题。主要分为两个研究方向。内容合规问题伦理安全问题AI自从产生的那一刻起伦理安全问题就一直是个绕不开的话题。过去当AI还处于萌芽期,大部分对于AI的成长还知之甚少的时候大家对于这个问题讨论仅仅是限制在理论和会议层面。如今ChatGPT的一夜成名让所有人意识到AI已经长到了3岁。伦理安全问题不再是一个可有可无的事情,而是一个必须紧急去面对的话题。1.3数据安全02AIGC安全研究报告#page#创业黑有B3AIGC安全实验室WwwAIGCL1.4国内监管政策0
4、AIGC安全研究报告#page#创业黑有B店RAICC安全实验室XWwwAIGCL1.5国外监管政策84AIGC安全研究报告#page#创业黑有B店RAICC安全实验室XWwwAIGCL05AIGC安全研究报告#page#创业黑有BRAICC安全实验室XWwwAIGCL02AIGC技术框架2.1 AIGCAIGC即利用人工智能技术来生成内容。与此前Web1.0、Web2.0时代的UGC(用一紫账“UgIV名购区函器别HY张尘“出要(你区礼#)USd层(体区礼功让轮内容生产方式变革,而且AIGC内容在Web3.0时代也将出现指数级增长。2.2Prompt用来给AI发出指令,引导AIGC应用后端的
5、模型输出我们想要的结果的各种关键词或者词组句子成为Prommpt(提示)。以下是在一个提示中将时常看到的一些组成部分:。角色指令/任务,问题上下文示例(fewshot)2.3ChatGPT06AIGC安全研究报告#page#创业黑有B店RAICC安全实验室XWwwAIGCL2.4ChatGPT技术架构ChatGPTInstruct微调算法与模型text-基于人类9pt-35.davinci豆情的近端策turbo化学习中安略优化OON有监Codexcodo-lext-十网davinci-davinci001/002代码数据改进评估指标指令微调001EmbeddingText searchCode
6、 search预小训text-search-code-search-babbgeCText-davinc-001coGe-001练smilarity-对比预训练text-query-code-search-babbge算法与davne-01davinci-001text-001Generative Pre-trained Transformer3模GPT-3adaGPT-3 curie型GPT-3 babbgeGPT-3 davnci上下文学习百科、书籍、杂志、网站爬取专家标注、用户提交、代码语料体系图1ChatGPT技术的整体架构Fig.l The Structure ofChatGPT T