1、生成式AI和信息安全企业的实践尝试孙琦我们的一些AI知识储备0102我们的一些AI实践和现状人工智能(Artificial Intelligence)是一门计算机学科,是一门人类尝试赋予机器模拟人类智能的一门学科。我们尝试让计算机系统能够模拟人类去执行各类任务,比如语音、图像的识别,处理自然语言以及做一些决策。人工智能发展的三个阶段1980年 规则驱动的专家系统2000年 特征+统计学习2012年 大数据驱动的深度学习AI和机器学习的关系人工智能机器学习深度学习机器学习是人工智能学科领域的一个分支,通过数据和统计模型让机器自动学习和改进的一种方法。机器学习的目标是设计和开发算法,让计算机系统能
2、够在没有明确的编程的条件下从数据中学习,通过模型训练,机器学习能够做到识别模式、做出预测和决策等能力。(学科领域)(实现手段)(优化实现)监督学习:通过使用带有标签的训练数据来训练模型的学习方法 监督学习和无监督学习输入数据:X训练模型结果预测输出数据:Z结果错误预期数据输出结果:Y数据对比模型更新输入数据:X训练模型生成样例无监督学习:在没有标签的情况下从未标记的数据中自动发现模式和结构的学习方法深度学习:是机器学习的一个特定领域,利用人工神经网络模型进行学习和训练,通过算法和模型让计算机系统从数据中学习的方法。深度学习模型由多个层次(称为神经网络的层)组成,每一层都会对输入数据进行变换和表
3、示。这些网络层通过一系列的非线性转换将输入数据映射到输出结果。深度学习模型的核心是深度神经网络(Deep Neural Network,DNN),它可以通过大量的标记数据进行训练,从而实现高度准确的预测和分类任务。深度学习人工智能机器学习深度学习深度神经网络(Deep Neural Network,DNN)生成式AI和深度学习的关系人工智能机器学习深度学习生成式AI生成式AI是深度学习的分支判别模型生成模型是猫判别模型 和 生成模型判别模型(Discriminative Model)和生成模型(Generative Model)是机器学习中两种不同类型的模型,它们的主要区别在于其对数据的建模方
4、式和应用领域。生成模型主要的优点是信息丰富、处理蛋类问题的灵活性比较强、增量学习以及对于缺失数据的合成;缺点也很明显,学习过程复杂,成本高昂;判别模型的优点是类间差异清晰、灵活的分类边界、学习简单和性能好;缺点主要表现在不能反应数据的特性、需要全量数据的学习判别模型是一种直接对条件概率进行建模的模型。它主要关注的是给定输入数据,预测输出类别或标签的概率分布。判别模型通过学习输入和输出之间的关系来建立决策边界,从而对新的输入数据进行分类。常见的判别模型包括逻辑回归、支持向量机和深度神经网络等。判别模型通常用于分类、回归和标注等任务。生成模型是一种对联合概率分布进行建模的模型。它不仅学习输入和输出
5、之间的关系,还学习了生成输入数据的过程。生成模型可以通过学习数据的分布和特征之间的关系来生成新的样本数据。常见的生成模型包括高斯混合模型(Gaussian Mixture Model,GMM)和生成对抗网络(Generative Adversarial Network,GAN)等。生成模型通常用于生成新的图像、语言模型和数据增强等任务。判别模型和生成模型的选择取决于具体的问题和任务需求。判别模型更关注分类和预测的准确性,可以直接对输入和输出之间的关系进行建模。而生成模型更关注数据的生成过程,可以模拟数据的分布和生成新的样本。生成模型可以用于生成新的数据,但在分类和预测任务上可能不如判别模型准确
6、。数据标签判别模型标签非结构化数据生成模型新内容数据和标签之间的关系数据的分布和特征之间的关系判别模型 和 生成模型生成式AI的监督、半监督和无监督学习传统的监督、无监督学习,将训练数据和标注数据喂给模型,可以作出预测、分类和聚类。生成式 AI 的监督、半监督、无监督学习,将训练数据、打标数据和未打标数据给基础模型,然后生成新的内容,最终实现文本、代码和图片的生成。训练编码标签构建模型判别分类聚类训练编码标签数据基础模型生成编码生成文本生成图像无标签数据生成式AI和传统编程、神经网络的区别传统的编程方式,需要硬编码来描述猫的一些特征。神经网络算法可以通过学习是不是猫的样本,然后你给出一张图片它