Skip to content

一、什么是人工智能

机器对人的思维或者行为的模拟; 如: 车牌识别、人脸识别、自动驾驶 情感分类、机器翻译、人机互动 智能机器人 特点:信息处理、自我学习、优化升级

tips:人工智能在做预测时,分为两类

  1. 分类:预测结果是离散的,比如垃圾邮件检测、疾病诊断、图像识别
  2. 回归:预测结果是连续的,比如房价预测、销售预测、股票预测

人工智能的实现

符号学习:基于逻辑与规则的学习方法(不可自我迭代); 机器学习:从数据中寻找规律、建立关系,根据建立的关系去解决问题的方法(数据驱动,可以自我迭代升级)

机器学习与深度学习的关系

人工智能>机器学习>深度学习 机器学习是一种实现人工智能的方法, 深度学习是一种实现机器学习的技术。

机器学习:使用算法来解析数据,从中学习, 然后对真实世界中事件做出决策和预测。 深度学习:模仿人类神经网络,建立模型,进行数据分析。比如人脸识别、语义理解、无人驾驶等。

二、机器学习

机器学习就是给它准备了大量数据,然后给它指定了一种学习方式,然后经过多次的这种训练,最后给你输出了一个你要的这个数据和最终结果之间的一个对应函数,这个就是过程就是机器学习。 可以理解为:数据驱动模型

  • tips: 就是找到一个复杂的函数的映射关系,我们以前去编程那些东西,就是明确写出来,但是现在写的这个问题复杂了,你人没法写出来了,就只能让机器帮我们做,比如车牌照的识别,对于图片里面是什么这件事和你要的数字是什么,它对应的中间是不是有个函数,就是说这个函数你没法自己写出来,也写不了啊,然后你又得找到这个对应的函数,因为找到这个函数之后,以后再来了一个车牌照了以后,它就对应直接输出这个结果了

机器学习的类别

有监督学习: 使用带有标签的数据进行训练模型:人脸识别、语音翻译、医学诊断 无监督学习:使用未标记的数据进行训练模型:新闻聚类、降维 半监督学习(混合学习):使用少量的标记数据和大量未标记数据进行训练模型:文本分类 强化督学习:根据每次结果收获的奖惩(结果收到的反馈)进行学习,实现优化 :AlphaGo

学习算法

监督学习:

  1. -线性回归
  2. -逻辑回归
  3. -决策树
  4. -神经网络、卷积神经网络、循环神经网络 无监督学习:
  5. -聚类算法

参数值

经常听说,某某某模型多少亿个参数,其实就是某个字后面接的词有多少个概率量这个意思

训练集

用于训练机器学习模型的数据集。

验证集

验证集用于在模型训练过程中评估模型的性能。

测试集

测试集是在模型训练和参数调整完成后,用于全面评估模型性能的数据集。

tips:

在实际应用中,通常会将数据集划分为训练集、验证集和测试集的比例为 70%、15%、15%。

机器学习的任务

  • 分类任务(classification)
  • 回归任务(regression)
  • 聚类任务(clustering)
  • 生成任务(generation)
  • 强化学习任务(reinforcement learning)
  • 降维任务(dimensionality reduction)
  • 去噪任务(denoising) ...

监督学习应用场景:

分类(classification):垃圾邮件检测、疾病诊断、图像识别 回归(regression):房价预测、销售预测、股票预测 关联规则(association rule):购物篮分析、推荐系统

无监督学习应用场景:

聚类(clustering):比如基于颜色、基于形状分类

机器学习的效果评估

  1. 欠拟合:模型过于简单,无法捕捉数据的复杂性
  2. 最佳拟合:模型能够很好地捕捉数据的复杂性
  3. 过拟合:模型过于复杂,学习到了数据的噪声

深度学习

深度学习是机器学习的一种架构,它模仿人类大脑的神经网络,通过多层神经网络来提取数据的特征,从而实现数据的分类、识别等任务。

RNN(循环神经网络):处理序列数据,如自然语言处理、时间序列预测 CNN(卷积神经网络):处理图像数据,如图像识别、图像分类 Transformer:它把上面两个结合起来了,所以它可以处理序列数据,也可以处理图像数据,它是目前ai领域奠基的一个模型

Transformer介绍:

它由编码器和解码器组成。编码器对输入数据进行特征提取,解码器对这些特征进行解码并输出结果。
其起源可追溯到“Attention Is All You Need”论文,引入了自注意力机制,可在并行的方式下处理序列数据。核心思想在于通过自注意力机制捕捉序列中任意位置元素间的关系,使模型在处理文本或图像时具备更强的特征表达能力。 特点:从片段记忆到全局记忆,从串行处理到高效并行