人工智能概念解读

Liz大约 4 分钟

人工智能概念解读

1. 机器学习、深度学习与强化学习
1. 有监督学习、半监督学习、无监督学习
1. 在线学习和离线学习
1. 回归，分类与多标签分类
1. 推荐与搜索

1. 机器学习、深度学习与强化学习

简而言之：

机器学习是根据数据提取知识的通用方法。
深度学习是机器学习中一个强大的-子集，它侧重于利用神经网络。
强化学习则侧重于在决策过程中通过反馈来优化智能体的行为。

1.1. 机器学习

机器学习研究计算机系统如何利用经验（通常是数据）来提高特定任务的性能。

用数据来调整模型参数，从而确定程序行为（输⼊-输出映射）。

参数可以被看作旋钮，旋钮的转动可以调整程序的⾏为。

任⼀调整参数后的程序被称为模型（model）。

使⽤数据集来选择参数的元程序被称为学习算法（learning algorithm）。

我们不需要设计“明确的”系统逻辑，只需要定义一个灵活的程序算法，其输出由许多参数（parameter）决定，然后使用数据集来确定当下的“最佳参数集”。

在机器学习中，学习（learning）是⼀个训练模型的过程。通过这个过程，我们可以发现正确的参数集，从⽽使模型强制执⾏所需的⾏为。换句话说，我们⽤数据训练（train）模型。

这种“通过⽤数据集来确定程序⾏为”的⽅法可以被看作⽤数据编程（programming with data）。

1.2. 机器学习中的四大关键组件

数据（数据集）data : 可以用来学习的数据
模型 model ：如何转换数据的模型
目标函数 objective function （损失函数，loss/cost function）：量化模型的有效性
优化算法（梯度下降,gradient descent）：调整模型参数以优化目标函数的算法

1.3. 深度学习

深度学习是机器学习的一个子集，它使用了一类称为神经网络的算法。深度学习模型特别是卷积神经网络（CNNs）和循环神经网络（RNNs），能够在大量的数据中自动发现表示层次，从而学习数据的高层抽象。深度学习在图像识别、语音识别、自然语言处理等领域表现出色，成为当今很多复杂问题的首选方法。

1.4. 强化学习reinforcement learning与环境交互

强化学习是一种与众不同的范式，它关注的是智能体（agent）如何在环境中采取行动，以最大化某种累计奖励。不同于大多数机器学习方法中数据是静态提供的，强化学习强调的是学习与环境之间的交互。智能体通过试错（trial and error）和收获奖励来学习最优策略。

2. 有监督学习、半监督学习、无监督学习

有监督学习（supervised learning）：每个数据样本都有相应标签

半监督学习：部分数据样本有标签或仅采用部分数据样本的标签

无监督学习（unsupervised learning）：数据样本没有标签

3. 在线学习和离线学习

离线学习（offline learning）：数据时预先准备好的，固定的

在线学习（online learning）：数据是实时的，变化的

4. 回归，分类与多标签分类

4.1. 回归regression

在回归中，我们训练一个回归函数，它的输出为预测的数值。

回归问题：任何有关“多少”的问题很可能就是回归问题。标签是任意数值。

4.2. 分类classification

分类问题：任何有关“哪一个”的问题很可能就是分类问题。

在分类中，我们训练一个分类器，它的输出为预测的类别。

我们可以试着用概率语言来理解模型。给定一个样本，模型为每个类别分配一个概率。eg.猫狗分类器，输出一个图像是猫的概率是0.9。可以理解为，分类器90%确定图像描绘的是一只猫。

预测类别的概率的大小传达了一种模型的不确定性。

单标签分类：类别间相互排斥。
- 二分类：只有两种类别，最简单的分类问题。
- 多分类：两个以上的类别。如识别手写数字。
多标签分类：也称为标记问题，不相互排斥的类别问题。

4.3. 多标签分类 multi-label classification

类别之间不相互排斥。

比如，一张图中有人，汽车，房子等多个物体。一篇博客文章有“机器学习”、“编程语言”、“AI”等多个标签。

5. 推荐与搜索

5.1. 搜索

如今，搜索引擎使用机器学习和用户行为模型来获取网页相关性得分

谷歌搜索引擎依靠一个简单的相关性过滤来识别一组相关条目，然后根据PageRank对包含查询条件的结果进行排序

5.2. 推荐

目标是向特定用户进行“个性化”推荐。

人工智能概念解读

# 人工智能概念解读

# 1. 机器学习、深度学习与强化学习

# 1.1. 机器学习

# 1.2. 机器学习中的四大关键组件

# 1.3. 深度学习

# 1.4. 强化学习reinforcement learning与环境交互

# 2. 有监督学习、半监督学习、无监督学习

# 3. 在线学习和离线学习

# 4. 回归，分类与多标签分类

# 4.1. 回归regression

# 4.2. 分类classification

# 4.3. 多标签分类 multi-label classification

# 5. 推荐与搜索

# 5.1. 搜索

# 5.2. 推荐

人工智能概念解读

1. 机器学习、深度学习与强化学习

1.1. 机器学习

1.2. 机器学习中的四大关键组件

1.3. 深度学习

1.4. 强化学习reinforcement learning与环境交互

2. 有监督学习、半监督学习、无监督学习

3. 在线学习和离线学习

4. 回归，分类与多标签分类

4.1. 回归regression

4.2. 分类classification

4.3. 多标签分类 multi-label classification

5. 推荐与搜索

5.1. 搜索

5.2. 推荐