机器学习与深度学习概述

¶各类机器学习问题

¶监督学习（Supervised learning）

给定的输入及相应的标签一同构成训练数据集，将其作为输入，通过有监督学习算法，输出一个“完成学习模型”。

每个 “特征-标签” 对，都称为一个样本（example）

随后，我们就能够将之前没见过的样本特征放到这个“完成学习模型”中，使用模型的输出，作为相应标签的预测

其相关问题有：

回归（regression）：有关“有多少”的问题，其标签能够取任意数值，我们目标生成一个模型（训练一个回归函数），输出一个数值，能够预测出非常接近实际标签值，如：估计⼀栋房⼦的公平市场价值、预测⽤⼾对⼀部电影的评分、在未来六小时，这个镇会有多少降⾬量？
分类（classification）：有关“哪一个”的问题，目标生成一个模型（训练一个分类器），能够预测样本属于哪个类别（class），即能够输出预测的类别。有二元分类、多类分类（multiclass classification）问题。
为了判断这种“是”或“不是”的硬分类预测，模型会为每个可能的类分配一个概率。
标记问题：希望模型能够描述输入图像的内容：一只猫、一只狗、一只公鸡等等。学习预测不相互排斥的类别的问题，成为多标签分类（multilabel classification），如一篇博客文章可能会用到多个标签
搜索：不是简单的“查询-网页”分类，而是在海量搜索结果中找到⽤⼾最需要的那部分，因此搜索结果的排序很重要，学习算法需要输出有序的元素子集
推荐系统（recommender system）：⽬标是向给特定⽤⼾进⾏“个性化”推荐，对于任何给定的⽤⼾，根据其一些明确反馈或者隐形反馈，推荐系统会为“给定⽤⼾和物品”的匹配性打分，这个“分数”可能是估计的评级或购买的概率，同时检索分数最⾼的对象集，然后将其推荐给⽤户
序列学习
自动语音识别
文本到语音
机器翻译

¶无监督学习（Unsupervised learning）

给定的样本并不含有目标或标签，某一样本的具体含义是未知的

聚类（clustering）问题：在没有标签的情况下，对数据进行分类。如给定一组用户的网页浏览记录，能否将具有相似行为的用户进行聚类
主成分分析（principal component analysis）问题：找到少量的参数，以准确地捕捉数据的线性相关属性，如：⼀个球的运动轨迹可以⽤球的速度、直径和质量来描述；又如：有⼀小部分参数，能够准确地描述了⼈体的形状，裁缝们能够通过这些参数来设计⾐服
因果关系（causality）和概率图模型问题
生成对抗性网络

¶与环境互动

待填坑

¶强化学习（Reinforcement learning）

待填坑

机器学习的算法，是通过数据集，将所需的算法找出来，其计算过程来自于数据（主要基于统计方法），而不是人工的设计。

¶深度学习

深度学习是表示学习（Representation Learning）的一个分支。

待填坑