
机器学习与深度学习概述

¶各类机器学习问题
¶监督学习(Supervised learning)

给定的输入及相应的标签一同构成训练数据集,将其作为输入,通过有监督学习算法,输出一个“完成学习模型”。
每个 “特征-标签” 对,都称为一个样本(example)
随后,我们就能够将之前没见过的样本特征放到这个“完成学习模型”中,使用模型的输出,作为相应标签的预测
其相关问题有:
回归(regression):有关“有多少”的问题,其标签能够取任意数值,我们目标生成一个模型(训练一个回归函数),输出一个数值,能够预测出非常接近实际标签值,如:估计⼀栋房⼦的公平市场价值、预测⽤⼾对⼀部电影的评分、在未来六小时,这个镇会有多少降⾬量?
分类(classification):有关“哪一个”的问题,目标生成一个模型(训练一个分类器),能够预测样本属于哪个类别(class),即能够输出预测的类别。有二元分类、多类分类(multiclass classification)问题。
为了判断这种“是”或“不是”的硬分类预测,模型会为每个可能的类分配一个概率。
标记问题:希望模型能够描述输入图像的内容:一只猫、一只狗、一只公鸡等等。学习预测不相互排斥的类别的问题,成为多标签分类(multilabel classification),如一篇博客文章可能会用到多个标签
搜索:不是简单的“查询-网页”分类,而是在海量搜索结果中找到⽤⼾最需要的那部分,因此搜索结果的排序很重要,学习算法需要输出有序的元素子集
推荐系统(recommender system):⽬标是向给特定⽤⼾进⾏“个性化”推荐,对于任何给定的⽤⼾,根据其一些明确反馈或者隐形反馈,推荐系统会为“给定⽤⼾和物品”的匹配性打分,这个“分数”可能是估计的评级或购买的概率,同时检索分数最⾼的对象集,然后将其推荐给⽤户
序列学习
自动语音识别
文本到语音
机器翻译
¶无监督学习(Unsupervised learning)
给定的样本并不含有目标或标签,某一样本的具体含义是未知的
- 聚类(clustering)问题:在没有标签的情况下,对数据进行分类。如给定一组用户的网页浏览记录,能否将具有相似行为的用户进行聚类
- 主成分分析(principal component analysis)问题:找到少量的参数,以准确地捕捉数据的线性相关属性,如:⼀个球的运动轨迹可以⽤球的速度、直径和质量来描述;又如:有⼀小部分参数,能够准确地描述了⼈体的形状,裁缝们能够通过这些参数来设计⾐服
- 因果关系(causality)和概率图模型问题
- 生成对抗性网络
¶与环境互动
待填坑
¶强化学习(Reinforcement learning)
待填坑
机器学习的算法,是通过数据集,将所需的算法找出来,其计算过程来自于数据(主要基于统计方法),而不是人工的设计。
¶深度学习
深度学习是表示学习(Representation Learning)的一个分支。
待填坑