各类机器学习问题

监督学习(Supervised learning)

给定的输入及相应的标签一同构成训练数据集,将其作为输入,通过有监督学习算法,输出一个“完成学习模型”。

每个 “特征-标签” 对,都称为一个样本(example)

随后,我们就能够将之前没见过的样本特征放到这个“完成学习模型”中,使用模型的输出,作为相应标签的预测

其相关问题有:

  • 回归(regression):有关“有多少”的问题,其标签能够取任意数值,我们目标生成一个模型(训练一个回归函数),输出一个数值,能够预测出非常接近实际标签值,如:估计⼀栋房⼦的公平市场价值、预测⽤⼾对⼀部电影的评分、在未来六小时,这个镇会有多少降⾬量?

  • 分类(classification):有关“哪一个”的问题,目标生成一个模型(训练一个分类器),能够预测样本属于哪个类别(class),即能够输出预测的类别。有二元分类、多类分类(multiclass classification)问题。

    为了判断这种“是”或“不是”的硬分类预测,模型会为每个可能的类分配一个概率

  • 标记问题:希望模型能够描述输入图像的内容:一只猫、一只狗、一只公鸡等等。学习预测不相互排斥的类别的问题,成为多标签分类(multilabel classification),如一篇博客文章可能会用到多个标签

  • 搜索:不是简单的“查询-网页”分类,而是在海量搜索结果中找到⽤⼾最需要的那部分,因此搜索结果的排序很重要,学习算法需要输出有序的元素子集

  • 推荐系统(recommender system):⽬标是向给特定⽤⼾进⾏“个性化”推荐,对于任何给定的⽤⼾,根据其一些明确反馈或者隐形反馈,推荐系统会为“给定⽤⼾和物品”的匹配性打分,这个“分数”可能是估计的评级或购买的概率,同时检索分数最⾼的对象集,然后将其推荐给⽤户

  • 序列学习

  • 自动语音识别

  • 文本到语音

  • 机器翻译

无监督学习(Unsupervised learning)

给定的样本并不含有目标或标签,某一样本的具体含义是未知的

  • 聚类(clustering)问题:在没有标签的情况下,对数据进行分类。如给定一组用户的网页浏览记录,能否将具有相似行为的用户进行聚类
  • 主成分分析(principal component analysis)问题:找到少量的参数,以准确地捕捉数据的线性相关属性,如:⼀个球的运动轨迹可以⽤球的速度、直径和质量来描述;又如:有⼀小部分参数,能够准确地描述了⼈体的形状,裁缝们能够通过这些参数来设计⾐服
  • 因果关系(causality)和概率图模型问题
  • 生成对抗性网络

与环境互动

待填坑

强化学习(Reinforcement learning)

待填坑

机器学习的算法,是通过数据集,将所需的算法找出来,其计算过程来自于数据(主要基于统计方法),而不是人工的设计。

深度学习

深度学习是表示学习(Representation Learning)的一个分支。

待填坑