前阵子李世石对战 AlphaGo 着实让深度学习火了一把,AlphaGo 4:1 赢了比赛,确实牛逼,再不学习学习就落伍了,开这篇博客写写学习笔记。

机器学习 or 深度学习

这两个是包含的关系,深度学习属于机器学习的更深入的研究。

学习的概念:针对经验 E (experience) 和一系列的任务 T (tasks) 和一定表现的衡量 P,如果随之经验 E 的积累,针对定义好的任务 T 可以提高表现 P,就说计算机具有学习能力。

基本概念

训练集,测试集,特征值,监督学习,非监督学习,半监督学习,分类,回归

  • 训练集(training set/data)/训练样例(training examples): 用来进行训练,也就是产生模型或者算法的数据集

  • 测试集(testing set/data)/测试样例(testing examples):用来专门进行测试已经学习好的模型或者算法的数据集

  • 特征向量(features/feature vector):属性的集合,通常用一个向量来表示,附属于一个实例

  • 标记(label): 实例类别的标记

  • 正例(positive example)

  • 反例(negative example)

  • 有监督学习(supervised learning):训练集有类别标记(class label)

  • 无监督学习(unsupervised learning):无类别标记(class label)

  • 半监督学习(semi-supervised learning):有类别标记的训练集 + 无标记的训练集

  • 分类(classification): 目标标记为类别型数据(category)

  • 回归(regression): 目标标记为连续性数值(continuous numeric value)

机器学习步骤框架

  1. 把数据拆分为训练集和测试集
  2. 用训练集和训练集的特征向量来训练算法
  3. 用学习来的算法运用在测试集上来评估算法 (可能要设计到调整参数(parameter tuning), 用验证集(validation set)

学习资料