机器学习 | 1. 索引
前阵子李世石对战 AlphaGo 着实让深度学习火了一把,AlphaGo 4:1 赢了比赛,确实牛逼,再不学习学习就落伍了,开这篇博客写写学习笔记。
机器学习 or 深度学习
这两个是包含的关系,深度学习属于机器学习的更深入的研究。
学习的概念:针对经验 E (experience) 和一系列的任务 T (tasks) 和一定表现的衡量 P,如果随之经验 E 的积累,针对定义好的任务 T 可以提高表现 P,就说计算机具有学习能力。
基本概念
训练集,测试集,特征值,监督学习,非监督学习,半监督学习,分类,回归
训练集(training set/data)/训练样例(training examples): 用来进行训练,也就是产生模型或者算法的数据集
测试集(testing set/data)/测试样例(testing examples):用来专门进行测试已经学习好的模型或者算法的数据集
特征向量(features/feature vector):属性的集合,通常用一个向量来表示,附属于一个实例
标记(label): 实例类别的标记
正例(positive example)
反例(negative example)
有监督学习(supervised learning):训练集有类别标记(class label)
无监督学习(unsupervised learning):无类别标记(class label)
半监督学习(semi-supervised learning):有类别标记的训练集 + 无标记的训练集
分类(classification): 目标标记为类别型数据(category)
回归(regression): 目标标记为连续性数值(continuous numeric value)
机器学习步骤框架
- 把数据拆分为训练集和测试集
- 用训练集和训练集的特征向量来训练算法
- 用学习来的算法运用在测试集上来评估算法 (可能要设计到调整参数(parameter tuning), 用验证集(validation set)
学习资料
本文是原创文章,采用 CC BY-NC-ND 4.0 协议,完整转载请注明来自 Gavin Liu - 代码人生与科技生活
评论