2.1 什么是计算模型?
Tom M. Mitchell(前卡内基梅隆大学机器学习系主任):“机器学习(Machine Learning)是研究计算机算法的一门学科,这些算法可以通过经验和数据的使用自动改进。”
如人类的学习一样,教机器也遵循着:教授基本规则——>练习规则<——>改正错误——>熟悉规则,应用规则。计算机在训练集(training dataset)上学习,在测试集(test dataset)上进行验证,当测试结果稳定后,试图将学习到的规则泛化到新的数据上去。这是一种简单朴素的智能模拟。
机器学习一般可以分为三大类:
监督学习:通过已知输入和输出数据对模型进行训练,使其能够预测新的输入数据的输出。常见应用包括线性分类(如垃圾邮件检测)、线性回归(如房价)。
无监督学习:从没有标签的数据中寻找隐藏模式。常见应用包括聚类(如客户分群)和降维(如主成分分析)。
强化学习:通过试错法学习,通过奖励和惩罚机制优化决策过程。常见应用包括游戏AI和自动驾驶。
机器学习的概念非常广泛,本书只能涵盖其中的一部分。本书在后续会探讨监督学习中的神经网络模型以及强化学习中的主要内容。
最后更新于