• 如果您觉得本站非常有看点,那么赶紧使用Ctrl+D 收藏吧

机器学习西瓜书笔记

开发技术 开发技术 4周前 (01-31) 14次浏览

机器学习基本术语

数据集(data set):记录的集合

示例(instance)或样本(sample):每条记录是关于一个时间或对象的描述

属性(attribute)或特征(feature):反映事件或对象在某方面的表现或性质的事项

属性值(attribute value):属性上的取值

属性空间(attribute space)或样本空间(sample space)或输入空间:属性张成的空间

特征向量(feature vector)

维数(dimensionality)

训练(training)

训练样本(training sample)

训练集(training set)

假设(hypothesis)

真实(ground-truth)

学习器(learn)

预测(prediction)

标记(label)

标记空间(label space)

分类(classification)

多分类(multi-class classification)

正类(positive class)

反类(negative class)

测试(testing)

测试样本(testing sample)

分布(distribution)

独立同分布(independent and identically distributed)

监督学习(supervised learning)

无监督学习(unsupervised learning)

聚类(clustering)

簇(cluster)

回归(regression)

泛化(generalization)

归纳(induction)

演绎(deduction)

假设空间

由形如属性值的不同的可能取值所组成的假设组成

可以由许多不同的策略对假设空间进行搜索,自顶向下或者自顶向上,前者从一般到特殊,即特化,后者从特殊到一般,即泛化,搜索过程中可以删除与正例不一样的假设、和(或)、反例一致的假设,最终将会获得与训练集一致(即可以对所有训练样本进行正确判断)的假设,即为我们学习的结果

归纳偏好

机器学习算法在学习过程中对某种类型假设的偏好,称为“归纳偏好”,或简称为“偏好”

 


程序员灯塔
转载请注明原文链接:机器学习西瓜书笔记
喜欢 (0)