人工智能基础
上QQ阅读APP看书,第一时间看更新

2.4 分类器的测试和应用

们已经了解了两种分类器的学习算法:感知器与支持向量机。在得到分类器之后,我们希望知道分类器的分类效果怎么样,哪一个学习算法获得的分类器性能最好。于是,我们需要一个测试的环节,测试就像我们学习之后的考试。在考试中,同学们一般会面对一张试卷进行答题;答题结束后,老师进行阅卷,最终给出评分。

类似地,在分类器的测试阶段,它会面对批测试数据并要对每一个测试样本做出预测结果。如果分类的结果和测试样本的标注一样,那么分类正确,否则分类错误。比如在区分鸢尾花品种的例子中,测试数据中有一朵鸢尾花,它的花瓣长度是1.5cm,宽度是0.4cm。将测试样本的特征向量(1.5,0.4)画在特征空间中,如果它位于分类直线山鸢尾的一侧,预测为山鸢尾。如果这朵鸢尾花确实为山鸢尾,那么分类正确。

在整个测试集上都测试一遍后,我们统计出分类器分类正确的样本数,它与测试样本总数的比率可以反映预测的准确程度,被称为分类准确率,相当于老师进行阅卷后给出的分数。

分类准确率=(分类正确的样本数/测试样本总数)×100%

知道了分类准确率后,我们便知道了分类器的效果,这样就可以在多个分类器之间进行比较,选择一个最好的分类器。

经过测试选择了一个最佳的分类器,接下来就是它大显身手的时候了。如果我们看到了一朵鸢尾花,想知道它属于哪个品种,只需拿出尺子量一下它的花瓣长度和宽度,然后输入到训练好的分类器中,分类器就会输出它的预测结果。这个过程就是分类器的应用阶段。