cs231n lec2

发表于2023-07-03|更新于2023-08-03|网课笔记cs231n

|阅读量:

图像分类概述

任务：输入图像 $\rightarrow$ 标签
挑战：语义鸿沟，算法需要鲁棒性，克服遮挡、视角、光线等等问题
尝试：计算边界，识别耳朵、眼睛等，效果不好

最终，收集大量的数据，训练分类器，利用分类器对目标进行评估，识别。这个过程两个部分：

train：输入数据和标签，输出模型
predict：输入模型，做出预测

Nearest Neighbor

train 记住数据和标签，找到最相像的图片，给出预测
数据集：CIFAR10(10 类，50,000 训练图片， 10,000 测试图片)
距离度量：L1 distance: $d(I_1,I_2)=\sum_p\mid I_1^p-I_2^p\mid$ ，即对应像素值计算距离（绝对值），再求和
训练时间短，预测时间长

优化：KNN，从K个最近邻中大多数

L2 distance： $d(I_1,I_2)=\sqrt{\sum_p(I_1^p-I_2^p)^2}$

超参数：需要设置算法的一些参数，比如k，比如距离度量
超参数的设置：

超参数选择1

超参数选择2

线性分类器

$f(x,W)=Wx+b$ , 线性分类器不保留数据，只需要参数，因此效率更高， $W$ 的选择在下一讲

比如将图片拉成列向量后与权重相乘，得到每个类别的分数，分数最高的就是预测类别。

让线性分类器低效的数据：

低效数据集

作业

该部分的作业见作业1-Q1-KNN

文章作者: Ruoy

文章链接: https://stayfish.github.io/blog/2023/07/03/cs231n-lec2/

版权声明: 本博客所有文章除特别声明外，均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 Ruoy's Blog！

cs231n 计算机视觉

相关推荐

cs231n assignment1

评论

数据库加载中