1、第十二章 目标检测与识别,Lecture 12 Object Detection and Recognition,目标检测和识别,怎样检测和识别图像中物体,如汽车、牛等?,目标识别的应用,难点之一:如何鲁棒识别?,类内差异(intra-class variability),类间相似性(inter-class similarity),难点之二:计算量大,一幅图像中像素个数多,目前每秒约产生300G像素的图像/视频数据。-Google图片搜索中已有几十亿幅图像-全球数字照相机一年产生180亿张以上的图片(2004年)-全球一年销售约3亿部照相手机(2005)人的物体识别能力是强大的-灵长类动物约使
2、用大脑皮层的一半来处理视觉信息 Felleman and van Essen 1991-可以识别3,000-30,000种物体-物体姿态可允许30度以上的自由度。,难点之三:如何在小样本条件下学习,物体识别方法,检测(detection)vs.不检测表示(representation)-颜色、纹理、边缘、梯度、局部特征、深度、运动等等。分类(classification or categorization)-K近邻(KNN)-神经网络(NN)-支持向量机(SVM)-Boosting(Adaboost等)-隐马尔科夫模型(HMM)-其他,生成学习(Generative learning)vs.判
3、别学习(discriminative learning),生成学习 vs.判别学习,两种分类器学习模式生成学习-目标是学习到符合训练数据的类别模型-如EM算法(Maximum Likelihood)判别学习在训练阶段即考虑类别之间的判别信息包括Support Vector Machines(SVMs),Boosting,Minimum Classification Error(MCE),Maximum Mutual Information(MMI),Lager Margin(LM),and etc.判别学习算法比生成学习算法表现出更好的分类性能。,判别学习方法,第二节 人脸检测与识别,13,1
4、.物体检测,Car/non-car Classifier,Yes,car.,No,not a car.,基于二分类器,14,物体检测,Car/non-car Classifier,在复杂背景下,通过滑动窗口(sliding windows)搜索感兴趣的物体。,物体检测,Step1.获取训练数据Step2.提取特征Step3.训练分类器Step4.利用分类器进行检测,人脸检测(Face detection),Viola-Jones人脸检测算法(基于AdaBoost),Viola-Jones人脸检测算法(2004),滤波器设计,Adaboost,Adaboost是一种迭代算法,其核心思想是针对同一
5、个训练集训练不同的分类器(弱分类器),然后把这些弱分类器集合起来,构成一个更强的最终分类器(强分类器)。其算法本身是通过改变数据分布来实现的,它根据每次训练集之中每个样本的分类是否正确,以及上次的总体分类的准确率,来确定每个样本的权值。将修改过权值的新数据集送给下层分类器进行训练,最后将每次训练得到的分类器最后融合起来,作为最后的决策分类器。使用adaboost分类器可以排除一些不必要的训练数据特徵,并将关键放在关键的训练数据上面。,Boosting Example,Boosting Example,Boosting Example,Boosting Example,Boosting Exam
6、ple,Boosting Example,Adaboost,学习目标:选择能够最有效地区分人脸与非人脸的矩形特征及其阈值,Adaboost,组合弱分类器(weak learners),得到更为精确的集成分类器(ensemble classifier)。弱分类器:性能仅比随机分类稍好根据矩形特征定义弱分类器:,Adaboost算法步骤,初始给每个训练样本以同等权重循环执行以下步骤:根据当前加权训练集,选择最佳弱分类器提升被当前弱分类器错分的训练样本的权重按照各弱分类器分类精度对其加权,然后将各个弱分类器形成线性组合,得到最终分类器。,Viola-Jones算法中的AdaBoost,每一次boos
7、ting迭代如下:评价每一个样本上的每一种矩形特征 为每一种矩形特征选择最佳分类阈值选择最优的矩形特征及其阈值组合 改变样本权重计算复杂度:O(MNT)M:特征数,N:样本数,T:阈值数,级联分类器(Cascading Classifiers),训练级联分类器,Viola-Jones检测算法-总体流程,用5K正样本,350M反样本学习得到38层(共使用6060个特征)级联分类获得实时性,Viola-Jones人脸检测结果,Viola-Jones人脸检测结果,Viola-Jones人脸检测结果,2.人脸识别(face recogntion),Zhao et al.,Face Recogniton
8、:a literature survey.ACM Computing survey,2003,Face Recognition:2-D and 3-D,图像=像素的集合,将由n个像素构成的图像视为n维空间中的点,最近邻分类器,Eigenfaces,使用主成分分析技术(Principle Component Analysis,PCA)减少维数,主成分分析(PCA,K-L变换),降低特征向量的维数获得最主要特征分量,减少相关性;避免维数灾难,主成分分析(PCA,K-L变换),主成分分析(PCA,K-L变换),Eigenfaces,学习1.计算训练图像的均值和协方差矩阵.2.计算协方差矩阵的特征值,
9、取前k个最大特 征值对应的特征矢量.3.将图像投影到k-维特征空间(Eigenspace)。识别1.将测试图像投影到Eigenspace.2.在特征图像上执行分类.,Eigenfaces:训练图像,Eigenfaces,PCA方法的不足,可能损失重要的细节信息方差最小的方向也可能是重要的没有考虑判别任务希望得到最具判别能力的特征但判别能力最佳并不等同于方差最大,Fisherfaces:类特定的线性投影,PCA&Fisher的线性判别函数,PCA&Fisher的线性判别函数,Fisherfaces示例(ORL Database),基于eigenfaces/fisherfaces的识别,训练:-根
10、据训练图像,利用PCA或Fisher方法确定投 影矩阵-将每个训练图像投影到子空间(eigenspace或fisherspace)。识别:-将测试图像投影到eigenspace或fisherspace。-子空间中距离测试图像最近的训练图像对应的类别为识别结果。,Project5:人脸合成,平均人脸,平均就是美,Project5:人脸合成,Project5:人脸合成,Project5:人脸合成,Project5:人脸合成,Project5:人脸合成,FantaMorph,人脸合成软件,Project5:人脸合成,FantaMorph,人脸合成软件,手动标定人脸,Project5:人脸合成,Fan
11、taMorph,人脸合成软件,手动标定人脸,Project5:人脸合成,FantaMorph,人脸合成软件,产生多张合成图像,随机或者平均输出,Project5:人脸合成,Task:利用人脸检测算法,将上述过程改为自动完成,实现自动人类合成。,第三节 深度学习导引,第三节 深度学习导引,第三节 深度学习导引,第三节 深度学习导引,第三节 深度学习导引,第三节 深度学习导引,第三节 深度学习导引,第三节 深度学习导引,神经网络的基本结构,神经网络的大量参数,神经网络的表现能力,神经网络的表现能力,神经网络的表现能力,神经网络的表现能力,卷积神经网络,卷积神经网络,卷积神经网络,卷积神经网络,卷积
12、神经网络,卷积神经网络,卷积层的作用,卷积神经网络,卷积神经网络,卷积神经网络,池化层的作用,卷积神经网络,卷积神经网络,激活函数,卷积神经网络,卷积神经网络,卷积神经网络,卷积神经网络,Softmax层的作用,卷积神经网络,卷积神经网络,网络的预处理,卷积神经网络的实例,Alexnet,卷积神经网络的实例,Alexnet,卷积神经网络的实例,FCN网络,卷积神经网络的实例,FCN网络,卷积神经网络的实例,FCN网络,卷积神经网络的训练方法,卷积神经网络的训练方法,卷积神经网络的训练方法,卷积神经网络的训练方法,卷积神经网络的训练方法,卷积神经网络的训练方法,卷积神经网络的训练方法,卷积神经网络的训练方法,卷积神经网络的训练方法,递归神经网络,Recurrent Neural Networks,递归神经网络,LSTM,
copyright@ 2008-2023 冰点文库 网站版权所有
经营许可证编号:鄂ICP备19020893号-2