你的位置：论文发表网 >> 论文库 >> 计算机论文 >> 详细内容在线投稿

图像识别技术发展与应用

收藏打印发给朋友发布者：武煜博

热度0票浏览891次时间：2017年5月20日 08:52

图像识别技术是人工智能研

究的一个重要分支，也是人们日

常生活中使用最广泛的人工智能

技术之一。近年来，随着深度学

习技术的发展，图像识别准确率

显著提高。本论文研究了图像识

别的传统技术和深度学习技术，

分析了深度学习技术的几点不足，

并给出未来可行的解决方案。

【关键词】人工智能图像识别深度学习

1 概述

图像识别技术是人工智能研究的一个重

要分支，其是以图像为基础，利用计算机对图

像进行处理、分析和理解，以识别不同模式的

对象的技术。目前图像识别技术的应用十分广

泛，在安全领域，有人脸识别，指纹识别等；

在军事领域，有地形勘察，飞行物识别等；在

交通领域，有交通标志识别、车牌号识别等。

图像识别技术的研究是更高级的图像理解、机

器人、无人驾驶等技术的重要基础。

传统图像识别技术主要由图像处理、特

征提取、分类器设计等步骤构成。通过专家设

计、提取出图像特征，对图像进行识别、分类。

近年来深度学习的发展，大大提高了图像识别

的准确率。深度学习从大量数据中学习知识（特

征），自动完成特征提取与分类任务。但是目

前的深度学习技术过于依赖大数据，只有在拥

有大量标记训练样本的情况下才能够取得较好

的识别效果。本文认为研究如何在标记数据有

限的情况下继续利用深度学习完成物体识别任

务具有重要意义。这也是未来人工智能研究的

重要方向之一。

2 传统图像识别技术

传统的图像识别技术包括：图像获取、

预处理、特征提取、分类。在图像输入后，需

要先对图像进行预处理。一幅标准灰度图像，

如果每个像素的像素值用一个字节表示，灰度

值级数就等于256级，每个像素可以是0～255

之间的任何一个整数值。一幅没有经过压缩处

理的 640×480 分辨率的灰度图像就需要占据

300KB 的存储空间。通常我们需要将图片的

亮度及对比度调整合适，才能使图片更加清晰、

便于观察。

许多采集到的图片带有或多或少的噪声，

需要对图片的噪声进行消除。对图片噪声的消

除可以使用不同的去噪方法，如中值滤波、算

数平均滤波、平滑线性滤波和高斯滤波等。不

同滤波器分别适用于不同情况的噪声。如椒盐

图像识别技术发展与应用

文/武煜博

图像识别技术是人工智能研

究的一个重要分支，也是人们日

常生活中使用最广泛的人工智能

技术之一。近年来，随着深度学

习技术的发展，图像识别准确率

显著提高。本论文研究了图像识

别的传统技术和深度学习技术，

分析了深度学习技术的几点不足，

并给出未来可行的解决方案。

摘

要

噪声便适合使用中值滤波器，高斯噪声便适合

使用平滑线性滤波和高斯滤波。有时候，我们

需要对图像细化处理（如指纹细化，字符细化

等），以便获取主要信息，减少无关信息。细

化操作，可以得到由单像素点组成的图像轮廓，

便于后续特征提取操作。

基本的图像特征提取包括边缘、角点等

提取。一般使用不同的特征提取算子结合相应

的阈值得到这些关键点。另一类在频域中进行

特征提取的方法主要是通过傅里叶变换，将图

像基于频率分为不同的部分，从而可以在频谱

中反映出原始图像的灰度级变化，便可得到图

像的轮廓、边缘。

在完成图像的预处理和特征提取之后，

我们便能够对图像进行识别、分类。常用的分

类器有K-近邻（KNN），支持向量机（SVM），

人工神经网络（ANN）等等。K- 近邻算法原

理是，当一个样本的 k 个最相邻的样本中大部

分属于某一类别时，该样本也应当属于同一类

别。支持向量机是通过寻找支持向量，在特征

空间确定最优分类超平面，将两类样本分开。

人工神经网络模仿生物大脑中的神经网络结

构，通过误差反向传播不断优化参数，从而得

到较好的分类效果。

3 基于深度学习的图像识别技术

一般认为深度学习技术是由 Hinton 及其

学生于 2006 年提出的，其属于人工神经网络

分支。深度神经网络模仿人脑的神经机制来分

析样本，并尽可能地对样本的特征进行更深度

的学习。以图片为例，利用深度学习技术对样

本的特征进行学习时，由低层特征到高层特征

越来越抽象，越来越能表达语义概念。当样本

输入后，首先对图像进行卷积与下采样操作，

卷积和下采样操作是为了进行特征提取和选

择。以原始像素作为输入，深度学习技术可以

自动学习得到较好的特征提取器（卷积参数）。

深度学习的训练过程，首先将当前层的输出作

为下一层的输入，进行逐层分析，使得每一层

的输入与输出差别尽可能小。其后，再联合优

化，即同时优化所有层，目标是分类误差最小

化。

传统的深度神经网络往往网络中的节点

数太过庞大，难以训练。人们构造出卷积神经

网络，以权值共享的方式减少了节点数量，从

而能够加深学习的深度，使系统能学习到更抽

象、更深层的特征，从而提高识别正确率。

目前较成功的深度学习网络结构有 AlexNet、

GoogLeNet、ResNet 等。

与传统识别技术相比，深度学习技术具

有以下优势：

（1）无需人工设计特征，系统可以自行

学习归纳出特征。

（2）识别准确度高，深度学习在图像识

别方面的错误率已经低于人类平均水平，在可

预见的将来，计算机将大量代替人力进行与图

像识别技术有关的活动。

（3）使用简单，易于工业化，深度学习

由于不需要领域的专家知识，能够快速实现并

商业化，国内较知名的深度学习创业公司有专

注人脸识别的 Face++、研究无人车的驭势科

技等。

4 存在问题与未来展望

虽然深度学习具备诸多优点，但目前来

看深度学习仍有许多不足之处。首先，由于深

度学习模型为非凸函数，对其的理论研究十分

困难，缺乏理论保证。在对数据进行调整时，

仍是简单的“试错”，缺少理论支撑。

同时，由于深度学习过于依赖数据量和

计算资源。对一个新概念的学习，往往需要数

百个甚至更多有标记的样本。当遇到有标记的

样本难以获取或者代价太大时，深度学习就无

法取得好的学习效果。并且深度学习需要十分

昂贵的高性能 GPU，这使得深度学习难以平

民化。目前深度学习训练速度较慢，往往需要

几天甚至一个月。其模型扩展性差，缺少“举

一反三”的能力，样本稍加变化，系统性能便

会迅速下降。目前的深度学习属于静态过程，

与环境缺乏交互。

对其的解决方案目前主要有两点：

（1）针对于模型扩展性差的问题，通过

引入迁移学习，研究不同任务或数据之间的知

识迁移，提高模型的扩展能力、学习速度，同

时降低学习成本，便于冷启动。

（2）与强化学习结合，研究在动态环境

下进行深度学习，提高深度学习与环境交互的

能力。

参考文献

[1] 蒋树强 , 闵巍庆 , 王树徽 . 面向智能交互

的图像识别技术综述与展望 [J]. 计算机

研究与发展 ,2016:113-122.

[2] 张翠平 , 苏光大 . 人脸识别技术综述 [J].

中国图象图形学报 ,2000:885-894.

[3] 梅园 , 赵波 , 朱之丹 . 基于直线曲线混合

Gabor 滤波器的指纹增强算法 [J]. 计算机

科学 ,2016.

[4] 孙志军 , 薛磊 , 许阳明 , 王正 . 深

度学习研究综述 [J]. 计算机应用研

究 ,2012:2806-2810.

[5] 庄福振 , 罗平 , 何清 , 史忠植 . 迁移学习

研究进展 [J]. 软件学报 ,2015:26-39.

[6] 高阳 , 陈世福 , 陆鑫 . 强化学习研究综述

[J]. 自动化学报 ,2004:86-100.

作者单位

山西省榆次第一中学校山西省晋中市

030600

中国论文网（www.lunwenchina.cn），是一个专门从事期刊推广、论文发表、论文写作指导的机构。本站提供一体化论文发表解决方案：省级论文/国家级论文/核心论文/CN论文。

投稿邮箱：lunwenchina@126.com

在线咨询：189308598（QQ）

联系电话：15295038855（徐编辑）

TAG: 解决方案人工智能日常生活应用文准确率

你的位置：论文发表网 >> 论文库 >> 计算机论文 >> 详细内容在线投稿

图像识别技术发展与应用

图文资讯

联系我们

最新论文信息

你的位置：论文发表网 >> 论文库 >> 计算机论文 >> 详细内容 在线投稿

图像识别技术发展与应用

图文资讯

联系我们

最新论文信息

你的位置：论文发表网 >> 论文库 >> 计算机论文 >> 详细内容在线投稿