2 s }& s; [5 p: c3 ~0 x 前言
) ^. [; |4 f+ M1 I' D8 J 前段时间忙工作的事情,所以没有给大家及时更文,近期小瑞根据各版块的知识重新划分了一下结构,新加的版块有“专题强化”和“可视原理”,专题强化这块日后会经常写一些单一性知识的文章,和其他版块的内容相关性不大但是也是必须要知道的一些内容。可视原理这块小瑞想把各个算法用视频或者其他方式来展现其实现原理。让大家更容易理解算法的本质。好了,先说这么多,今天的内容是小瑞在工作中遇到的一些问题,周末抽空给大家整理总结一下。今天的主要知识就是在 Tensorflow 中的数据处理及读取数据的方式.
- ?8 T# ?6 V4 ^ 1. 图像处理
/ N7 ?# o1 t M+ s
常见的图像处理有图像去燥、图像超分辨、图像增强等等。要对图像进行处理,首先要构建所需要的数据库,处理的数据的方式也是多种多样,常见的有:
! v- y& |( N. S0 r
2 u; m: W1 [1 N$ d# `- V 图像颜色域的变化(例如RGB转Gray)
n0 _6 _" I8 B) Y- J
数据增强 (Data augmentation)将图像翻转,缩放,裁剪,旋转等
) u9 A N! _- K r* j 图像块(Image patch) 就是从整张图像中, 扣下小块的小图像,这么做主要是因为可以增加训练数据的量, 另外小块的图像训练起来速度更快, image patch的合理性是基于卷积神经网络的感受野(Receptive field)通常不会太大.
8 n6 t# u" S# F4 ^
做完这些,然后就需要为深度网络喂数据,还需要写Batch Generator, 就是用来生成一个batch的东西.
; W1 B5 R2 E! {8 c/ P 训练方案
2 S0 H# @; p r1 ^ 构建数据库的部分是独立, 也就是说我们对找到的图像做预处理, 将预处理的结果保存起来, 这就算构建好训练的数据库了, 训练时从数据库里直接拿数据进行训练
8 S; W5 O4 ~* ^9 y! Q; H 训练时实时地预处理一个batch的图像, 将处理的结果作为训练的输入
5 I. X1 h8 w5 a( q1 `- L
第一种方法将训练集的构建和网络的训练分开,并且将预处理结果存在电脑中,这样做训练的代码会比较简单,且直接读入处理好的数据能让训练速度更快,当然,不足的地方就是不够灵活,如果预处理的方式改变了(例如, 原本是RGB转HSV, 现在我要RGB转Gray), 那么需要重新构建一个数据库,造成硬盘空间的浪费. 第二种方法虽然训练速度不如第一种,但是足够灵活, 一般来讲主要关注第二种方法. 在TensorFlow中,图像处理主要由tf.image模块支持, batch generator主要用tf.data.Dataset实现,下面来看下整个流程的具体实现. 事先准备了一个文件夹, 存放了19张图片, 作为我们本章代码的示例图片
1 Q7 u G9 b4 ?* a Y# a' P, g: Q 
6 G. x! z1 \* S& o" ] 对于训练来讲, TensorFlow提供了一整套图像预处理以及数据生成的机制,这里实现了一个简单的常用的数据处理框架, 总结为三步:
+ @! c" l( ]; Z, w; B% @3 I9 C u' X# O! F/ R
获取所有图片的路径
/ f; {" B" i7 r4 w$ [& W5 Z$ m 图片预处理的代码
& D- t. d* c# @6 {2 J) }, p% w 定义数据生成器
( \* s* E8 {# ?9 _& \' J" P 2. 图像处理相关代码
7 j% T0 j/ }# V# g
! t0 N0 P. c$ w% J/ X9 W/ i
1. 获取图片路径
6 f! R( y( v* y5 T( i% C" s) \* }; K 
( M0 n* o4 A. u" |! T; Z( q

3 m. x. [6 V9 M7 M

$ N( I2 ?; } W: z1 r 
8 k; n( a8 B. x% M# f 2. Batch Generator
( c, R3 V; G! A

1 R9 @3 I+ P# D' e4 a! N5 T 
U9 ~9 V' P8 y$ ?; B 
2 x1 h0 B0 F$ t7 n3 D. m4 P' V( P

4 z( U( |8 Q( S0 s" ` 3. 处理效果
- S3 J1 r* `8 P" h/ j! B* \% j3 K 
, [3 t4 }$ f7 v# L7 N
: J+ N; L! f8 ~3 [, _7 J% n