AI计划100天-Week1 总结

gingo 2021-04-17 16:51:05 AI基础收藏

0 / 1255

深度学习在解决分类问题上非常厉害。让它声名大噪的也是对于图像分类问题的解决。也产生了很多很经典的模型。其他方向的模型发展很多都是源于这各部分，它是很多模型的基础工作。因此我们首先了解一下它们。

从模型的发展过程中，随着准确率的提高，网络结构也在不断的进行改进，现在主要是两个方向，一是深度，二是复杂度。此外还有卷积核的变换等等。

深度神经网络的发展要从经典的LeNet模型说起，那是1998年提出的一个模型，在手写数字识别上达到商用标准。之后神经网络的发展就由于硬件和数据的限制，调参的难度等各种因素进入沉寂期。

到了2012年，Alex Krizhevsky 设计了一个使用ReLu做激活函数的AlexNet 在当年的ImageNet图像分类竞赛中(ILSVRC 2012)，以top-5错误率15.3%拿下第一。他的top-5错误率比上一年的冠军下降了十个百分点，而且远远超过当年的第二名。而且网络针对多GPU训练进行了优化设计。从此开始了深度学习的黄金时代。

大家发表的paper一般可以分为两大类，一类是网络结构的改进，一类是训练过程的改进，如droppath，loss改进等。

之后网络结构设计发展主要有两条主线，一条是Inception系列（即上面说的复杂度），从GoogLeNet 到Inception V2 V3 V4，Inception ResNet。 Inception module模块在不断变化，一条是VGG系列（即深度），用简单的结构，尽可能的使得网络变得更深。从VGG 发展到ResNet ，再到DenseNet ，DPN等。

最终Google Brain用500块GPU训练出了比人类设计的网络结构更优的网络NASNet,最近训出了mNasNet。

此外，应用方面更注重的是，如何将模型设计得更小，这中间就涉及到很多卷积核的变换。这条路线则包括 SqueezeNet，MobileNet V1 V2 shuffleNet等。

ResNet的变种ResNeXt 和SENet 都是从小模型的设计思路发展而来。

输入:图片输出:类别标签

模型名	AlexNet	ZFNet	VGG	GoogLeNet	ResNet
初入江湖	2012	2013	2014	2014	2015
层数	8	8	19	22	152
Top-5错误	16.4%	11.2%	7.3%	6.7%	3.57%
Data Augmentation	+	+	+	+	+
Inception(NIN)	–	–	–	+	–
卷积层数	5	5	16	21	151
卷积核大小	11,5,3	7,5,3	3	7,1,3,5	7,1,3
全连接层数	3	3	3	1	1
全连接层大小	4096,4096,1000	4096,4096,1000	4096,4096,1000	1000	1000
Dropout	+	+	+	+	+
Local Response Normalization	+	+	–	+	–
Batch Normalization	–	–	–	–	+