基于轻量化卷积神经网络的图像分类对比研究

1）山东师范大学信息科学与工程学院，2023级计本01班，山东济南，中国

摘要—随着深度学习技术的迅速发展，卷积神经网络（CNN）已成为图像分类等计算机视觉任务中的核心方法。然而，传统深层 CNN 模型通常具有大量参数和高计算复杂度，在移动端和嵌入式设备上难以高效部署，限制了其实际应用的推广。针对这一问题，轻量化卷积神经网络通过设计高效卷积模块和优化网络结构，实现了性能与计算资源消耗的平衡，为资源受限环境下的视觉任务提供了可行方案。

本文选取 MobileNetV2 与 ShuffleNetV2 两种典型轻量化网络，并以基础卷积神经网络作为对比基线，基于 CIFAR-10 数据集开展实验。研究工作包括模型构建、统一训练策略、性能评估及对比分析，重点探讨轻量化模型在分类准确率、模型复杂度和训练收敛性方面的表现。核心创新在于系统对比不同轻量化模型在相同实验条件下的性能差异，并结合参数量与计算效率分析其实际应用价值。

实验结果显示，轻量化模型在保持较低计算成本的前提下仍能取得稳定且可观的分类性能。其中，ShuffleNetV2 在参数量较低的情况下实现了较高的准确率与效率平衡；MobileNetV2 在当前实验设置下表现稳定，但性能提升空间仍然存在。研究验证了轻量化卷积神经网络在资源受限环境下的可行性，并为实际图像分类任务中的模型选择提供了参考。

本研究不仅为轻量化卷积神经网络在图像分类中的应用提供了实证依据，也为移动端和嵌入式视觉系统的发展提供了理论指导和实践参考。

关键词— 卷积神经网络，图像分类，轻量化模型，深度学习

引言#

随着深度学习技术的迅速发展，卷积神经网络（Convolutional Neural Networks, CNN）已成为图像分类等计算机视觉任务的核心方法。CNN 能够自动从图像中提取多层次特征，相比传统人工设计的特征方法表现出更高的分类性能，因此被广泛应用于人脸识别、目标检测、医学影像分析等领域。然而，经典深层 CNN 模型如 VGG、ResNet 等通常参数庞大、计算量高，在移动设备或嵌入式系统上难以高效运行，这限制了其实际应用。

为了解决这一问题，研究者提出了多种轻量化 CNN 架构，通过优化卷积模块设计、降低参数量和计算复杂度，实现高准确率与低资源消耗之间的平衡。其中，MobileNet 系列在轻量化网络研究中具有里程碑意义。Howard 等人提出的 MobileNet 采用深度可分离卷积（depthwise separable convolution），显著减少了模型参数量和计算开销，同时保持较高分类性能，使其尤其适合在移动端和边缘设备上应用，并在 ImageNet 等标准分类任务中得到验证。[1]

另一类代表性的轻量化网络是 ShuffleNet。Zhang 等人在 ShuffleNet 中引入分组卷积与通道混洗（channel shuffle）机制，通过降低通道间冗余计算提升了网络效率，在保证准确率的同时显著减少了计算量和参数量。这一设计为轻量化网络结构提供了新的思路，并在移动和嵌入式图像分类任务中表现出良好性能。[2]

大量研究表明，轻量化 CNN 在保持合理准确率的同时能够大幅降低计算开销，与传统深层网络相比更适合资源受限场景。例如，Xue 的研究对比了传统 CNN 与 MobileNet、ShuffleNet 在多个数据集上的表现，为理解轻量化模型与大型网络的性能差异提供了实证依据。[3]

尽管轻量化网络已在多个领域取得应用，但关于其在标准图像分类任务中的系统对比仍是活跃研究方向。本文选取典型轻量化模型，通过标准数据集实验对其分类性能、模型复杂度及资源消耗进行对比，并总结不同模型在实际应用中的优势与局限，为具体应用场景下的模型选择提供参考。

研究方法#

整体实验流程#

本文的整体实验流程遵循深度学习图像分类任务中的通用范式，主要包括数据准备、模型构建、模型训练、性能测试与结果分析五个阶段。首先，对选定的数据集进行预处理与划分，确保训练集与测试集之间不存在数据泄漏；随后构建不同的卷积神经网络模型，并在统一的训练策略下进行训练；最后在测试集上评估模型性能，并对实验结果进行对比分析。

该实验流程设计参考了深度学习实验可复现性研究中的标准建议，强调统一训练条件和评价方式，以保证不同模型之间对比的公平性和可靠性。规范的实验流程有助于减少实验噪声对结果的影响，使性能差异主要来源于模型结构本身。[8]

数据集介绍#

本文选用 CIFAR-10 作为实验数据集。CIFAR-10 是图像分类领域中广泛使用的公开数据集之一，由 10 个类别的自然图像组成，每个类别包含 6000 张彩色图像，总计 60000 张。图像分辨率为32*32，其中 50000 张用于训练，10000 张用于测试。

由于 CIFAR-10 数据集规模适中、类别分布均衡，且在大量文献中被用作轻量化模型评测基准，因此非常适合用于不同卷积神经网络在分类性能与计算效率方面的对比研究。[9]

模型构建与配置#

在模型构建阶段，本文选取一种常规卷积神经网络作为基线模型，并选用两种典型的轻量化卷积神经网络（MobileNet 与 ShuffleNet）进行对比实验。所有模型均基于公开实现进行构建，并在输入尺寸、分类类别数等关键参数上保持一致，以确保实验的可比性。

模型实现依托于主流深度学习框架 PyTorch，该框架提供了高度模块化的网络构建方式，便于快速搭建、训练与测试不同模型结构。通过统一模型输入输出接口，能够高效完成多模型对比实验。[10]

实验代码和所需的环境依赖请见附录。

训练参数与实验环境#

为保证实验公平性，本文在不同模型的训练过程中采用统一的训练参数设置。模型训练使用随机梯度下降类优化方法，并采用交叉熵损失函数进行监督学习。训练过程中固定训练轮数、学习率及批大小等参数，避免因超参数差异对实验结果造成干扰。

在优化算法选择上，本文参考了自适应学习率优化方法在图像分类任务中的成功应用经验。实验环境基于通用深度学习软硬件配置，能够满足轻量化模型的训练与测试需求。[11]

评价指标#

为了全面评估不同模型在图像分类任务中的性能，本文采用分类准确率（Accuracy）作为主要评价指标。分类准确率反映模型在测试集上正确预测样本的比例，是图像分类任务中最直观、最常用的性能指标。

此外，在轻量化模型对比中，模型参数量也是衡量模型复杂度的重要指标之一。通过联合分析分类准确率与模型规模，可以更全面地评价不同模型在性能与效率之间的权衡情况。

评价指标设计参考了经典模式识别与机器学习评估方法相关研究，确保实验结果具有可比性和解释性。[12]

实验与分析#

模型分类性能对比#

在本实验中，选取 CIFAR-10 数据集作为评测基准，对轻量化卷积神经网络模型的图像分类性能进行分析。CIFAR-10 数据集包含 10 个类别的彩色图像，具有较高的类别多样性和一定的分类难度，被广泛用于图像分类模型的性能评估。

表 4-1 给出了 MobileNet 模型在 CIFAR-10 测试集上的分类结果。从实验结果可以看出，随着训练轮数的增加，模型测试准确率从第 1 轮的 39.62% 稳步提升至第 5 轮的 60.84%，整体呈现出稳定上升趋势。这表明 MobileNet 能够在较少训练轮数的情况下有效学习图像特征。

与传统深层卷积神经网络相比，轻量化模型在参数量和计算复杂度受限的前提下，仍能取得较为可观的分类性能。这一现象与已有研究结论一致，即深度可分离卷积在减少计算量的同时，仍能保持较强的特征表达能力。[13][14][15]

表4-1 MobilNet模型在轻量化参数的情况下的准确率（详细数据请见附录）

模型复杂度对比#

在实际应用中，模型的分类性能并非唯一衡量指标，模型复杂度同样是轻量化网络设计的重要考量因素。模型复杂度通常通过参数量（Parameters）和计算量（FLOPs）进行衡量。

MobileNet 通过引入深度可分离卷积（Depthwise Separable Convolution），将标准卷积操作拆分为逐通道卷积和逐点卷积，从而显著减少模型参数量和计算开销。相关研究表明，在相同精度水平下，MobileNet 的计算量远低于传统卷积神经网络。[16]

ShuffleNet 进一步结合通道分组卷积和通道混洗（Channel Shuffle）机制，有效缓解了分组卷积带来的信息隔离问题，在保持极低计算复杂度的同时提升了特征融合能力。实验表明，ShuffleNet 在移动端和嵌入式设备中具有更高的计算效率。[17]

表 4-2 给出了不同模型的参数量复杂度对比，综合来看，轻量化模型在牺牲部分精度的前提下，显著降低了模型规模和计算成本，为资源受限场景下的图像分类任务提供了可行方案。[18]

表4-2

实验结果分析与讨论#

综合实验结果可以发现，MobileNet 模型在训练过程中表现出良好的收敛性。训练损失随着 Epoch 的增加持续下降，测试准确率稳步提升，说明模型参数优化过程稳定，未出现明显的震荡或退化现象。[19][20]

尽管实验中未采用预训练权重和复杂的数据增强策略，模型仍取得了超过 60% 的测试准确率。这一结果在 CPU 环境和有限训练轮数条件下是合理且可信的。已有研究指出，轻量化模型在小规模数据集上的性能提升往往依赖于更充分的训练和更精细的正则化策略。

需要指出的是，与高容量模型相比，轻量化模型在极高精度任务中仍存在一定性能瓶颈。然而在移动端部署、实时识别和低功耗应用场景中，轻量化卷积神经网络在效率与性能之间取得了良好平衡。[21]

未来工作可在此基础上进一步引入数据增强、学习率调度策略或知识蒸馏方法，以提升模型的泛化能力和最终分类性能。

图 4-3 训练损失与测试准确率随 Epoch 变化曲线

训练过程与收敛性分析#

为了进一步分析模型在训练过程中的学习行为，本文对 MobileNet 模型的训练损失与测试准确率随训练轮数变化的趋势进行了研究。通过对训练过程的观察，可以直观反映模型的收敛速度以及训练稳定性。

从实验结果来看，模型在前几个 Epoch 内训练损失下降较为明显，说明网络在初期阶段能够快速学习到图像的低层和中层特征。与此同时，测试准确率呈现出持续上升趋势，表明模型在参数更新过程中逐步提升了对测试样本的判别能力。

值得注意的是，在整个训练过程中，训练损失与测试准确率的变化趋势保持一致，未出现测试性能明显下降的情况，说明在当前实验设置下模型未发生严重过拟合。这与深度学习中关于经验风险最小化与泛化性能之间关系的理论分析结果相符。

总体而言，MobileNet 模型在较少训练轮数和有限计算资源条件下表现出良好的收敛特性，验证了轻量化卷积神经网络在实际应用中的稳定性和可训练性。

本章小结#

本章围绕轻量化卷积神经网络在图像分类任务中的实验表现，对模型分类性能、模型复杂度以及训练过程进行了系统分析。通过在 CIFAR-10 数据集上的实验结果可以看出，MobileNet 模型在保持较低计算复杂度的同时，仍能够取得较为合理的分类准确率，体现了其在资源受限环境下的应用优势。

实验结果表明，轻量化模型在实际训练过程中具有较好的稳定性和收敛性，能够在较少训练轮数内实现性能提升。尽管其最终分类精度与大规模深度模型仍存在一定差距，但在计算效率、模型规模与性能之间取得了较为平衡的效果。[22]

综上所述，本章的实验结果验证了轻量化卷积神经网络在数字图像处理任务中的实用价值，也为后续进一步引入更复杂训练策略或模型结构改进提供了实验依据。

结论#

本文围绕轻量化卷积神经网络在数字图像处理中的应用展开研究，重点探讨了不同轻量化模型在图像分类任务中的性能表现与模型复杂度特征。通过在 CIFAR-10 数据集上构建并对比基础卷积神经网络、MobileNetV2 以及 ShuffleNetV2 等模型，系统分析了它们在相同实验条件下的分类准确率、参数规模及训练过程表现，从而对轻量化卷积神经网络的实际应用效果进行了验证。

实验结果表明，在有限训练轮数和计算资源条件下，轻量化卷积神经网络依然能够取得较为稳定的分类性能。其中，ShuffleNetV2 在参数量较低的情况下取得了相对较高的测试准确率，表现出较好的性能与复杂度平衡；MobileNetV2 虽然模型规模较大，但在当前实验设置下其性能优势尚未完全体现；基础卷积神经网络结构简单、参数量最小，仍能够作为有效的对比基线模型。这些结果表明，不同模型在分类性能和计算复杂度之间存在明显的权衡关系，模型选择应结合具体应用场景进行综合考虑。

在研究过程中也遇到了一些实际问题和挑战。首先，由于实验在 CPU 环境下进行，模型训练速度受到一定限制，训练轮数相对较少，这在一定程度上影响了模型性能的充分发挥。其次，实验未采用预训练权重和复杂的数据增强策略，导致模型整体分类精度仍有提升空间。这些因素对实验结果产生了一定影响，但也使得实验过程更加贴近基础教学环境下的实际情况。

从方法实施效果来看，本文所采用的实验流程和模型构建方法具有较好的可行性。通过统一的数据集、训练参数和评估指标，实现了不同模型之间的公平对比，实验结果具有较好的可重复性和解释性。尽管部分模型在短期训练中未达到最优性能，但整体实验设计能够清晰反映轻量化卷积神经网络在图像分类任务中的基本特性和发展趋势。

需要指出的是，本文的研究仍存在一定的局限性。一方面，实验数据集规模有限，且训练轮数较少，尚未对模型在大规模数据和长时间训练条件下的性能进行深入分析；另一方面，研究仅关注分类准确率和参数量等指标，未进一步结合推理速度、能耗等实际部署因素进行综合评估。未来研究可在此基础上引入更多评价指标，并结合预训练模型、数据增强或模型优化策略，进一步提升轻量化模型的性能表现。

总体而言，本文的研究结果验证了轻量化卷积神经网络在数字图像处理任务中的应用价值，对于理解不同轻量化模型的设计思想和性能特点具有一定的参考意义。相关结论不仅有助于加深对轻量化深度学习模型的认识，也可为后续在移动端或资源受限环境中的图像分类应用提供一定的实践参考。

致谢#

本论文的完成得益于多方面的支持与帮助。谨此感谢课程任课教师在学习与论文撰写过程中给予的指导与建议，使研究工作得以顺利开展。

同时，也感谢在学习与生活中给予我鼓励与陪伴的人。東雲なの、Amiya、Hare以及我的宠物新叶喵，在论文完成过程中为我提供了重要的精神支持，使我能够保持良好的状态完成相关研究工作。

在此，对所有给予关心与帮助的人表示诚挚的感谢。

参考文献#

HOWARD A G, ZHU M, CHEN B, et al. MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications[EB/OL]. arXiv:1704.04861, 2017[2024-10-20].

ZHANG X, ZHOU X, LIN M, et al. ShuffleNet: An Extremely Efficient Convolutional Neural Network for Mobile Devices[EB/OL]. arXiv:1707.01083, 2017[2024-10-20].

XUE Y. Comparison of conventional and lightweight convolutional neural networks for image classification[J]. Highlights in Science, Engineering and Technology, 2025.

ALTENBERGER F, LENZ C. A non-technical survey on deep convolutional neural network architectures[EB/OL]. arXiv:1803.02129, 2018[2024-10-20].

KRIZHEVSKY A, SUTSKEVER I, HINTON G E. ImageNet classification with deep convolutional neural networks[EB/OL]. (2012)[2024-10-20].

HOWARD A G, ZHU M, CHEN B, et al. MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications[EB/OL]. arXiv:1704.04861, 2017[2024-10-20].

ZHANG X, ZHOU X, LIN M, et al. ShuffleNet: An Extremely Efficient Convolutional Neural Network for Mobile Devices[EB/OL]. arXiv:1707.01083, 2017[2024-10-20].

GÉRON A. Hands-On Machine Learning with Scikit-Learn and TensorFlow [M].PINEAU J, et al. Improving Reproducibility in Machine Learning Research [C]//ICML Workshop. 2021 [2024-10-20].

KRIZHEVSKY A, HINTON G. Learning Multiple Layers of Features from Tiny Images[R]. University of Toronto, 2009.

PASZKE A, et al. PyTorch: An Imperative Style, High-Performance Deep Learning Library[C]//NeurIPS, 2019[2024-10-20].

KINGMA D P, BA J. Adam: A Method for Stochastic Optimization[C]//ICLR, 2015[2024-10-20].

POWERS D M W. Evaluation: From Precision, Recall and F-Measure to ROC, Informedness, Markedness & Correlation[J]. Journal of Machine Learning Technologies, 2011.

Krizhevsky A, Hinton G. Learning Multiple Layers of Features from Tiny Images[R]. Toronto: University of Toronto, 2009[EB/OL].

Howard A G, Zhu M, Chen B, et al. MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications[EB/OL]. 2017. arXiv:1704.04861.

Sandler M, Howard A, Zhu M, et al. MobileNetV2: Inverted Residuals and Linear Bottlenecks[EB/OL]. 2018. arXiv:1801.04381.

ZHANG X, et al. ShuffleNet: An Extremely Efficient Convolutional Neural Network for Mobile Devices[EB/OL]. 2017[2024-10-20]. arXiv:1707.01083.

MA N, et al. ShuffleNet V2: Practical Guidelines for Efficient CNN Architecture Design[EB/OL]. 2018[2024-10-20]. arXiv:1807.11164.

CHOLLET F. Xception: Deep Learning with Depthwise Separable Convolutions[EB/OL]. 2016[2024-10-20]. arXiv:1610.02357.

HE K, et al. Deep Residual Learning for Image Recognition[EB/OL]. 2015[2024-10-20]. arXiv:1512.03385.

TAN M, LE Q. EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks[EB/OL]. 2019[2024-10-20]. arXiv:1905.11946.

HINTON G, et al. Distilling the Knowledge in a Neural Network[EB/OL]. 2015[2024-10-20]. arXiv:1503.02531.

LeCun Y, Bengio Y, Hinton G. Deep learning[J]. Nature, 2015, 521(7553): 436-444.

论文作者工作简介#

作者1：丁舒凡（202311000555），计本2301

负责论文整体研究方案的设计与实施，确定以轻量化卷积神经网络为研究对象，完成实验思路与技术路线的规划。

独立完成实验代码的编写与调试，包括基础 CNN、MobileNetV2 和 ShuffleNetV2 模型的构建、训练与测试，并对实验过程中出现的问题进行分析和解决。

负责实验数据的整理与结果分析，完成模型分类性能、模型复杂度以及训练过程等对比实验，并生成相应的图表用于论文展示。

完成论文的主要撰写工作，包括引言、相关工作、研究方法、实验与分析、结论及致谢等内容，并对全文进行修改与完善。

附录#

提示：附录部分内容包括源代码、未在正文展示的其他图、表等。附带源码时须带上必要的注释信息。

Python环境依赖：

pip install torch torchvision

python -m pip install pandas

（实验基于 PyTorch 深度学习框架完成，模型构建主要依赖 torchvision 官方模型库。）

代码附件：code.py、code2.py、data（包括代码和训练材料）

表4-1的数据来源：

表4-2的数据来源：

| 训练轮次 (Epoch) | 损失值 (Loss) | 测试准确率 (Test Acc) | | 1 | 1.9096 | 39.62% | | 2 | 1.5500 | 47.74% | | 3 | 1.3927 | 52.17% | | 4 | 1.2559 | 58.05% | | 5 | 60.84% | 1.1500 |

| 模型 | Test Accuracy (%) | Parameters (M) | | Basic CNN | 55.06 | 0.09 | | MobileNetV2 | 54.90 | 2.24 | | ShuffleNetV2 | 57.37 | 1.26 |

站点已运行

博客总览

访问统计

引言#

相关工作#

卷积神经网络基础#

轻量化卷积神经网络研究进展#

MobileNet 模型#

ShuffleNet 模型#

研究方法#

整体实验流程#

数据集介绍#

模型构建与配置#

训练参数与实验环境#

评价指标#

实验与分析#

模型分类性能对比#

模型复杂度对比#

实验结果分析与讨论#

训练过程与收敛性分析#

本章小结#

结论#

致谢#

参考文献#

论文作者工作简介#

附录#

站点已运行

博客总览

访问统计

引言#

相关工作#

卷积神经网络基础#

轻量化卷积神经网络研究进展#

MobileNet 模型#

ShuffleNet 模型#

研究方法#

整体实验流程#

数据集介绍#

模型构建与配置#

训练参数与实验环境#

评价指标#

实验与分析#

模型分类性能对比#

模型复杂度对比#

实验结果分析与讨论#

训练过程与收敛性分析#

本章小结#

结 论#

致 谢#

参考文献#

论文作者工作简介#

附 录#

结论#

致谢#

附录#