(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210884364.5
(22)申请日 2022.07.25
(71)申请人 中国人民解 放军军事科学院军事科
学信息研究中心
地址 100000 北京市海淀区阜成路26号
(72)发明人 薛非 李晓松 李斐 张成鲁
刘宝琪 余翌帆
(74)专利代理 机构 湖北高韬律师事务所 42 240
专利代理师 张承接
(51)Int.Cl.
G06V 10/764(2022.01)
G06V 10/774(2022.01)
G06V 10/80(2022.01)
G06V 10/82(2022.01)
G06V 10/44(2022.01)G06V 10/26(2022.01)
G06T 7/73(2017.01)
G06T 5/10(2006.01)
(54)发明名称
一种基于多块特征滤波网络的图像分类方
法
(57)摘要
本发明提出了一种基于多块特征滤波网络
的图像分类方法, 实现了一个计算效率高的架
构, 它在具有对 数线性复杂 度的频域学习长期空
间依赖性, 本发 明的架构用三个关键操作取代了
视觉transformer中的自注意层: 分别是二维离
散傅里叶变换、 频域特征和可学习全局滤波器 之
间的元素相乘、 以及二维傅里叶反变换; 由于傅
里叶变换用于混合不同标记的信息, 和快速傅里
叶变换算法(FFT)的O(L log L)复杂性, 全局滤
波器比自注意力和MLP更有效。 多块特征滤波网
络在效率、 泛化能力和鲁棒性方面可以成为
transformer模型和CNN的一个非常有竞争力的
替代品。
权利要求书2页 说明书7页 附图2页
CN 115240003 A
2022.10.25
CN 115240003 A
1.一种基于多块特征滤波网络的图像分类方法, 其特征在于, 所述多块特征滤波网络
的图像分类包括以下步骤:
1)图像预处理, 即对图像进行分割, 将图像划分成多个小块, 每个小块都包含了图像的
位置信息, 对每 个小块进行位置编码;
2)提取图像信 息特征, 将每个小块分别输入多个并行的多块特征滤波获得相应的特征
表示; 先对数据集中的图像进行二次分割, 将第一次分割的第i块图像块输入第i个多块特
征滤波网络中, 将输入的第i块空间特征先转换为频域的二 维离散傅里叶变换, 再频率域特
征与全局滤波器之 间的元素相乘, 然后 将特征映射回空间域的二 维傅里叶反变换, 通过FFN
和全局平均池化操作获得第i 块的图像局部特 征;
3)图像特 征融合, 将多个图像块的特 征进行融合, 得到 完整图像的特 征信息表示;
4)图像分类器训练, 在获取了图像整体特征之后, 使用了Linear层对提出到的特征进
行线性转换操作, 并用来训练分类网络, 进 而实现图像的分类。
2.根据权利要求1所述的一种基于多块特征滤波 网络的图像分类方法, 其特征在于, 所
述图像预处 理的具体流 程为:
对数据集的图像进行二次分割:
第一次分割: 将图像I先分割成N个图像块 Ii, i∈{1,. ..,N}, 即将图像进行降维处 理;
第二次分割: 将第i个图像 块Ii进行再次分割, 划分为M个更小的图像 块
提取每个位置所对应的图像块中, 让每 个多块特 征滤波学习到每 个位置中的特有信息 。
3.根据权利要求1所述的一种基于多块特征滤波 网络的图像分类方法, 其特征在于, 所
述提取图像信息特 征具体步骤为:
采用了多个并行的多块特征滤波模型来对图像进行分类任务, 提取图像块信 息特征表
示, 然后将所有的图像块特征进行融合汇成一个完整的图像特征表示, 具体为将给定的
tokens, 即
进行二维的F FT, 转换需要沿着空间维度进行, 转换为:
其中
表示的是 FFT计算, 将一个学习滤波器
乘以B来调制频谱:
其中⊙是按元素计算的乘法; 滤波器P被称为全局滤波器, P与B具有相同的维度; 使用
反FFT将频谱
转换回空间域, 并且 对tokens进行 更新:
根据B[C‑u,D‑v,:]=B*[u,v,:], 即二维实数的共轭对称, 只取B中值的一半, 但同时保
留全部信息:
其中
为实例输入的二维快速傅立叶变换; 将图像进行了二次分割, 即将图像的第一
次分割作, 使用图像块来形成输入Image block; 第二次分割, 在第一次的基础上, 将第一步
中的每一个Image block继续分为n个来形成新的输入Image block, 并将其放入并行计算
的多块特 征滤波网络中; 因此 该输出可以表示 为:权 利 要 求 书 1/2 页
2
CN 115240003 A
2其中fx表示第x个输入图像的特征表示, GFn(·)为第n个并行 的多块特征滤波, 0≤n≤
N‑1, Ii表示了第 一次分割的输入的第i个图像块, 由于在GFn(·)中会对输入的图像块进行
再次分割, 所以此处公式, 并未进行展。
4.根据要求1 ‑3任一所述的一种基于多块特征滤波网络的图像分类方法, 其特征在于,
所述图像分类 器训练具体步骤为:
将提取出来的图像 特征fx输入至Linear层中, 进行分类; 当输入特征被一个Linear层接
收时, 以一个展平成一维张量的形式接收, 然后乘以权重矩阵; 这个矩阵乘法产生输出特
征; 输出的特征也就是该图像在每个类别中的概率; 选取最高的一个概率值对应的类别, 作
为该图像的分类结果。权 利 要 求 书 2/2 页
3
CN 115240003 A
3
专利 一种基于多块特征滤波网络的图像分类方法
文档预览
中文文档
12 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-24 00:40:42上传分享