说明:收录25万 73个行业的国家标准 支持批量下载
文库搜索
切换导航
文件分类
频道
联系我们
问题反馈
文件分类
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210781046.6 (22)申请日 2022.07.05 (71)申请人 人民中科 (北京) 智能技 术有限公司 地址 100176 北京市大兴区北京经济技 术 开发区科谷一街8号院8号楼14层1401 (北京自贸试验区高端产业片区亦庄 组团) (72)发明人 阮晓峰 王坚 李兵 余昊楠 胡卫明 (74)专利代理 机构 北京万思博知识产权代理有 限公司 1 1694 专利代理师 刘冀 (51)Int.Cl. G06F 16/903(2019.01) G06V 10/74(2022.01)G06V 10/80(2022.01) G06K 9/62(2022.01) (54)发明名称 一种跨模态检索方法、 装置以及存 储介质 (57)摘要 本申请公开了一种跨模态检索方法、 装置以 及存储介质。 其中, 跨模态检索方法包括: 接收检 索数据, 并确定检索数据的模态; 将检索数据输 入至具有至少两个特征提取单元的特征提取模 型, 并通过与检索数据的模态对应的特征提取单 元提取检索数据的特征表示向量; 根据特征表示 向量对索引库进行遍历, 查询出与检索数据相关 的多个候选检索结果; 以及将检索数据与候选检 索结果输入至具有多模态融合特征提取单元的 相似度计算模型, 进行相似度计算, 根据相似度 对候选检索结果进行排序。 权利要求书2页 说明书16页 附图5页 CN 114861016 A 2022.08.05 CN 114861016 A 1.一种跨模态检索方法, 其特 征在于, 包括: 接收检索数据, 并确定所述检索数据的模态; 将所述检索数据输入至具有至少两个特征提取单元的特征提取模型, 并通过与所述检 索数据的模态对应的特 征提取单元提取所述检索数据的特 征表示向量; 根据所述特征表示向量对索引库进行遍历, 查询出与 所述检索数据相关的多个候选检 索结果; 以及 将所述检索数据与候选检索结果输入至具有多模态融合特征提取单元的相似度计算 模型, 进行相似度计算, 根据相似度对候选检索结果进行排序。 2.根据权利要求1所述的方法, 其特征在于, 所述特征提取模型包括文本特征提取单元 和图像特征提取单元, 并且通过与所述检索数据的模态对应的特征提取单元提取所述检索 数据的特 征表示向量的操作, 包括: 在所述检索数据为文本检索数据的情况下, 利用所述文本特征提取单元确定与所述文 本检索数据对应的特 征表示向量; 以及 在所述检索数据为图像检索数据或视频检索数据的情况下, 利用图像特征提取单元确 定与所述图像 检索数据或所述视频检索数据对应的特 征表示向量。 3.根据权利要求2所述的方法, 其特征在于, 还包括通过以下操作对所述特征提取模型 进行训练: 创建用于训练所述特征提取模型的训练样本集, 其中所述训练样本集的每个训练样本 包括配对的文本数据以及图像数据; 将所述训练样本的文本数据输入所述文本特征提取单元, 并将所述训练样本的图像数 据输入所述图像特 征提取单元; 以及 根据所述文本特征提取单元的输出结果与所述图像特征提取单元的输出结果之间的 互信息对所述特 征提取模型进行训练。 4.根据权利要求2所述的方法, 其特征在于, 利用所述文本特征提取单元确定与所述文 本检索数据对应的特 征表示向量的操作, 包括: 将所述文本检索数据输入所述文本特 征提取单元; 获取所述文本特 征提取单元的多个特 征提取层的输出 特征; 以及 对所述多个特征提取层的输出特征进行加权求和, 得到与所述文本检索数据对应的特 征表示向量。 5.根据权利要求2所述的方法, 其特征在于, 利用所述图像特征提取单元确定与所述图 像检索数据或所述视频检索数据对应的特 征表示向量的操作, 包括: 将所述图像 检索数据或所述视频检索数据输入所述图像特 征提取单元; 获取所述图像特 征提取单元的多个特 征提取层的输出 特征; 以及 对所述多个特征提取层的输出特征进行加权求和, 得到与所述图像检索数据或所述视 频检索数据对应的特 征表示向量。 6.根据权利要求1所述的方法, 其特征在于, 根据所述特征表示向量对索引库进行遍 历, 查询出与所述检索数据相关的多个候选检索结果的操作, 包括: 根据所述特征表示向量对索引库进行遍历, 查询与所述特征表示向量的相关度由高至 低排列的预定数量个候选特征表示向量, 并获取所述候选特征表示向量对应的候选检索结权 利 要 求 书 1/2 页 2 CN 114861016 A 2果。 7.根据权利要求6所述的方法, 其特征在于, 还包括通过以下操作对所述相似度计算模 型进行训练: 创建用于对所述相似度计算模型进行训练 的训练样本集, 所述训练样本集的每个训练 样本包括配对的文本数据和图像数据; 对所述配对的文本数据和图像数据之间的相似度进行 标注; 将所述配对的文本数据和图像数据输入所述相似度计算模型; 以及 根据所标注的相似度和所述相似度计算模型所计算的相似度, 对所述相似度计算模型 进行训练。 8.一种存储介质, 其特征在于, 所述存储介质包括存储的程序, 其中, 在所述程序运行 时由处理器执行权利要求1至7中任意 一项所述的方法。 9.一种跨模态检索装置, 其特 征在于, 包括: 检索数据接收模块, 用于 接收检索数据, 并确定所述检索数据的模态; 特征提取模块, 用于将所述检索数据输入至具有至少两个特征提取单元的特征提取模 型, 并通过与所述检索数据的模态对应的特征提取单元提取所述检索数据 的特征表示向 量; 查询模块, 用于根据所述特征表示向量对索引库进行遍历, 查询出与所述检索数据相 关的多个候选检索结果; 以及 排序显示模块, 用于将所述检索数据与候选检索结果输入至具有多模态融合特征提取 单元的相似度计算模型, 进行相似度计算, 根据相似度对候选检索结果进行排序。 10.一种跨模态检索装置, 其特 征在于, 包括: 处理器; 以及 存储器, 与所述处 理器连接, 用于为所述处 理器提供处 理以下处 理步骤的指令: 接收检索数据, 并确定所述检索数据的模态; 将所述检索数据输入至具有至少两个特征提取单元的特征提取模型, 并通过与所述检 索数据的模态对应的特 征提取单元提取所述检索数据的特 征表示向量; 根据所述特征表示向量对索引库进行遍历, 查询出与 所述检索数据相关的多个候选检 索结果; 以及 将所述检索数据与候选检索结果输入至具有多模态融合特征提取单元的相似度计算 模型, 进行相似度计算, 根据相似度对候选检索结果进行排序。权 利 要 求 书 2/2 页 3 CN 114861016 A 3
专利 一种跨模态检索方法、装置以及存储介质
文档预览
中文文档
24 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共24页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 SC 于
2024-02-18 22:28:55
上传分享
举报
下载
原文档
(693.6 KB)
分享
友情链接
GB-T 17964-2021 信息安全技术 分组密码算法的工作模式.pdf
JR-T 0071.1—2020 金融行业网络安全等级保护实施指引 第1部分:基础和术语.pdf
GB/T 15055-2021 冲压件未注公差尺寸极限偏差.pdf
GB-T 39772.1-2021 北斗地基增强系统基准站建设和验收技术规范 第1部分:建设规范.pdf
GB-T 7002-2008 投光照明灯具光度测试.pdf
DB52-T 1541.7-2021 政务数据平台 第7部分:运维管理规范 贵州省.pdf
DB43-T 2746-2023 特种设备使用单位安全风险评估和管控导则 湖南省.pdf
DB45-T 2048-2019 微型消防站建设管理规范 广西壮族自治区.pdf
GB-T 15920-2010 海洋学术语 物理海洋学.pdf
ISO 27002 2022 中文试译交流版.pdf
GB-T 33563-2017 信息安全技术 无线局域网客户端安全技术要求(评估保障级2级增强).pdf
法律法规 重庆市科技创新促进条例2021-11-25.pdf
GB-T 20032-2005 项目风险管理 应用指南.pdf
GB-T 41580-2022 核与辐射应急响应人员的照射控制.pdf
华商国际 数字化建筑设计研究中心-冷链物流园区规划、建设及运营的数字化发展趋势.pdf
GB-T 23938-2021 高纯二氧化碳.pdf
GB-T 3409.2-2016 大坝监测仪器 钢筋计 第2部分:振弦式钢筋计.pdf
GB-T 32541-2016 热处理质量控制体系.pdf
GB-T 19667.1-2005 基于XML的电子公文格式规范 第1部分总则.pdf
T-ZZB 2928—2022 锥形磨浆机.pdf
交流群
-->
1
/
24
评价文档
赞助2元 点击下载(693.6 KB)
回到顶部
×
微信扫码支付
2
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。