一种图像文本视觉问答方法、系统及存储介质

(19)中华人民共和国国家知识产权局
(12)发明专利说明书
(10)申请公布号 CN 114092707 A
(43)申请公布日 2022.02.25
(21)申请号 CN202111368159.5
(22)申请日 2021.11.18
(71)申请人 华中师范大学
    地址 430079 湖北省武汉市洪山区珞喻路152号
(72)发明人 曾江峰 马霄 段尧清 文轩 兰又铭 黄泳潼
(74)专利代理机构 11429 北京中济纬天专利代理有限公司
    代理人 单天禹
(51)Int.CI
      G06V10/42(20220101)
      G06V10/80(20220101)
      G06V20/62(20220101)
      G06V30/19(20220101)
      G06K9/62(20220101)
                                                                  权利要求说明书 说明书 幅图
(54)发明名称
      一种图像文本视觉问答方法、系统及存储介质
(57)摘要
      本发明公开了一种图像文本视觉问答方法、系统及存储介质。所述方法包括:获取目标图像对象和目标问题对象;进行特征提取,获得图像视觉特征、图像文本特征、问题文本特征;将所述图像视觉特征、图像文本特征和所述问题文本特征转化到同一特征空间,对同一维度的图像视觉特征、图像文本特征和问题文本特征进行融合;将编码了跨模态和模态内部关系的图像视觉特征、图像文本特征和问题文本特征输入答案生成模块,获得目标答案。采用本发明所述的方法进行图像文本视觉问答任务,步骤简单、效率高、准确率高。
法律状态
法律状态公告日
法律状态信息
法律状态
2022-02-25
公开
公开
2022-03-15
实质审查的生效IPC(主分类):G06V10/42专利申请号:2021113681595申请日:20211118
实质审查的生效
权 利 要 求 说 明 书
【一种图像文本视觉问答方法、系统及存储介质】的权利说明书内容是......
说  明  书
【一种图像文本视觉问答方法、系统及存储介质】的说明书内容是......

本文发布于:2024-09-24 12:26:04,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/3/421485.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:图像   特征   文本   视觉   方法   说明书
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议