【摘要】 本发明涉及一种融合文本语义和视觉内容的Web人像检索方法,该方法如下:向商业引擎服务器提交“查询串”实现基于HTTP协议的连接和下载功能,下载商业图片引擎的图片结果及相关网页作为本地图像库,同时抽取原始网页的关键标签形成后期文本处理使用的XML文件;采用AdaBoost人脸检测技术,并对包含图片的网页脚本进行向量模型的高层语义挖掘,并使用经验权值和基于PLSA的动态加权方法进行对比;通过一个调节因子,将对图像进行的视觉上和文本上的特征分析结果动态结合,得到图像与查询的相关度排序值,重新排序引擎图像结果列表,并反馈给用户。本方法有更高的查准率,特别是特征融合之后有了大幅度的提高。 【专利类型】发明授权 【申请人】北京交通大学 【申请人类型】学校 【申请人地址】100044 北京市海淀区上园村3号 【申请人地区】中国 【申请人城市】北京市 【申请人区县】海淀区 【申请号】CN200810118253.3 【申请日】2008-08-12 【申请年份】2008 【公开公告号】CN101388022B 【公开公告日】2010-06-09 【公开公告年份】2010 【授权公告号】CN101388022B 【授权公告日】2010-06-09 【授权公告年份】2010.0 【IPC分类号】G06F17/30 【发明人】赵耀; 谢琳; 朱振峰 【主权项内容】 。1.一种融合文本语义和视觉内容的Web人像检索方法,其特征在于:将文本和视觉特征结合运用,该方法其具体步骤如下: 步骤一 网络爬行形成本地图像库 网络爬行向商业引擎服务器提交“查询串”实现基于HTTP协议的连接和下载功能,下载商业图片引擎返回结果中的图片及相关网页作为本地图像库,同时抽取返回结果中的相关网页的关键标签形成后期文本处理使用的XML文件; 步骤二 进行图片内容和文本语义的挖掘 采用AdaBoost人脸检测技术对本地图像库中的图片进行检测,得到指示是否含有人脸的布尔型向量值;由XML文件中的若干语义信息元作为布尔型向量模型中的若干分量组成布尔型文档向量模型,根据布尔型文档向量中的每一个分量模型,得到本地图像库中每一幅图片所对应的语义信息元向量,该语义信息元向量中的每一个分量的布尔值指示“查询串”是否出现在相应的语义信息元中;然后,确定对应于语义信息元向量的权值向量,该权值向量为经验权值向量或者给予PLSA的动态加权方法得到的权值向量; 步骤三 视觉和文本特征的动态融合 为指示是否含有人脸的布尔型向量赋予一个权值向量,将每幅图片的指示是否含有人脸的布尔型向量结合每幅图片的语义信息元向量形成一个融合的布尔型特征向量,将指示是否含有人脸的布尔型向量对应的权值向量结合对应于语义信息元向量的权值向量形成总权值向量,计算特征向量和总权值向量的点积,该点积反映了图片和“查询串”的相关度,根据相关度重新排序商业图片引擎服务器返回结果中的图片,并反馈给用户。 【当前权利人】北京交通大学 【当前专利权人地址】北京市海淀区上园村3号 【统一社会信用代码】1210000040088209X1 【引证次数】3.0 【被引证次数】2 【他引次数】3.0 【被他引次数】2.0 【家族引证次数】3.0 【家族被引证次数】31