【摘要】 本发明公开了一种地图信息处理的方法,包括:将同一网页锚文本集合中的多个元素两两配对,得到匹配对;去除锚文本集合中的行政区划名称;根据所述匹配对的相似度,选择候选全简称匹配对;利用分词去除所述候选全简称匹配对中存在的前、后缀后,将通过预设阈值条件筛选的匹配对输出。还公开了一种地图信息处理的装置和系统。利用本发明可以自动建立全称与简称的匹配关系,充分利用已有的兴趣点数据,提高的匹配效率和用户体验度。 【专利类型】发明授权 【申请人】北京搜狗科技发展有限公司 【申请人类型】企业 【申请人地址】100084 北京市海淀区中关村东路1号院9号楼搜狐网络大厦9层01房间 【申请人地区】中国 【申请人城市】北京市 【申请人区县】海淀区 【申请号】CN200810114464.X 【申请日】2008-06-06 【申请年份】2008 【公开公告号】CN101299217B 【公开公告日】2010-09-08 【公开公告年份】2010 【授权公告号】CN101299217B 【授权公告日】2010-09-08 【授权公告年份】2010.0 【IPC分类号】G06F17/30 【发明人】刘珊瑞; 张阔; 茹立云 【主权项内容】一种地图信息处理的方法,其特征在于,包括:将同一网页锚文本集合中的多个元素两两配对,得到匹配对的集合;所述同一网页锚文本集合为指向同一网页的多个超链接对应的锚文本组成的集合;去除锚文本集合中出现在锚文本头部的行政区划名称;根据所述匹配对集合中各匹配对的相似度,获取相似度的值大于预置阈值的匹配对构成候选全简称匹配对集合;利用分词去除所述候选全简称匹配对中存在的前缀和/或后缀后,将通过正确性筛选的匹配对输出。。 【当前权利人】北京搜狗科技发展有限公司 【当前专利权人地址】北京市海淀区中关村东路1号院9号楼搜狐网络大厦9层01房间 【专利权人类型】有限责任公司(台港澳法人独资) 【统一社会信用代码】911101087839553124 【家族被引证次数】25