【摘要】 本发明公开了一种识别假冒网页的方法及系统,该方法包括以下步骤:步骤1,针对一给定网页,构造与该给定网页具备关联关系的寄生网页社区;步骤2,逐个计算该给定网页相对该寄生网页社区中的每个网页的寄生因数,根据每个网页的寄生因数,判断该给定网页与寄生网页社区中的网页是否存在假冒关系。本发明实现的效果在于,根据给定的网页,识别出其是否为一假冒网页,识别出与该给定网页存在假冒关系的网页,即,该假冒网页所模仿的真实网站的网页,避免冒然提交个人数据而造成相关财产、隐私等权益的损失。同时,本发明的识别方法准确率高,操作方便。 【专利类型】发明授权 【申请人】北京百问百答网络技术有限公司 【申请人类型】企业 【申请人地址】100872 北京市海淀区中关村大街59号文化大厦1207F室 【申请人地区】中国 【申请人城市】北京市 【申请人区县】海淀区 【申请号】CN200810239735.4 【申请日】2008-12-16 【申请年份】2008 【公开公告号】CN101436210B 【公开公告日】2010-08-18 【公开公告年份】2010 【授权公告号】CN101436210B 【授权公告日】2010-08-18 【授权公告年份】2010.0 【IPC分类号】G06F17/30 【发明人】刘文印; 邱彼特; 刘罡; 张加龙 【主权项内容】一种识别假冒网页的方法,其特征在于,包括以下步骤:步骤1,针对一给定网页,构造与该给定网页具备关联关系的寄生网页社区;步骤2,逐个计算该给定网页相对该寄生网页社区中的每个网页的寄生因数,根据每个网页的寄生因数,判断该给定网页与寄生网页社区中的网页是否存在假冒关系;其中,该步骤1包括:步骤11,建立该给定网页的初始关联网页集,该初始关联网页集包括与该给定网页直接关联和/或间接关联的网页;步骤12,根据该初始关联网页集,进一步获取与初始关联网页具备关联关系的网页,并根据该网页间的关系构建网络图;步骤13,利用分割算法对该网络图进行分割,以得到与该给定网页具备紧密关联关系的寄生网页社区。 【当前权利人】刘文印 【引证次数】2.0 【他引次数】2.0 【家族引证次数】2.0 【家族被引证次数】4