24小时服务热线
效率高速
品质保障
厂家直供
售后保障
行业新闻
当前位置:行业新闻>

一种互联网新颖词监测方法专利

发布时间:2026-06-13

【摘要】 本发明公开了一种互联网新颖词监测方法,属于互联网信息挖掘领域。本发明方法包 括下列步骤:根据目标信息源集合,获得其中各个首页及其内部链接所指向的各级下级页 面中当日的所有文章;对各个文章作分词处理,并为各个文章中的每个词语赋予权重,以 权重最大的前a个词语作为该文章的备选新颖词,并以该备选新颖词同时成为多个文章的 备选新颖词时的文章数作为该词当天的频率freq;根据各个备选新颖词在b天内的freq记 录计算各个备选新颖词的新颖系数n;根据新颖系数n确定新颖度θ,当某个备选新颖词的 新颖度大于新颖度阈值θt时,即认为该词语是当天的新颖词。本发明方法可以有效地发现 当天的新颖词汇,指导互联网新信息发现和监管的实践。 【专利类型】发明申请 【申请人】北京大学 【申请人类型】学校 【申请人地址】100871北京市海淀区颐和园路5号 【申请人地区】中国 【申请人城市】北京市 【申请人区县】海淀区 【申请号】CN200810117821.8 【申请日】2008-08-05 【申请年份】2008 【公开公告号】CN101645066A 【公开公告日】2010-02-10 【公开公告年份】2010 【授权公告号】CN101645066B 【授权公告日】2011-08-24 【授权公告年份】2011.0 【发明人】王超; 梁循 【主权项内容】1.一种互联网新颖词监测方法,其特征在于,包括下列步骤: a)根据目标信息源集合,获得其中各个首页及其内部链接所指向的各级下级页面中当日的所有文章; b)对各个文章作分词处理,并为各个文章中的每个词语赋予权重,以权重最大的前a个词语作为该文章的备选新颖词,并以该备选新颖词同时成为多个文章的备选新颖词时的文章数作为该词当天的频率freq; c)根据各个备选新颖词在b天内的freq记录计算各个备选新颖词的新颖系数 其中 ceil表 示上取整函数; d)根据新颖系数n确定新颖度θ,当某个备选新颖词的新颖度大于新颖度阈值θt时,即认为该词语是当天的新颖词。 【当前权利人】北京大学 【当前专利权人地址】北京市海淀区颐和园路5号 【专利权人类型】公立 【统一社会信用代码】12100000400002259P 【被引证次数】TRUE 【家族被引证次数】TRUE

  • 【摘要】一种溴化镧铈闪烁晶体的制备方法,其特点是:在配置溴化镧铈晶体生长原料时掺入了其它离子(加固剂)以增大晶体的抗裂强度,这种加固剂离子可以是三价离子,也可以是二价或四价离子;晶体采用特制悬挂石英坩埚下降法生长。本发明由于加固剂离子的位错
  • 【摘要】不确定环境中网络服务评价和优选方法,属于网络服务应用技术领域,其特征在于,在服务器端设定一个网络服务描述文档,用测试用例生成器依据网络服务描述文档产生测试用例集,而候选服务发现器根据网络服务描述文档提供候选服务集;可信度测量模块根据
  • 【摘要】本发明提出了一种插播音频文件的播放装置和方法,其中,根据本发明的插播音频文件的播放装置包括:播放模块,用于对媒体文件执行媒体播放操作;插播控制模块,用于触发插播事件,并获取待插播的音频文件;以及媒体文件缓存模块,用于在插播所获取的音
  • 【摘要】本发明提供了一种计算机的温控方法及计算机,该方法包括:计算机开机 后,按照预先设置的CPU温度与风扇转速之间的第一对应关系,将风扇转速 调整为与第一当前CPU温度对应的风扇转速;定时检测除CPU温度外的预定 发热元件和或预定区域的温
  • 【摘要】本发明公开了一种FPGA电路故障检测装置,其包括输入信号编码器,输出信号解码器,至少一故障探针,以及故障定位器。其中:所述输入信号编码器,用于对输入信号进行时间冗余编码;输出信号解码器,用于使被测FPGA电路输出正确结果;故障探针,
  • 【摘要】本发明提供一种实现信号预失真处理的方法,包括:利用反馈信号更新预失真参数;采用更新后的预失真参数对原始信号进行预失真处理。本发明还提供一种实现信号预失真处理的装置。采用本发明的方法和装置,通过对修正后的反馈信号和中频信号组成的矩阵基