【摘要】 本发明公开了一种讨论区集合中热点讨论区的预测方法,属于互联网信息挖掘领域, 其包括下列步骤:针对目标讨论区集合,确定待预测的时间窗口Wi+1;获得目标讨论区集 合内的各个讨论区在时间窗口Wi-1和时间窗口Wi内的特征向量,所述特征向量由显示讨 论区受程度的多个属性组成;在Wi内,以各个讨论区的特征向量作为数据对象对各 个讨论区进行聚类分析,并以得到的一个或多个类中心作为Wi内的热点讨论区;以各个 讨论区在Wi-1内的特征向量作为输入并以Wi内的热点讨论区作为输出进行SVM学习;以 各个讨论区在Wi内的特征向量作为上述学习后的SVM的输入,输出目标讨论区集合在 Wi+1内的热点讨论区。本发明实现了讨论区集合中热点讨论区的预测,具有较好的应用前 景。 (,) 【专利类型】发明申请 【申请人】北京大学 【申请人类型】学校 【申请人地址】100871北京市海淀区颐和园路5号 【申请人地区】中国 【申请人城市】北京市 【申请人区县】海淀区 【申请号】CN200810117822.2 【申请日】2008-08-05 【申请年份】2008 【公开公告号】CN101645067A 【公开公告日】2010-02-10 【公开公告年份】2010 【发明人】李楠; 梁循 【主权项内容】1.一种讨论区集合中热点讨论区的预测方法,其特征在于,包括下列步骤: a)针对目标讨论区集合,确定待预测的时间窗口Wi+1; b)获得目标讨论区集合内的各个讨论区在时间窗口Wi-1和时间窗口Wi内的特征向 量,所述特征向量由显示讨论区受程度的多个属性组成,其中,Wi在时间上介于Wi-1 和Wi+1之间; c)在Wi内,以各个讨论区的特征向量作为数据对象对各个讨论区进行聚类分析, 并以得到的一个或多个类中心作为Wi内的热点讨论区; d)以各个讨论区在Wi-1内的特征向量作为输入并以Wi内的热点讨论区作为输出进 行SVM学习; e)以各个讨论区在Wi内的特征向量作为上述学习后的SVM的输入,输出目标讨论 区集合在Wi+1内的热点讨论区。 【当前权利人】北京大学 【当前专利权人地址】北京市海淀区颐和园路5号 【专利权人类型】公立 【统一社会信用代码】12100000400002259P 【被引证次数】TRUE 【家族被引证次数】TRUE