【摘要】 本发明提供一种文本训练方法,包括下列步骤:1)计算每类训练样本集的中心向量;2)根据训练样本集的中心向量对所述训练样本集中的样本进行分类;3)对分类不正确的样本,根据设定的拉近权dragweight和推远权pushweight修正所述分类不正确的样本的所属类别A的中心向量或/和被错分到的类别B的中心向量。根据该训练方法所得到的中心向量对文本进行分类不仅精度高,而且速度快。。 (,) 【专利类型】发明申请 【申请人】中国科学院计算技术研究所 【申请人类型】科研单位 【申请人地址】100190 北京市海淀区中关村科学院南路6号 【申请人地区】中国 【申请人城市】北京市 【申请人区县】海淀区 【申请号】CN200810225033.0 【申请日】2008-10-24 【申请年份】2008 【公开公告号】CN101727463A 【公开公告日】2010-06-09 【公开公告年份】2010 【IPC分类号】G06F17/30; G06K9/62 【发明人】谭松波; 许洪波; 程学旗 【主权项内容】一种文本训练方法,包括下列步骤:1)计算每类训练样本集的中心向量;2)根据训练样本集的中心向量对所述训练样本集中的样本进行分类;3)对分类不正确的样本,根据设定的拉近权dragweight和推远权pushweight修正所述分类不正确的样本的所属类别A的中心向量或/和被错分到的类别B的中心向量。 【当前权利人】中国科学院计算技术研究所 【当前专利权人地址】北京市海淀区中关村科学院南路6号 【统一社会信用代码】12100000400012342E 【被引证次数】8 【被自引次数】2.0 【被他引次数】6.0 【家族被引证次数】8