【摘要】 本发明公开了一种敏感词校对的方法及系统,为了解决现有技术中敏感词校对的准确率比较低的问题,本发明公开的方法包括:通过组成敏感词的字的内码,及内码和字的拼音字母组成信息的对应关系,确定敏感词拼音字母组成信息;从被校对文本中获取被校对词,通过组成被校对词的汉字内码,及内码和字的拼音字母组成信息的对应关系,确定被校对词拼音字母组成信息;若被校对词与敏感词,彼此之间的拼音字母组成信息相同,则确定被校对词为敏感词,因此通过语音校对,使得敏感词的变形词可以被校对出来,提高了敏感词的校对准确率。 【专利类型】发明申请 【申请人】北大方正集团有限公司; 北京北大方正电子有限公司 【申请人类型】企业 【申请人地址】100871 北京市海淀区成府路298号中关村方正大厦9层 【申请人地区】中国 【申请人城市】北京市 【申请人区县】海淀区 【申请号】CN200810224894.7 【申请日】2008-10-24 【申请年份】2008 【公开公告号】CN101727440A 【公开公告日】2010-06-09 【公开公告年份】2010 【IPC分类号】G06F17/27 【发明人】李少明; 陈志雄; 朱建波 【主权项内容】一种敏感词校对的方法,其特征在于,包括:通过组成敏感词的字的内码,及内码和字的拼音字母组成信息的对应关系,确定敏感词拼音字母组成信息;从被校对文本中获取被校对词,通过组成被校对词的字的内码,及内码和字的拼音字母组成信息的对应关系,确定被校对词拼音字母组成信息;被校对词与敏感词,彼此之间的拼音字母组成信息相同时,确定被校对词为敏感词。 【当前权利人】北大方正集团有限公司; 北京北大方正电子有限公司 【当前专利权人地址】北京市海淀区成府路298号中关村方正大厦9层; 北京市海淀区上地五街九号 【专利权人类型】其他有限责任公司; 有限责任公司(台港澳法人独资) 【统一社会信用代码】91110108101974963M; 9111010860004164XH 【被引证次数】10 【被自引次数】2.0 【被他引次数】8.0 【家族被引证次数】10