行业新闻

文本集合可视化系统专利

发布时间:2026-06-07

【摘要】一种计算机应用技术领域的文本集合可视化系统，包括：文本采集模块、中文分词模块、词语权重计算模块、XML文件组织模块、可视化图形界面模块，先通过文本采集模块、中文分词模块、特征词权重计算模块和XML文件组织模块构成本地数据库，然后通过可视化图形界面模块与本地数据库的接口交互，对用户的检索关键词图形化地显示结果。显示结果的呈现应用本发明提供的文档与多个关键词关联程度的可视化方式，并且向用户提供可在图形界面上拖曳关键词的交互操作来拓展定义关键词之间的语义关系，得到更好的效果。【专利类型】发明授权【申请人】上海交通大学【申请人类型】学校【申请人地址】200240上海市闵行区东川路800号【申请人地区】中国【申请人城市】上海市【申请人区县】闵行区【申请号】CN200810040145.9 【申请日】2008-07-03 【申请年份】2008 【公开公告号】CN100595762C 【公开公告日】2010-03-24 【公开公告年份】2010 【授权公告号】CN100595762C 【授权公告日】2010-03-24 【授权公告年份】2010.0 【IPC分类号】G06F17/30; G06F17/27 【发明人】马颖华; 苏贵洋; 李建华; 冯薇; 李文婷【主权项内容】1、一种文本集合可视化系统，其特征在于，包括：文本采集模块、中文分词模块、词语权重计算模块、XML文件组织模块、可视化图形界面模块，其中：文本采集模块在互联网上搜集网页文本，将采集到的文本作为原始数据源传入中文分词模块；中文分词模块，对文本采集模块中得到的文本内容进行分词处理，获得以词为单位的语料，并统计词频，保存在本地文本，供后续的词语权重计算模块读取词频信息计算权重；词语权重计算模块，用于对分词后的结果进行特征抽取即特征词权重的计算，将计算结果连同对应的特征词，以及所在文本的标题交给XML文件组织模块； XML文件组织模块负责将词语权重计算模块传入的数据以设定的数据结构组织成XML文件保留在本地计算机，并为可视化图形界面模块提供读取文本数据结构化处理后的结果；可视化图形界面模块以上述XML文件组织模块保留在本地的结果数据为基本语料库，通过与用户的交互取得用户命令，并显示出结果；所述的文本采集模块，包括：下载子模块和存储子模块，其中：下载子模块首先从设定的根网址开始，根据根网址上提供的网页链接，进行设定层数的网页源文件抓取，同时剔除html标记和脚本代码，得到最初的文本内容，然后该模块调用存储子模块，将文本保存在设定的本地目录下，在每个文本保存前，首先判断在同一目录下是否存在与该文本相同的文本，若存在，则对该文本不进行保存；当采集工作结束后，调用所述的中文分词模块对上面保存的最初文本内容进行分词工作；所述的中文分词模块对采集到的大量中文文本进行分词，并去掉停止词，使之成为独立的特征词，并得到每个词语在每篇文章中的出现的频率，交给词语权重计算模块，所述停止词是指：介词或语气助词。。【当前权利人】上海交通大学【当前专利权人地址】上海市闵行区东川路800号【统一社会信用代码】1210000042500615X0 【引证次数】5.0 【他引次数】5.0 【家族引证次数】5.0 【家族被引证次数】27

可移动的笔记本电脑托架装置
【摘要】本发明公开了一种可移动的笔记本电脑托架装置，包括底板、与底板活动连接的托架本体，以及安装于底板底部的支承万向轮，还包括设置于底板上的驱动机构以及与驱动机构相连接的、用于实现对驱动机构控制的控制器。通过控制器中的单片机对驱动机构中电机
一种RFID设备数据加密传输的方法
【摘要】本发明涉及一种RFID设备数据加密传输的方法，是一种无线数据的加密传输方法，是一种用于集装箱所使用的RFID设备的数据进行加密传输的方法。所述方法使用：读写器、与读写器连接的计算机、电子标签，本方法的步骤包括：加密过程：加密过程分级
一种气藏开发动态物理模拟方法及其装置
【摘要】本发明是再现开发过程压力、产量变化规律的气藏开发动态物理模拟方法及其装置，采集气井单井岩心并制取气藏天然岩心，根据已知气井单井控制储层由近井到远井储层的渗透率、孔隙度特征排列岩心，记录岩心不同位置点的压力、流量、累计流量，绘出
后扩底钻头(切)
【专利类型】外观设计【申请人】刘杰萍【申请人类型】个人【申请人地址】100075北京市丰台区大红门南里13号3门403【申请人地区】中国【申请人城市】北京市【申请人区县】丰台区【申请号】CN200830132934.6【申请日】2008-1
匹多莫德精氨酸盐及其制剂
【摘要】本发明公开了一种匹多莫德精氨酸盐及其制剂，它用于治疗①反复发作的上下呼吸道感染(咽炎、气管炎、支气管炎、扁桃体炎)；②耳鼻喉科反复感染(鼻炎、鼻窦炎、耳炎)；③泌尿系统感染；④妇科感染；⑤化疗后细胞免疫功能低下的临床患者；⑥特异性和
一种复方盐酸二甲双胍罗格列酮的缓释制剂及其制备方法
【摘要】本发明涉及一种复方盐酸二甲双胍罗格列酮的缓释制剂及其制备方法。其中罗格列酮、盐酸二甲双胍在体外溶出试验中均呈缓慢释放特性，罗格列酮第1小时释放10-30％，第4 小时释放60-80％，第8小时释放80％以上；盐酸二甲双胍第1小时释

产品分类

最新文章

文本集合可视化系统专利