【摘要】 本发明公开了一种基于扩展熵信息瓶颈理论的聚类方法,主要是针对数据挖掘中无监督聚 类问题,当聚类数组之间关系复杂而又无法用统计概率描述的数组集合聚类问题,该方法既 可以体现数组之间复杂的相关性,又可以体现数组对应位置之间的对应关系,而且该聚类方 法可以提供一个客观的聚类截尾准则,有效避免由主观指定聚类个数的缺陷。该聚类方法可 以广泛应用于医学、智能交通、模式识别等领域的聚类问题。 【专利类型】发明申请 【申请人】山东省计算中心 【申请人类型】科研单位 【申请人地址】250014山东省济南市科院路19号 【申请人地区】中国 【申请人城市】济南市 【申请人区县】历下区 【申请号】CN200810139542.1 【申请日】2008-08-22 【申请年份】2008 【公开公告号】CN101655847A 【公开公告日】2010-02-24 【公开公告年份】2010 【授权公告号】CN101655847B 【授权公告日】2011-12-28 【授权公告年份】2011.0 【发明人】孙占全 【主权项内容】1、一种基于扩展熵信息瓶颈理论的聚类方法,其特征在于,包括步骤: 根据样本确定聚类数组及数组的取值,计算每个取值的比值; 用比值代替概率计算聚类数组的扩展熵; 确定数组合并后联合扩展熵的计算形式; 根据信息瓶颈理论选择信息损失量最小的聚类数组进行合并,生成一个新的数组; 以聚类产生的信息损失量变化率作为确定聚类结束的标准,即获得最终的聚类结果。 【当前权利人】山东省计算中心 【当前专利权人地址】山东省济南市科院路19号 【被引证次数】TRUE 【家族被引证次数】TRUE