【摘要】 本发明属于计算机软件工程领域,具体涉及一种利用信息检索技术从自然语言描述的需求规约文档自动识别需求之间依赖关系的方法,本发明主要针对自然语言描述的需求文档规约,分析归纳出与需求演化特定的依赖关系类型,同时提出用动识别需求之间的依赖关系的方法。本发明对需求依赖关系的识别进行自动化,大大提高了识别需求依赖关系时的劳动效率和减少了劳动强度,极大的消除了人在识别过程中容易犯的错误,同时对所识别的依赖关系的准确性和稳定性带来极大好处。。 【专利类型】发明授权 【申请人】中国科学院软件研究所 【申请人类型】科研单位 【申请人地址】100190 北京市海淀区中关村南四街4号 【申请人地区】中国 【申请人城市】北京市 【申请人区县】海淀区 【申请号】CN200810117633.5 【申请日】2008-08-01 【申请年份】2008 【公开公告号】CN101334793B 【公开公告日】2010-06-02 【公开公告年份】2010 【授权公告号】CN101334793B 【授权公告日】2010-06-02 【授权公告年份】2010.0 【IPC分类号】G06F17/30; G06F9/44 【发明人】李明树; 王青; 李引; 李娟; 冯东伟 【主权项内容】一种自动识别需求依赖关系的方法,其步骤包括:1)将自然语言描述的需求规约文档转换为规则化描述的XML文档;将所述XML文档对应的数据存储到计算机中;2)计算所述自然语言描述的需求规约文档中的各需求句子对象之间的距离,所述各需求句子对象之间的距离利用欧几里德Distance(Di,Dj)计算,其中,向量表示需求句子对象包含的需求内容文本,文本包含的各个标引词为该向量的各个维度,dij表示标引词j在文本i中的权重其中freq(tj,i)表示在文本i中标引词j出现的次数,文献频率dfj是包含该标引词的文献数与所有文献数n的比值;将所述各需求句子对象聚合成不同的聚合类,所述的将各需求句子对象聚合成不同的聚合类的步骤如下:a)将每个需求句子对象初始化为一个类;b)遍历所有的类,采用层次聚类方法计算类与类之间的距离;c)计算出来类之间的距离小于预设值的距离阈值,合并这两个类;重复步骤b),c)直到所有的类之间的距离都大于阈值;遍历所述聚合类中的每个需求句子对象,找出具有最大相似度比率的需求项,则其他需求项相似依赖于所述具有最大相似度比率的需求项;3)计算所述自然语言描述的需求规约文档中各需求名称对象与需求句子对象之间的短语相似度,所述需求名称对象与需求句子对象之间的短语相似度为其中distance为将查询字符串编辑为相匹配的文本的次数;向量表示需求名称对象和需求句子对象中包含的需求内容文本,文本包含的各个标引词为该向量的各个维度,表示标引词j在文本i中的权重,freq(tj,i)表示标引词j在文本i中出现的次数,文献频率dfj是包含该标引词的文献数与所有文献数n的比值;若短语相似度大于设定阈值,则需求句子对象所属的需求项引用依赖于需求名称对象所属的需求项。F2008101176335C00011.tif, F2008101176335C00012.tif, F2008101176335C00013.tif, F2008101176335C00014.tif, F2008101176335C00015.tif, F2008101176335C00016.tif 【当前权利人】中国科学院软件研究所 【当前专利权人地址】北京市海淀区中关村南四街4号 【统一社会信用代码】121000004000123696 【引证次数】2.0 【被引证次数】5 【他引次数】2.0 【被自引次数】2.0 【被他引次数】3.0 【家族引证次数】2.0 【家族被引证次数】9