行业新闻

一种用于开发强化学习系统的框架及方法专利

发布时间:2026-06-21

【摘要】一种用于开发强化学习系统的框架及方法，其特征在于它是由与外部环境交互的学习者接口、表示环境状态的状态接口、系统通过执行部件执行动作的动作接口、基本的测试环境等部分组成框架，然后利用框架开发强化学习系统，其中学习者接口通过状态接口获取环境状态，经过学习更新内部状态并做出决策，调用动作接口作用于环境，同时提供了本研究组提出的新的基于量子理论的多机器人强化学习算法实现作为实例演示。开发人员只需要按照一定步骤实现相应的接口即可完成机器人或其他智能装置学习模块的开发。本发明可移植性高，可以在众多平台运行，可与其他机器人系统框架结合使用，大大降低了学习算法编写的复杂度，方法简单。【专利类型】发明申请【申请人】长春工程学院【申请人类型】学校【申请人地址】130012 吉林省长春市宽平大路395号【申请人地区】中国【申请人城市】长春市【申请人区县】朝阳区【申请号】CN200810051406.7 【申请日】2008-11-12 【申请年份】2008 【公开公告号】CN101739601A 【公开公告日】2010-06-16 【公开公告年份】2010 【授权公告号】CN101739601B 【授权公告日】2013-03-06 【授权公告年份】2013.0 【IPC分类号】G06N1/00; G06N3/00 【发明人】孟祥萍; 谭万禹; 皮玉珍; 苑全德; 纪秀【主权项内容】一种用于开发强化学习系统的框架，其特征在于包括：一个与外部环境交互的学习者接口，是强化学习系统组织其他接口以进行学习和决策的模块；一个表示环境状态的状态接口，该接口提供了映射方法，用来将环境中的状态映射为系统内部状态供获取最优行动提供状态；一个通过执行部件执行动作的动作接口，用于提供获取动作和执行动作方法，分别用来获取当前动作和执行当前动作；一个基本的测试环境，该环境为经典的方格世界，用来设定目标、障碍物和学习智能体的初始位置。【当前权利人】长春工程学院; 国家电网公司国网吉林省电力有限公司长春供电公司【当前专利权人地址】吉林省长春市朝阳区宽平大路395号; 【专利权人类型】公立【统一社会信用代码】12220000E58554358Q 【被引证次数】4 【被他引次数】4.0 【家族引证次数】3.0 【家族被引证次数】4

可切换外设元件的操作状态的电子装置与其方法
【摘要】本发明提供一种电子装置及控制方法，其可感测操作环境以切换外设元件的操作状态。该电子装置包含：多个外设元件；感测装置，用来感测该电子装置的操作环境以产生感测结果；以及控制装置，耦接于该多个外设元件与该感测装置，用来依据该感测结果来判断
MP3播放器(耳机形状1)
【摘要】省略左视图。【专利类型】外观设计【申请人】吉林市航盛宏宇电子有限公司【申请人类型】企业【申请人地址】132013吉林省吉林市高新区深圳街100号【申请人地区】中国【申请人城市】吉林市【申请人区县】丰满区【申请号】CN20083008
去除毛料服装油污的干洗剂
【摘要】本发明公开了一种去除毛料服装油污的干洗剂，它是由下列原料按重量比制成的：苯80-95份、醋酸乙酯5-25份、酒精2-15份、除油一号1-3份。本发明由于采用本人特制的除油一号，与其它原料合理配方，除油效果较好，价格低廉，没有强烈的刺
一种高电导率铝掺杂氧化锌纳米粉体的制备方法
【摘要】本发明提供了一种高电导率铝掺杂氧化锌纳米粉体及其制备方法。具体是利用溶剂热反应制备铝掺杂氧化锌纳米晶体，然后在氢气气氛中烧结，得到了纳米级的类球形导电粉体。该导电粉体呈现白色并略显灰，无毒、质轻、环保、团聚少、分散性和重复性好
一种聚酰亚胺纤维的制备方法
【摘要】本发明涉及一种聚酰亚胺纤维的制备方法。其步骤和条件如下：(1)纺丝所使用的前驱体聚酰胺酸溶液由二胺和二酐单体缩聚而成；(2)聚酰胺酸纤维的制备采用干-湿法纺丝工艺；(3)聚酰胺酸纤维的热亚胺化；(4)聚酰亚胺纤维的热牵伸：温度300
土质固化剂
【摘要】一种土质固化剂，包括主添加剂和助剂，其中主添加剂由甲基硅氧烷、水溶性硅油、三乙醇胺、磺化丙酮的甲醛缩合物、Na2SO4、、木质素与亚硫酸盐的深度磺化物、壬基酚聚氧乙烯醚、山梨醇单月桂酸酯、H2O组成，助剂由氟硅酸镁、硫酸铝、氯化铝中

产品分类

最新文章

一种用于开发强化学习系统的框架及方法专利