24小时服务热线
效率高速
品质保障
厂家直供
售后保障
行业新闻
当前位置:行业新闻>

一种用于机群容错的系统和方法专利

发布时间:2026-06-14

【摘要】 本发明公开了一种用于机群容错的系统和方法。该系统包括:检查点服务器,其网络连接到所述多个结点,用于收集并行应用的所有进程的信息,向结点发送监控请求,并响应结点的检查点操作请求,并将检查点文件保存于检查点文件服务器上;在检查点切取操作完成后,执行检查点恢复操作;检查点文件服务器,其网络连接到所述多个结点,用于存储检查点文件,并在进程恢复过程中提供检查点文件访问支持;故障监测模块,位于所述结点上,用于根据所述监控请求来监测本地结点的操作系统的运行状态和所述监控请求指定进程的指定运行状态,以及所述监控请求指定的硬件部件的指定状态,并在监测到故障时向所述检查点服务器发送检查点操作请求。 【专利类型】发明授权 【申请人】中国科学院计算技术研究所 【申请人类型】科研单位 【申请人地址】100080 北京市海淀区中关村科学院南路6号 【申请人地区】中国 【申请人城市】北京市 【申请人区县】海淀区 【申请号】CN200810211566.3 【申请日】2008-09-19 【申请年份】2008 【公开公告号】CN101377750B 【公开公告日】2010-10-06 【公开公告年份】2010 【授权公告号】CN101377750B 【授权公告日】2010-10-06 【授权公告年份】2010.0 【IPC分类号】G06F11/00; G06F11/14 【发明人】霍志刚 【主权项内容】一种用于机群容错的系统,所述机群包括网络连接的多个结点,其特征是,该系统包括:检查点服务器,其网络连接到所述多个结点,用于收集并行应用的所有进程的信息,根据进程信息,向结点发送监控请求,并响应结点的检查点操作请求,执行远程检查点切取操作,并将检查点文件保存于检查点文件服务器上;在检查点切取操作完成后,执行检查点恢复操作;检查点文件服务器,其网络连接到所述多个结点,用于存储检查点文件,并在进程恢复过程中提供检查点文件访问支持;故障监测模块,位于所述结点上,用于根据所述监控请求来监测本地结点的操作系统的运行状态和所述监控请求指定进程的指定运行状态,以及所述监控请求指定的硬件部件的指定状态,并在监测到故障时向所述检查点服务器发送检查点操作请求和向被监测的并行应用的其他进程广播通知该进程正在进行检查点操作。 【当前权利人】中国科学院计算技术研究所 【当前专利权人地址】北京市海淀区中关村科学院南路6号 【统一社会信用代码】12100000400012342E 【被引证次数】1 【被他引次数】1.0 【家族被引证次数】82

  • 【摘要】本发明提供一种触摸设备及其工作方法,该触摸设备包括:包括至少一个触摸点的触摸屏;至少一个弹性腔,固定设置在所述触摸屏的上方,所述至少一个弹性腔在初始状态下具有第一高度;填充驱动装置,与所述至少一个弹性腔中的第一弹性腔连接,所述第一弹
  • 【摘要】一种直接碳燃料电池反应装置,属于直接碳燃料电池技术领域。该反应装置上底座(1) 同轴放入上水冷套(2)中并对连接处焊接密封形成水冷腔体;阳极集流铂网(12)用于从纽 扣式固体氧化物燃料电池(16)阳极上收集电流,阳极集流铂丝(15)
  • 【摘要】本发明公开了一种载波相位自稳定的中红外飞秒激光脉冲产生方法 及装置,该方法具体步骤为:采用一束宽谱的飞秒激光脉冲作为驱动源, 经若干啁啾镜及一对尖劈进行色散补偿后,利用凹面银镜令激光小角度 出射后聚焦到一块非线性晶体中,经过差频效应
  • 【摘要】本发明提出一种更新UE寻呼非连续接收DRX周期的方法,包括以下步骤:移动性管理实体MME接收分组PDN网关发送的用户设备UE的承载服务质量QoS参数;所述MME根据所述承载QoS参数更新所述UE的寻呼DRX周期;所述MME将所述更新
  • 【摘要】一种中、低合金特殊钢的生产方法,包括以下步骤:电炉冶炼,在电炉中 将高炉输送来的铁水加入部分废钢,进行熔化和脱磷;氩氧脱碳炉精炼,将电 炉输送来的钢水进行氧化、还原步骤,该氧化、还原步骤包括脱碳、脱硫、脱 氮、脱氢和脱氧;连铸,将氩
  • 【摘要】本发明公开了下行同步的方法和终端。一种下行同步的方法,包括:接 收网络侧广播的下行同步信号;所述下行同步信号包括长期演进LTE下行同 步信号与LTE-A下行同步信号,以不同的码字进行区分;将本地同步信号与 所接收的下行同步信号进行相