【摘要】 一种基于运动检测结合多通道融合的教师运动跟踪方法,步骤一,语音信号检测;步骤二,原始鼠标设备信号检测;步骤三,视频图像运动人像检测识别;步骤四,融合分析步骤一至三的三个通道检测结果,识别主讲教师所在位置,控制云台转向运动教师,进行变焦予以拉近拉远。步骤五,循环步骤一至步骤四,实时跟踪运动教师。本发明不仅能够被应用于远程教育智能教室中,还能被推广应用于电视会议、可视电话及网络会议中,能够准确实时地采集现场主讲人员的图像,传输给远端参与者,让他们获得一个临场感更强的远程交互体验。。微信 【专利类型】发明授权 【申请人】上海交通大学 【申请人类型】学校 【申请人地址】200240 上海市闵行区东川路800号 【申请人地区】中国 【申请人城市】上海市 【申请人区县】闵行区 【申请号】CN200810200424.7 【申请日】2008-09-25 【申请年份】2008 【公开公告号】CN101394479B 【公开公告日】2010-06-16 【公开公告年份】2010 【授权公告号】CN101394479B 【授权公告日】2010-06-16 【授权公告年份】2010.0 【IPC分类号】H04N5/225; G06T7/20; G09B5/00; G10L11/02 【发明人】郑红; 罗全锋; 陈刚; 申瑞民; 吴元 【主权项内容】一种基于运动检测结合多通道融合的教师运动跟踪方法,其特征在于,包括以下步骤:步骤一,语音信号检测:通过声卡采集音频信号,对输入的音频信号先进行高通滤波,减弱以噪音为主的信号能量,接着对音频信号进行短时处理,计算短段间的平均能量,在静音阈值作用下,判定当前状态为语音状态还是静音状态;步骤二,原始鼠标设备信号检测:通过操作系统的应用程序接口实时监视鼠标动作,如果鼠标有动作,通过检测的对应原始鼠标设备的设备唯一标志号来判断是哪个原始鼠标设备有操作;步骤三,视频图像运动人像检测识别:通过对图像采集卡采集的每一帧图像与混合多高斯背景模型进行背景差分,在自适应阈值作用下,得到二值化差分图,更新混合多高斯背景模型,对二值化差分图像通过腐蚀计算降低分辨率级别,通过连通区域结合运动人像先验知识搜寻运动人像区域,对每个搜寻到的运动人像区域进行色彩特征提取,与前一刻的主讲教师的区域色彩特征进行匹配,找到与主讲教师最匹配的运动人像,更新主讲教师区域色彩特征;步骤四,融合分析步骤一至三的三个通道检测结果,识别主讲教师所在位置,控制云台转向主讲教师,进行变焦予以拉近拉远;步骤五,循环步骤一到步骤四,实时跟踪运动教师。 【当前权利人】上海交通大学 【当前专利权人地址】上海市闵行区东川路800号 【统一社会信用代码】1210000042500615X0 【引证次数】7.0 【自引次数】3.0 【他引次数】4.0 【家族引证次数】7.0 【家族被引证次数】21