刘莉:2014年北京大学计算机行为科学暑期讨论班心得
发布时间:2014-10-23   浏览次数:48

2014年北京大学计算机行为科学暑期讨论班心得

 

今年7月份,我参加了由北京大学信息科学技术学院主办的计算行为暑期培训,此次培训邀请了国内外行为科学领域的众多专家做报告,给了我们一次难忘的体验,培训内容主要如下:

日本大阪大学的Yagi教授作了报告“人的动作感知及行为分析”,内容主要包括行人检测、人的跟踪与分割、步态分析。主要介绍了基于时空HOG的行人检测,从一副图片中抽取HOG特征,此方法具有对光照变化的鲁棒性、对变形的鲁棒性等优点;关于人的跟踪与分割,在不受控制的环境中,视频序列中的物体跟踪是极具挑战性的,当背景和前景存在很多变化(如遮挡),跟踪算法必须有效估计目标状态。报告采用了局部和协方差匹配相互转换的跟踪算法,以及基于时空形状约束的人类分割;步态(gait)分析主要是分析步态中的个人特征、性别和年龄,步态个人特征包括不对称性,步幅,摆臂,弯腰,从步态个人特征中识别出人,与世界最大的步态数据OU-LP进行比较来验证,不同年龄估计的准确率不一样,步态越稳定识别率越高。

中国科学院自动化研究所模式识别国家重点实验室陶建华教授作了“自然人机交互中的情感计算”的报告,报告主要内容如下:(1)什么是情感计算:情感计算的目的是通过赋予计算机识别、理解、表达和适应人的情感的能力来建立和谐人机环境,并使计算机具有更高的、全面的智能。简单介绍了情感计算的国内外各个机构的研究现状和主要研究方向,引入了一些经典的机器人案例,如索尼公司的AIBO狗,是第一个实现规模商品化的宠物机器人,对外界刺激有反应能力,包括语言、面部表情等;机器人pepper;合肥工业大学机器人等。(2)情感计算研究内容:情感计算的研究可分为4步,信号获取(通过传感器直接或间接与人接触获得情感信息,如可穿戴计算机),分析识别(通过建模对情感信息进行分析与识别),情感理解(对分析结果进行推理达到感性的理解),情感表达(将理解结果通过合理的方式表达出来)。其中情感识别需要对情感机理的研究(情感状态的判断及与生理和行为之间的关系)作为理论基础。(3)情感识别方法:基于不同情感特征的情感识别,一是情感行为识别(语音、面部表情、姿态),二是生理模式识别(皮肤电、呼吸、心率、体温、脑电波等)。着重介绍了语音情感识别,涉及情感语音数据库,一些语音参数(语速、音量、音调等);介绍了面部表情识别方法,涉及几何特征(33个)、局部区域特征、纹理特征等;最后介绍了多模态融合的情感识别,即结合语音、表情、姿态识别情感。

华盛顿大学的心理学教授Dr.Wendy Stone 作了“儿童孤独症早期诊断与干预”,报告内容为:(1)孤独症的概念:是一种复杂的神经发育障碍,在症状表现上以极端的异质性为特征。孤独症已是一种常见流行的疾病,而且逐年增长。关于孤独症的病因,没有任何一个确定的原因,遗传因素,也可能是基因和环境共同的影响,关于孤独症的治疗,早期诊断和干预是关键,方法集中在通过教育性和行为性的方法。(2)孤独症的诊断:主要是基于行为特征的诊断,诊断准则参见DSM-5,一是从社会交往,社会互动障碍(社会情感互惠,非语言交流,发展和保持关系的赤字),二是受限制,重复的行为,兴趣和活动模式(呆板、重复的讲话,移动)。(3)孤独症的早期确诊:机遇与挑战,早期诊断对孤独症的治疗非常关键,面临的挑战主要有小孩子的增长的行为变化,和其他疾病重复性的症状等。(4)计算机行为科学对早期孤独症的检测的可能的贡献:社交眼神注视是社交互动的重要的一部分,怎么通过测量眼神注视来确定可能患孤独症的孩子,可以通过眼动追踪设备,POV摄像机等。(5)孤独症的治疗:主要通过引导、激发兴趣、可视化的训练(如进行某一游戏、活动),通常都是长期的,一个关键问题是,哪种方法对哪种孩子是最有效的。

美国伦斯勒理工学院(RPI)智能系统实验室(ISL)纪强教授作了“面部表情的自动处理、分析、识别”的报告,报告内容:(1)多视角的面部检测和跟踪:即决定图片中脸部的位置和范围,特征提取和分类器设计是两个关键问题,特征主要有整体强度、皮肤纹理、边缘等,分类器有SVMadaboostnaive bayesian classifier。比较了FDANDARNDA三种判别分析方法,其中RNDA是最有效的,面部跟踪方法主要采用collaborative trackingcase based trackingsimultaneous face clustering and tracking,并给出了一些demos。(2)面部特征点检测和跟踪:即自动检测面部标志点,一共有28个点,比如眼睛需要三个点,鼻子两个点,面临的挑战有面部表情的变化,面部姿态变化,提出结合脸形模型和局部点检测,进一步得到一个层次多模态面部特征点检测模型。(3)面部表情分析、识别:利用FACS(面部动作编码系统)进行面部活动的识别,包括六种基本表情(惊讶、高兴、悲伤、生气、害怕、厌恶),基于FACS,提出了通过动态贝叶斯网络对脸部表情、动作单元与脸部特征点间的关系进行建模。(4)眼睛检测和跟踪:眼睛检测是面部识别的重要部分,提出基于SVM的眼部检测,以及融合mean-shift和基于亮瞳的卡尔曼滤波的眼部跟踪(5)眼部视线跟踪:在建立眼部视线和眼部模型的基础上,介绍了基于特征的视线估计(基于2D视线回归、基于3D模型的视线估计),还包括基于头部姿态的方法、基于虹膜、基于眼角的方法等。

通过这次培训,有以下几点感想:

计算机行为科学的意义和前景:计算行为科学是与计算机视觉、机器学习、传感器技术与发展心理学、临床医学、认知心理学等多学科相关的交叉性学科。该学科作为国际上新兴的学科,其研究目标是使用先进的传感器技术、计算机视觉技术以及机器学习等知识与方法,解决发展心理学与临床医学中的重要问题,例如孤独症的早期自动诊断,儿童社交退缩、社交焦虑等行为障碍的早期发现与评估等,具有潜在而深远的社会影响力。通过此次学习,意识到计算机行为科学的重大意义与前景。

计算机专业与心理学专业的合作:参加这次培训的成员主要来自计算机和心理学两个大学科,而各个做报告的老师,他们的研究也涉及了用计算机技术来进行心理方面、行为的研究,如孤独症。对于计算机专业和心理学专业的学者而言,进行计算机行为科学领域的合作,是一个很好的契机,心理学的研究方法和测量基本上都是采用人工、观察的方法,效率低,费时费力,如果能够和计算机专业的学者合作,通过更智能的计算机技术来进行更有效率的研究,将有助于研究的高效进行。这对于我院计算机专业的老师,也是一个新的研究方向和契机。

对我院的科研:我院包括计算机和数学两个大类,而这两个专业在科研上可以很好的结合和合作,要想写出高质量的论文,做好科研,离不开数学,离不开算法,在这次暑期培训中,许多做计算机视觉的老师,采用了SVMEMadaboost、朴素贝叶斯、K-means等算法,因此,在科研上,我院的计算机老师和数学老师可以携手共进,共创未来。对自身来说,也应该积极的学习一些算法,与数学系老师加强联系,交流,合作共赢