蒲慕明脑科学 蒲慕明 | 脑科学与类脑研究概述
《国家中长期科学和技术发展规划纲要(2006—2020)》对脑科学与认知科学研究做了战略规划:“脑功能的细胞和分子机理,脑重大疾病的发生发展机理,脑发育、可塑性与人类智力的关系,学习记忆和思维等脑高级认知功能的过程及其神经基础,脑信息表达与脑式信息处理系统,人脑与计算机对话等。
”近年来,脑科学在基础研究和应用方面酝酿着历史性的重大突破,发达国家纷纷推出大型脑研究计划;我国政府亦将启动“脑科学与类脑研究”国家科技重大专项:侧重以探索大脑认知原理的基础研究为主体,以发展类脑人工智能的计算技术和器件及研发脑重大疾病的诊断干预手段为应用导向。
面对激烈的国际竞争以及迫切的社会需求,“脑科学与类脑研究”项目的实施,将有助于我国在脑认知原理、类脑人工智能和脑疾病诊治的前沿领域取得重大突破,在国际上产生引领作用。
1 国际脑科学和类脑研究的回顾与前瞻
1.1 脑科学的回顾
现代神经科学的起点是神经解剖学和组织学对神经系统结构的认识和分析。从宏观层面,Broca 和 Wernicke 对大脑语言区的定位,Brodmann 对脑区的组织学分割,Penfield 对大脑运动和感觉皮层对应身体各部位的图谱绘制、功能核磁共振成像对在活体进行任务时脑内依赖于电活动的血流信号等,使我们对大脑各脑区可能参与某种脑功能已有相当的理解。
由于每一脑区的神经元种类多样,局部微环路和长程投射环路错综复杂,要理解神经系统处理信息的工作原理,必须先具有神经元层面的神经联结结构和电活动信息。
20 世纪在神经元层面从下而上的研究也有了一些标志性的突破,如 Cajal 对神经系统的细胞基础及神经元极性结构和多样形态的分析, Sherrington 对神经环路和脊髓反射弧的定义,Adrian 发现神经信息以动作电位的频率来编码信息的幅度,Hodgkin 和 Huxley 对从动作电位的离子机制并发现各种神经递质及其功能,Katz 和 Eccles 对化学突触传递的分析,Hubel 和 Wiesel 发现各种视觉神经元从简单到复杂的感受野特性,Bliss 和 Ito 等人发现突触的长期强化和弱化现象,O ’ keefe 等人发现对特定空间定位有反应的神经元等,使我们对神经元如何编码、转导和储存神经信息有了较清楚的理解,但是这些神经元的特性是如何通过局部环路和长程环路产生的,我们的理解还十分有限。
至于对环路中的神经信息如何产生感知觉、情绪、思维、抉择、意识、语言等各种脑认知功能的理解更为粗浅。问题的关键是,我们对脑功能相关的神经环路结构和神经信息处理机制的解析仍极不清楚。
1.2 脑科学领域的重大问题:从图谱制作到机制解析
就像 20 世纪 90 年代“全基因组测序”是理解生物体基因基础的关键,“全脑图谱的制作”已成为脑科学必须攻克的关口。核磁共振等脑成像技术大大推动了人们在无创条件下对大脑宏观结构和电活动的理解 [1] 。
但是由于这些宏观成像技术的低时空分辨率(秒、厘米级),不能满足在解析大脑神经网络结构和工作原理时的需求,目前急需有介观层面细胞级分辨率(微米级)神经网络的图谱和高时间分辨率(毫秒级)的载体神经元集群的电活动图谱。
完整的全脑图谱制作的必要过程中,对每个脑区神经元种类的鉴定是必要的一步。目前使用单细胞深度RNA测序技术对小鼠大脑进行的鉴定中,已发现许多新的神经元亚型。利用在这些神经元亚型特异表达的分子作为标记,可以绘制各脑区各种类型神经元的输入和输出联接图谱。
对一个神经元亚型的最好的定义是连接和功能的定义:接受相同神经元的输入并对相同脑区的相同神经元有输出的一群神经元。在建立结构图谱后,需要描叙各个神经联接在进行脑功能时的电活动图谱,这就需要有对神经元集群在体内的观测手段。
有了神经元层面的网络电活动的图谱,并进一步用操纵电活动的方式来决定该电活动与脑功能的因果关系,就能逐步解析脑功能的神经基础。
上述三类脑图谱(神经元种类图谱、介观神经联接图谱、介观神经元电活动图谱)的制作将是脑科学界长期的工作。以目前已有的技术,鉴别小鼠全脑的所有神经元的类型和介观层面的全脑神经网络结构图谱制作至少需要10—15年,而对非人灵长类(如猕猴)则可能需要20—30年以上的时间。
当然,与过去人类基因组测序一样,脑结构图谱制作的进展速度很大程度上依赖于介观层面观测新技术的研发,后者又依赖于对新技术研发和图谱制作的科研投资。
值得注意的是,在全脑神经联接图谱未完成前,神经科学家针对特定脑功能的已知神经环路,对其工作机制已作出了许多有意义的解析。尤其是在过去 10 年中,使用小鼠为模型,利用光遗传方法操纵环路电活动,对特定神经环路的电活动与脑认知功能之间的因果关系的理解,取得了前所未有的进展 [2,3] 。
神经系统内所有的脑功能环路都存在于彼此相连的神经网路之中,许多认知功能的神经环路都牵涉到许多脑区的网路,全脑的结构和电活动图谱是完整地理解大脑功能神经基础所必需的 [4] 。
许多动物都具有基本脑认知功能,例如感觉和知觉、学习和记忆、情绪和情感、注意和抉择等,这些功能的神经环路和工作机理研究,可使用各种动物模型(包括果蝇、斑马鱼、鼠、猴等);但是对高等脑认知功能,如共情心、思维、意识、语言等,可能有必要使用非人灵长类(如猕猴和狨猴)为实验动物。
介观神经网络的神经元类别、结构性和功能性的联接图谱绘制,在未来 20 年将是不可或缺的脑科学领域。我国科学家有望在此领域发挥引领作用。
1.3 脑健康领域的重大问题:脑疾病的早期诊断和干预
据世界卫生组织定量评价,全球各类疾病给社会造成的负担中,脑疾病占 28%,已超过心血管疾病或癌症。其中备受关注的脑疾病包括神经发育疾病(如自闭症)、精神疾病(如抑郁症)和神经退行性疾病(如老年痴呆症等)。
神经发育疾病是一类由脑部生长和发育缺陷导致的疾病,表现为情绪、认知等功能的异常。不少病变发生的时期较早,在婴儿期或童年期就有表现。其中自闭症(又称孤独症)主要表现为人际交往、情感、语言交流等方面的障碍,以及狭隘的兴趣和重复刻板等怪异行为。
我国 0—6 岁低龄儿童占人口总数近 8%,自闭症的发病率很高,一般平均在 1% 左右。根据局部抽样调查数据保守推算,我国患儿人数已过百万,受自闭症困扰的人群可能达千万。
精神疾病是由神经系统病变导致的行为和心理活动紊乱,表现为认知、情感、意志等精神活动出现不同程度的障碍。其中抑郁症最为普遍,据中国疾病预防控制中心调查,我国抑郁症的发病率超过 4%,患者人数超过 3 000 万,已成为影响我国人民生产生活的主要病症之一。
神经退行性疾病是一类以神经元的结构和功能逐渐丧失以至死亡为特征的神经系统病变。其中常见的是老年痴呆症(又称为阿尔茨海默综合征),在 65 岁及以上的人群中发病率约 13%,并且发病率随着年龄的增长而大幅提高。
85 岁及以上的人群,约有一半以上患有此病。2014 年我国老龄人口已突破 2 亿大关,并且将以每年 100 万的速度增长。我国属老年痴呆症的高发地区,目前患者人数超过 600 万,居全球首位,且呈明显上升趋势。
目前科学界对这三类重大脑疾病(幼年期自闭症和智障,中年期抑郁症和成瘾、老年期的退行性脑疾病)的病因仍不了解,治疗的措施也十分缺乏。早期诊断和早期干预将是对脑疾病最有效的医疗方式。人类需要继续探索这些脑重大疾病的致病机理,致病机理的完全理解仍有赖于阐明脑认知功能的神经基础 [5] 。
在完全理解机理之前,急需研发出有效的脑重大疾病预警和早期诊断的各种指标,包括基因变异的检测、血液体液和脑脊液中的分子成分、脑影像及脑功能的指标等。
对诊断出的早期患者,需要早期干预,以延缓或预防脑疾病的出现。我们需要研发早期干预的药理、生理和物理新技术和新仪器。目前医疗界已在使用一些物理刺激技术来治疗脑疾病,如穿颅磁刺激(TMS)、穿颅直流电刺激(tDCS)、深度脑刺激(TMS)等,这些刺激方法的精度和刺激模式需进一步优化,而优化的过程仍依赖于脑科学对认知功能的神经环路所获得的新信息。
新药物和新型生理物理干预技术的研发,需要合适的动物模型,因此,建立脑重大疾病的非人灵长类模型是不可或缺的一环。
1.4 人工智能发展的回顾
1956 年夏季,以麦卡锡、明斯基等为首的一批有远见的年轻科学家探讨用机器模拟智能,并提出了人工智能这一术语,60 年来该领域的理论和技术都得到了迅速的发展。
图灵奖获得者 Allen Newell 以认知心理学为核心,探索认知体系结构。至今在认知心理学与人工智能领域广泛应用于心智建模的认知体系结构 SOAR 与 ACT-R 都是在 Newell 直接领导下或受其启发而发展起来的,并以此为基石实现了对人类各种认知功能的建模 [6,7] 。
DavidMarr 不但是计算机视觉的开拓者 [8] ,还奠定了神经元群之间存储、处理、传递信息的计算基础,特别是对学习与记忆、视觉相关环路的神经计算建模作出了重要贡献 [9-12] 。
Hodgkin 与 Huxley 依据生理实验结果创建了第一个精细的动作电位模型 [13] ,Misha 等人构建了神经元之间的突触计算模型 [14] 。
由瑞士洛桑联邦理工大学(EPFL)发起的“蓝脑计划”自 2005 年开始实施,经过 10 年的努力,目前专注于极为精细的微观神经元及其微环路建模,较为完整地完成了特定脑区内皮质柱的计算模拟 [15] 。但总体而言,以上工作要真正实现认知功能的模拟还有很大鸿沟需要跨越 [16] 。
人工智能符号主义研究的出发点是对人类思维、行为的符号化高层抽象描述,20 世纪 70 年代兴起的专家系统是该类方法的代表。而以人工神经网络为代表的联接主义的出发点正是对脑神经系统结构及其计算机制的初步模拟。
人工神经网络的研究可以追溯到 20 世纪 40 年代 [17] ,有些还借鉴了脑神经元之间突触联接的赫布法则作为其学习理论 [18] 。感知器(Perceptron)是浅层人工神经网络的代表,由于其权值自学习能力引起了巨大关注 [19] 。
Minsky 等人指出,单层感知器无法表示异或函数的缺陷使得人工神经网络研究一度陷入低谷,而反向传播算法的提出解决了多层感知机学习的难题 [20] 。随后 Minsky 在文献 [19] 中提出的第二个问题,即当时计算能力的提升不足以支持大规模神经网络训练的问题长期限制了人工神经网络的发展,直至深度学习的诞生及其支撑硬件平台的发展 [21] 。
在深度学习提出之前,Rumelhart 等人重新提出误差反向传播算法,其在非线性模式分类中显示的强大性能带动了人工神经网络研究和应用的一轮热潮 [22] 。
LeCun 等人提出的卷积神经网络受到了 Fukushima 等人更早提出的 Neocognitron 的启发 [23,24] 。
深度学习算法提出之后,随着 GPU 并行计算的推广和大数据的出现,在大规模数据上训练多层神经网络成为可能,从而大大提升了神经网络的学习和泛化能力。然而,增加层数的人工神经网络仍然是脑神经系统的粗糙模拟,且其学习的灵活性仍远逊于人脑 [16] 。
在人工神经网络的研究中,大多数学者主要关心提升网络学习的性能。Poggio 及其合作者的工作是人工神经网络向更类脑方向发展的典范,特别是其模仿人类视觉信息处理通路构建的 HMAX 模型上的一系列工作 [25,26] 。
此外,Bengio 及其合作者融合了脑的基底神经节与前额叶的信息处理机制,提出了类脑强化学习,也是人工神经网络向更类脑的方向发展有较大影响力的工作 [27] 。加拿大滑铁卢大学 Eliasmith 团队的 SPAUN 脑模拟器是多脑区协同计算领域标志性的工作 [28] 。
由 Hawkins 提出的分层时序记忆(Hierarchical Temporal Memory)模型更为深度地借鉴了脑信息处理机制,主要体现在该模型借鉴了脑皮层的 6 层组织结构及不同层次神经元之间的信息传递机制、皮质柱的信息处理原理等 [29,30] 。
从问题求解目标讲,几乎所有的人工智能系统都需要首先进行人工形式化建模,转化为一类特定的计算问题(如搜索、自动推理、机器学习等)进行处理,因而人工智能系统都被称为专用人工智能系统。IBMDeepBlue 系统击败国际象棋世界冠军卡斯帕罗夫、IBMWatson 问答系统在“危险边缘”挑战赛中击败人类对手、Siri 等自动人机对话与服务系统的出现、Google 汽车自动驾驶等都从不同视角展示了这个领域的进展。
而最为震撼的是,2016 年 3 月份 Google 的 AlphaGo 程序首次利用深度学习技术击败人类围棋世界冠军。这些人工智能系统的出现,有力地推动了人工智能技术和应用的发展,也使得人工智能成为目前 IT 领域最为引人注目的领域。
1.5 类脑人工智能发展的重大问题:具有自主学习能力的智能系统
人工智能技术代表着国家竞争力,并正在以前所未有的速度渗透到现代服务业、工业和军事等领域中。随着老龄化社会的到来,需要大量具备能理解人类意图并进行人机协同工作的智能机器人,欧盟 SPARC 就启动了全球最大的民用机器人研发计划;以 IBM Watson 为代表,将有大量具备复杂数据整合和分析能力的人工智能用于医疗、法律、政府决策等领域,正在替代很多专业领域的白领工作;通过人工智能技术实现无人驾驶,不但释放大量劳动力、提高生活质量,且是另外一个万亿级规模产值的领域。
我国人口红利的消失也迫切需要发展各种智能机器人替代蓝领工人,智能化成为未来工业发展的必然趋势。德国“工业 4.0”,软银集团的孙正义提出 2050 年机器人拯救日本经济,美国总统奥巴马提出的以机器人为核心的高端制造业回归,无不对中国智能产业发展构成重大挑战。
美国的 X47-B 无人机实现在航母上的自主起降,美国的 BigDog 能在多种复杂环境中自如稳定行进,世界军事强国已逐步形成以加速发展智能化武器装备为核心的竞争态势。可以说,没有智能技术武装的服务业、工业和军事的大国之间的较量,就犹如侏儒和巨人的格斗。
(1)人工智能要满足现实需求还缺乏足够的适应性。图灵机计算的本质是需要人们对现实世界进行形式化的定义,模型能力取决于人对物理世界的认知程度,因此人限定了机器描述问题、解决问题的程度。这使得目前的智能系统在感知、认知、控制等多方面都存在巨大瓶颈。
例如还难以实现海量多模态信息的选择性感知与注意、模式识别与语言理解在处理机制与效率等方面与人脑相比还存在明显不足,需要针对某个专用问题非常依赖人工输入知识或提供大规模标记训练样本 [16] 。
(2)目前的人工智能技术缺乏通用性。语音识别、图像处理、自然语言处理、机器翻译等采用不同的模型和不同的学习数据,两种不同的任务无法采用同一套系统进行求解,不同任务之间知识也无法共享。而人脑却采用同一个信息处理系统进行自动感知、问题分析与求解、决策控制等。
(3)目前基于深度学习方法已经在人工智能领域取得了很大的成功,然而其代价是高耗能。例如在执行AlphaGo 这样的任务时,共动用了 1 202 个 CPU 核和 176GPU 核,采用了 40 个搜索线程进行计算。按照这个耗能计算,我们还无法想象要实现一个具备大脑功能的智能系统按照目前的水平需要多少供电。而人类大脑的功耗仅在 20W 左右。
Ailamaki 等人 [31] 指出:“除人脑以外,没有任何一个自然或人工系统能够具有对新环境与新挑战的自适应能力、新信息与新技能的自动获取能力、在复杂环境下进行有效决策并稳定工作直至几十年的能力。没有任何系统能够在多处损伤的情况下保持像人脑一样好的鲁棒性,在处理同样复杂的任务时,没有任何人工系统能够媲美人脑的低能耗性。
”近年来,脑与神经科学、认知科学的进展使得在脑区、神经簇、神经微环路、神经元等不同尺度观测的各种认知任务中,获取脑组织的部分活动相关数据已成为可能。
人脑信息处理过程不再仅凭猜测,而通过多学科交叉和实验研究获得的人脑工作机制也更具可靠性。因此,受脑信息处理机制启发,借鉴脑神经机制和认知行为机制发展类脑智能已成为近年来人工智能与计算科学领域的研究热点 [16] 。
新一代人工智能需要在上述脑研究启发下,以多脑区、多模态和多任务协同为核心,研究神经网络微观刺激调控和宏观动态演化、视听触感认知通道及协同、长时短时记忆与决策、运动视觉与规划控制等,建立具有生物和数学基础的计算模型与学习方法,实现具有自主学习能力的智能系统。