以计算之光,照亮材料研发之路
——记中国科学院半导体研究所研究员汪林望
2023-11-01
先进材料是高新技术产业的先导和高端制造业的关键基础,是国际高技术竞争的关键领域,是未来工业发展的重要支撑点。所谓“一代材料,一代技术”,随着新材料的研发更迭,一个不得不面对的重要问题也摆在研究者面前,那就是:大多数新材料研发仍在沿用传统的实验试错方法。
“很难想象打造一架飞机、一枚火箭,靠的是感觉和经验。”中国科学院半导体研究所资深研究员汪林望表示,“大多数人没有意识到,地球上身边所见的一切物质及其性质,都受到量子力学的控制,都可以通过计算来理解与预测。没有计算,工业生产寸步难行。”
汪林望的研究离不开3个关键词:算法、超算、人工智能。他致力于通过第一性原理计算引领材料研究走向理性设计的康庄大道。“我们利用密度泛函理论,把原有的多体理论变成一个更容易求解的单体理论;再采用精巧的算法,将巨大的计算量降低十倍、百倍。”对他来说,能拿得出手的“宝贝”算法很多,但如何把计算搬到超级计算机上,是打破计算瓶颈的关键所在。汪林望经历过矢量计算、并行计算、异构加速计算等多次变革,他感受到超算的发展是迅速的,每一次硬件改变都要对软件进行相应的优化,最近一次变动,是图形处理器(GPU)的引入。而GPU的兴起,得益于另一股铺天盖地涌来的风潮:人工智能(AI)。
汪林望领衔开发的“PWmat”是世界上最早适配到GPU上的平面波密度泛函软件之一。到2017年前后,他又开始涉足机器学习领域,如今更是领导开发了一个机器学习平台。“机器学习力场的开发,可以在很多问题上大大加速我们做大规模分子动力学模拟的速度。但这个领域还处在起步阶段,新方法层出不穷,它的局限性我们也不完全了解。拥抱新方法不等于盲目跟风炒作,一窝蜂涌上不利于长期稳健的发展。”保持清醒,坚持创新,这才是汪林望的行走准则。
卅载求索,结缘物理
时至今日,汪林望都能清晰地记起年少时在《科学画报》中看到的一组图画:“当一条鲸鱼在快速游动时,它看起来会比邻近的那条静止的鲸鱼短一些。”
那是中学生汪林望第一次体会到狭义相对论的奥妙,并开始尝试用自己的方式去理解物理学。第一个被他“盯”上的是热力学第一定律。“这个定律告诉我们,能量与热量是等效的。那能不能把马路上的热量转变为能量,驱动汽车自动向前呢?”就在他为这个奇思妙想兴奋时,一盆冷水泼了下来。“我在书店里读到了热力学第二定律,按它的说法,在自然界中,热量不可能在不产生其他影响的条件下完全变成其他形式的能量。”正在读高中的汪林望备受打击,但还是倔强地认为一定能找到一个方法来“推翻”热力学第二定律。
考到上海交通大学的第一年,汪林望都还在构思一些奇奇怪怪的思想实验。“就像一个躲在暗处的小人儿,时时幻想着对一个巨人发起进攻。”日复一日,汪林望终于被“巨人”折服,转为相信热力学第二定律,但这段经历也令他发现“掌握一个定律的最好方法是试图推翻这条定律”,从而养成了勤于思考、大胆求索的习惯。一个重要的转折点发生在1985年。那一年,他从上海交通大学本科毕业,并以全国并列第四名的成绩考上了中美联合培养物理类研究生计划(CUSPEA),前往美国康奈尔大学留学。
在康奈尔大学期间,汪林望沉醉于研究神经网络,花了两年时间泡在图书馆里,学习大脑皮质六层神经网络结构、人脑思维的模型等,还想写一个程序来模拟猴子的思维。等他把能上的课都上完,想起要找博士生导师时,才发现大多数理论导师都没有学生名额了。“还好迈克尔•泰特(Michael Teter)教授还在招人。那时候,正值第一性原理计算迅速发展时期,而他是第一个把共轭梯度法应用到电子结构计算的人。”就这样,汪林望误打误撞进入材料计算领域,并在此深耕30多年。在这个过程中,最让他惊喜的莫过于亲眼见证了第一性原理计算的腾飞。
第一性原理计算是一种基于量子力学理论的计算方法,可以对材料的能带结构、电荷密度、力学性质、光学性质、电学性质等各种性质进行预测。“原则上,只要是地球上的物质都可以用它去计算,并且不需要任何经验参数。”汪林望说,“这是一个非常强有力的工具。”
那么问题来了,早在1925—1927年,丹麦物理学家波尔、德国物理学家海森堡、奥地利物理学家薛定谔等人就相继提出了量子力学的基本原理,建立了现代量子力学的框架,为何直到大半个世纪后,第一性原理计算才开始“起飞”呢?从根本上来说,还是受限于算力。据汪林望介绍,凝聚态物质计算的转机出现在1964年。彼时,美国理论物理学家、理论化学家沃尔特•科恩提出,一个量子力学体系的状态可以仅由其电子密度来决定,这个密度函数比多体电子波函数容易太多,这便是密度泛函理论。但最初,就连科恩本人都没对这一理论抱太大希望,因为学界对密度泛函的具体形式一无所知。直到20世纪80年代初,大家发现,即使用最简单的局域泛函的近似方法,计算出来的很多物理性质也能和实验很接近,这才大喜过望。“一个确实好的理论往往可以在大家认为不应该行的地方还是行!”他补充道。
密度泛函理论诞生于1964年,汪林望也出生于这一年。这令他总觉得自己与这一领域有一些缘分,也有一份使命。攻读博士学位期间,他围绕动能泛函展开了一系列开创性工作,并提出了一个以他和导师名字命名的函数,仅用电荷密度就能计算出相应的电子动能。“但这个函数只能用在轻金属,比如铝合金上。”汪林望谦虚地说。话虽如此,这项研究却引起了学界的广泛关注,至今仍有学者在此基础上不断对这一动能函数进行改进,推动着相关研究的进步。
自20世纪90年代起,汪林望的研究渐入佳境。他开始研究线性标度O(N)电子结构计算,并开发了折叠能谱方法,将非自洽电子结构计算的极限从100个原子的体系扩充到数千个原子的体系。那时正值纳米材料科学兴起,他用线性标度法研究了诸多纳米材料,如量子点、量子线等,而他的工作也被业界同行所熟知。此后,他逐渐发展了一整套十多种的系列方法和软件。其中,PEtot、Escan、LCBB、LS3DF、CPM、Transport等软件至今仍被广泛使用,而线性标度三维分块算法(LS3DF)还为他赢来了2008年戈登•贝尔奖。这是一奖项被誉为“超级计算应用领域的诺贝尔奖”,汪林望则是第一位获此殊荣的领头华人科学家。
“简而言之,它的原理就是‘分而治之’。”汪林望解释道,在超大规模计算机软件设计时,关键是减少全局通信,将通信限制在局域处理器内部。量子力学效应其实是短程的,这一局域性使它可以将一个大的体系划分成很多碎片,各个击破。由于直接进行密度泛函计算的计算量与体系大小的三次方成正比,当体系被分解成碎片后,计算量就只与碎片数,也就是体系大小,成正比了。而这一算法的精妙之处就在于能够将这些碎片高效地拼接起来。“这样做的好处是,只要有更多的计算机资源,就能在相同的时间内更方便地计算更大的体系,这非常适合应用于工业材料设计仿真。”
在研究历程中,汪林望清晰地感受到,从某种程度上说,科学只有第一、没有第二。“有时候刚打算好下一步的研究计划,就发现已经有团队在做了,阴差阳错就落后了一步。”尽管如此,他很少对研究产生沮丧的情绪,他更在意的是如何在灵感不期而至的时候抓住它们。“勤勉是一种美德,其中也包括勤思。事实上,和团队吃饭聊天时、阅读文献时,甚至开车时,都可能被灵感‘击中’,我有好多想法都是这么来的。”
时隔多年,汪林望已经淡忘了攻关路上那些“磨人”的细节,也记不清得知自己获奖时的心情了。“那是个好日子。”他轻描淡写地说。
新旅程:做事是人生常态
2021年,汪林望从美国劳伦斯伯克利国家实验室退休。回国之后,“闲不下来”的他,接过中国科学院半导体研究所的橄榄枝,聚焦大规模原子级半导体工艺模拟和器件仿真软件(TCAD)中的一些基础物理问题,开始了一段新的旅程。
随着芯片设计的复杂程度不断提升,电子设计自动化(EDA)与产业链结合愈加紧密,已经成为提高设计效率、加速技术进步的关键推手。作为EDA的关键技术分支,TCAD工具则主要应用在工艺及器件仿真领域。尤其在后摩尔时代,当半导体器件尺寸越缩越小,系统的量子力学效应和原子尺度结构涨落造成的影响就变得格外重要。此时,传统基于连续介质模型的TCAD工具不再适用,发展原子级TCAD仿真工具迫在眉睫。而发展这些仿真工具,首先需要解决其中的一些基本物理问题,从方法和理论上创新。在这方面,汪林望无疑是占据先机的。
在国家自然科学基金委重大项目课题的支持下,汪林望将带领团队围绕相关基本科学问题进行攻关。他们希望能够通过量子输运理论研究、算法创新、异构加速等手段,提出面向大规模原子级别TCAD仿真的新理论和新方法。同时,基于非平衡格林函数(NEGF)和平面波散射态两种方法,设计出能够计算2万原子规模的纳米器件第一性原理模拟软件;他们希望开发出具备对复杂边界条件的非平衡态系统计算电子结构的方法,特别是通过自洽计算得到具有原子层面屏蔽效应的哈密顿势能;他们将研究电声相互作用在纳米器件中的效应,发展一套基于波包的量子输运描述方式,连接从弹性散射到漂移-扩散的电子输运模式;他们还将研究单原子级别的缺陷对器件性能的影响,评估不同器件设计的可靠性及可能的良率大小等。 “我们一定要把大规模原子级别TCAD做好,在后摩尔时代,这将是一个非常重要的工具。无论是对先进技术节点器件研究,还是对新兴材料和器件的研究,它都具有重要意义。”他说。
加入中国科学院半导体研究所以来,除了基础研究之外,汪林望还致力于在团队建设和人才培养上下功夫,切实展开全方位的深耕,锻炼及培养一批优秀的科研工作者。
“我希望能和学生融为一体,创造出一种比较活跃和轻松的氛围,鼓励他们养成独立思考、自由讨论的习惯。”汪林望说道。他认为,在人才成长过程中,要注重基本功和专业技能的积累。“公式一定要吃透,编程一定要了解,尤其我们这行,不能只会用软件,要清楚这个软件到底是根据什么原理去计算的,做到知其然更知其所以然。”
在学生眼中,汪林望是一位喜欢深度思考、追本溯源的导师。从他身上,他们学会了“剥洋葱”式的研究思维,去探索问题的本质和核心。而当学生的程序出现问题,汪林望也乐于帮他们调整。“写程序、调漏洞(bug),是我最喜欢干的事,很治愈。”仍然奋斗在科研第一线的他经常这样说。亲力亲为是他一贯的作风,他也常常提醒学生,要脚踏实地、独立思考。“做研究养成独立思考的习惯,就跟运动员要养成运动习惯一样。长跑运动员心无旁骛地去跑步时,会感到愉悦、有成就感。同样的,对一个研究者来说,独立思考也是一件很开心的事。”
这种愉悦感,是汪林望科研路上的活力之源。每当被问到累不累,他总是想起遥远记忆中一位勤劳慈祥的幺姑婆,她一边忙着活计一边念叨“人这辈子总是要做事的”。年幼的汪林望懵懂中记住了这句话,往后时光中,这句话逐渐在他心中生根发芽,形成了一种“做事就是人生常态”的哲理观,激励着他勤勉向前。
产业化:像龙一样腾飞
2023年4月,汪林望受邀参加第七届新型电池正负极材料技术国际论坛暨首届钠电池技术与市场发展论坛,围绕“第一性原理计算在电池材料研发中的应用”展开了主题演讲。其中,重点提到了国产第一性原理材料计算软件——PWmat。
这是世界上率先利用GPU进行全面加速的平面波密度泛函软件,速度远超同类软件。“快,就是因为我们把它放在了GPU上。”用汪林望的话说,借助GPU的并行计算能力,可以将计算任务分解为多个独立的子任务,当这些子任务被并行执行时,计算速度和效率就会大幅度提高。以PWmat为例,它可以在GPU集群上以第一性原理计算精度实现5000个原子体系的计算模拟,如果使用线性标度法,则可以实现超1000万个原子体系的计算。25年前计算一个包含100个原子体系要花费一周时间,而现在甚至不超过半分钟,这是其他同类代码不具备的能力。
但PWmat的诞生却没有什么轰轰烈烈的故事。2013年,英伟达刚刚推出用于科学计算的GPU,“我想到与网络中心合作,把我研发的基于CPU的第一性原理软件PEtot移植到GPU上,由当时还是学生的贾伟乐来负责”。汪林望表示,PEtot的雏形出现于汪林望在康奈尔大学攻读博士期间,到劳伦斯伯克利国家实验室工作后,他又对其进行了完善,形成了一个完整的开源软件,拥有BSD许可(加州大学发布的授权条款),可不受限制地开发。
对汪林望团队来说,这在当时只是一个小项目,但出现了一个意外的惊喜。在一次小型的英伟达开发人员会议上,组织人员送给他们一块闲置的GPU卡。贾伟乐就把它插到汪林望家中一个计算机工作站上,观察到PWmat的运算速度很快。这让他们很兴奋,既然如此,为何不推广使用呢?创业的想法由此萌生。2015年,北京龙讯旷腾科技有限公司(以下简称“龙讯旷腾”)正式创立。“旷腾”代表量子(quantum);“龙讯旷腾”则寄托着他们的期望,希望第一性原理计算的产业推广事业能够像龙一样腾飞。
“PWmat是在不断调试的过程中形成的。我们会根据需要将一些新的算法和功能加进去,每天遇到的问题就是要尽快找到程序里的漏洞,或者如何避免产生太多的漏洞。”在这些漏洞面前,汪林望就像福尔摩斯一样探寻它们的蛛丝马迹。令他骄傲的是,大多数漏洞只要经他的手,就很少能够过夜。而PWmat也在日复一日的完善中,成为龙讯旷腾的核心产品,有200多个课题组,上千个用户在使用,涵盖国内几十所主流材料研究机构。
“这样的标准化的代码发展,完全改变了这个领域的面貌,让更多的材料研究人员可用上第一性原理计算,也大大增强了我们计算的能力及可算的范围。”汪林望说。如今,他和龙讯旷腾团队不仅致力于拓展科研用户,也在大力将软件推向企业界。这是一个艰难的过程,毕竟,第一性原理计算与工业材料制备,特别是工艺过程之间还存在一个巨大的鸿沟。如何跨越这一鸿沟,是他日思夜想的问题。前途是光明的,但道路是曲折的。经过近40年的发展,第一性原理计算已经在学术圈的材料研发中站稳脚跟。“现在是时候把它推向工业界了。一个理论最大的影响,还是要看它在工业界是否被广泛应用,是否能改变工业界的面貌。”
在业界摸爬滚打几十年,年近六旬的汪林望,在精气神上却让人看不出年龄感。他想起年轻时看过的电影《追捕》,故事结束时,真由美望着杜丘问:“完了吗?”杜丘回答:“不,哪有个完呐!”杜丘的喟叹,响在汪林望心里,总是会转换成一种“在路上”的执着与浪漫。在他看来,能够一直做自己想做的事,这就是幸福。“人不能躺平,躺久了,容易背疼。”他笑着说。
专家简介
汪林望,中国科学院半导体研究所资深研究员,北京龙讯旷腾科技有限公司创始人兼首席科学家。1985年获上海交通大学物理学学士学位,1991年获美国康奈尔大学物理学博士学位。1992年至1998年先后在美国康奈尔大学物理系和美国再生能源国家实验室从事博士后及研究员工作。1999年至2021年,在美国劳伦斯伯克利国家实验室任研究员及资深研究员。
汪林望主要从事大尺度材料计算的算法研究及应用,在纳米材料、半导体缺陷及低维结构、半导体器件模拟、能源材料、高性能计算等多方面取得了多项具有国际影响力的原创性研究成果。发表《科学引文索引》(SCI)论文400余篇,论文总引用次数达36000余次,H指数为94。2006年当选美国物理学会会士;2008年获得戈登•贝尔奖。
来源:科学中国人 2023年10期 创新之路