超算能耗一座城市或许你需要一台量子计
光子盒研究院出品
本文部分内容摘自《PhysicsWorld》年3月刊[1]。
荷兰莱顿大学的天体物理学家SimonPortegiesZwart是极具环保意识的人。出于职业原因,他几乎不再坐飞机,而是更喜欢坐火车旅行。“我喜欢通过吃素来保护环境,努力减少我的碳足迹,告诉我的孩子不要淋浴太久,改用可再生资源。”但是一旦Zwart决定做出这些改变,他也开始考虑他的碳足迹的其他方面。
他解释道:“我大量使用大型机器,这些电脑消耗的能源和一座小城市一样多,我想我可能是我这条街上污染最严重的人。如果我运行一台超级计算机,消耗的能量相当于户人家,那么我有什么资格告诉我的孩子或其他人,他们不应该洗澡20分钟?”
随着世界努力应对气候变化,许多科学家已经开始正视自己碳排放的现实。大部分注意力都集中在学术目的的航空旅行上,研究人员正面临着令人不安的披露。例如,事实证明,气候变化研究人员比其他领域的科学家飞行更频繁。根据年的一项研究[2],气候科学家平均每年乘坐飞机两到三次,而其他研究人员在此期间只乘坐两次飞机。但是其他科学家也经常飞行。年的一项研究发现[3],加拿大蒙特利尔大学的教授们每年的碳足迹是加拿大人平均水平的两倍,其中大部分差异与职业旅行有关。
参加学术会议尤其是问题的一个重要方面。年美国地球物理联盟秋季会议在加州举行时,名代表在往返途中排放了约吨二氧化碳当量(tCO2e),这几乎是每个科学家三吨排放量,或者爱丁堡市的平均每周的排放量[4]。
此外,加拿大不列颠哥伦比亚大学最近进行的另一项研究表明[5],学术界的航空旅行对生产力或职业成功几乎没有积极影响。当然,在全球新冠肺炎疫情流行的背景下,大多数学者被迫采用和接受在线会议和研讨会。在线活动不仅让更多不同的代表可以参加,还有环境方面的益处。年的一项研究发现[6],年在线举行的三场大型科学会议的名线上代表的碳足迹与年同一会议的一名亲自出席者的碳足迹相同。
虽然学术旅行对气候变化的影响是无可争议的,但在过去几年中,许多物理学家发现,他们的电脑使用量可以构成他们碳足迹的很大一部分——有时甚至超过航空旅行。
西澳大利亚大学的天体物理学家AdamStevens与同事们一起分析了-年间澳大利亚天文学家的“常规活动”温室气体排放总量,比如旅行、使用超级计算机和在大型天文台工作。研究发现[7],澳大利亚天文学家平均每年产生约37tCO2e,这比澳大利亚平均水平高出40%,是全球平均水平的五倍。其中最大的碳排放是使用超级计算机处理望远镜收集的大量数据,并进行宇宙学模拟。每名天文学家的排放量约为15吨,几乎是飞行年排放量的四倍(图1)。
图1澳大利亚天文学家四种排放源的绿色成本细目,以每人每年二氧化碳(CO2)当量吨(t)或“全时当量”计算(FTE)。显示了误差线,但请注意天文台的值是一个下限。
在另一个例子中,即将到来的中微子探测巨型阵列(GRAND)项目将使用分布在世界各地山区的20万个天线来探测来自深空的超高能中微子。去年,该项目背后的团队估算了三个不同实验阶段的温室气体排放量:原型试验、中规模实验和将于21世纪30年代开始的全规模实验。他们所说的“数字技术”——模拟和数据分析、数据传输和存储、计算机和其他电子设备——将在该项目的碳足迹[8]中占很大比例。
在原型阶段,预计69%的排放来自数字技术,相比之下,27%来自旅行,4%来自“硬件设备”,如制造无线电天线。在中期阶段,数字技术将占40%的排放量,其余的在旅行和硬件之间平分。一旦整个实验开始运行,大部分排放将由硬件(48%)和数字技术(45%)共享。
有趣的是,超级计算的环境成本在很大程度上取决于为设备供电的能源来自哪里。年,荷兰天文学委员会要求PortegiesZwart和一组其他研究人员分析其六个成员机构[9]。他们估计,年,荷兰天文学家平均排放4.7tCO2e——远低于澳大利亚——其中只有4%来自超级计算。
领导这项研究的荷兰空间研究所的天体物理学家FlorisvanderTak认为,荷兰天文学家没有理由比他们的澳大利亚同事更少地使用超级计算机。因此,这种差异可能是由于能源供应的差异。特别是,荷兰国家超级计算设施SURF不产生任何碳排放,因为它使用荷兰风能或太阳能产生的%可再生能源。少量排放来自使用国际设施和较小的荷兰超级计算机。事实上,PortegiesZwart现在总是检查他使用的超级计算机是否使用绿色能源,如果不是,他会考虑使用不同的设备。同样,vanderTak的建议是“在你要求在设施上待一段时间之前,首先检查他们使用的是什么样的电力”。
位于德国海德堡的马克斯·普朗克天文研究所的温室气体排放凸显了类似的国家间差异。年,该研究所的每位研究人员排放了约18tCO2e[10]——多于荷兰的天文学家,但只有澳大利亚同行的一半(图2)。这些排放量也比德国居民的平均水平高60%,是德国年目标的三倍,这符合巴黎气候协议。
马克斯·普朗克研究所年约29%的排放来自电力消耗,其中计算,特别是超级计算,占75-90%。德国和澳大利亚之间的关键区别在于能源来自哪里。年,德国约一半的电力来自太阳能和风能,而在澳大利亚,绝大多数电力来自化石燃料,主要是煤。这意味着在澳大利亚,计算用电每千瓦时产生0.kg二氧化碳,而马克斯·普朗克研究所每千瓦时排放0.23kg二氧化碳。
图2根据巴黎协定,一名澳大利亚天文学家和马克斯·普朗克天文研究所的一名德国研究人员在年的平均年排放量按来源分类,并与德国年的目标排放量进行比较。在德国和澳大利亚,与电力相关的排放包括计算和非计算消耗,其中绝大部分来自计算。
vanderTak确实指出,这项工作的大部分是在几年前完成的,而且世界已经前进了。例如,现在越来越多的办公室使用可再生能源。荷兰的研究发现,年荷兰天文学的碳足迹中有近三分之一(29%)来自电力使用,包括为六个研究所的本地计算供电。当时,一半的研究所都在使用绿色电力。但自那以后,又有两个国家转向了%的可再生能源,vanderTak预计第六个国家将在未来两年内实现这一转变。
事实上,澳大利亚的情况也发生了变化。自年7月以来,该国三大国家高性能计算设施之一的OzSTAR超级计算机已经转向从附近的风电场购买%可再生能源。拥有这个超级计算机斯威本科技大学声称,这将极大地减少其碳足迹,因为电力占排放的70%以上。
但是你如何计算出你正在使用的超级计算机的排放量呢?当数学家和物理学家LocLannelongue发现没有简单的答案时,他开发了绿色算法。这是一个在线工具,使研究人员能够估计他们计算的碳足迹。
就职于英国剑桥大学的Lannelongue重申位置是关键。例如,在澳大利亚相同的硬件上运行相同的任务,将比在瑞士多排放大约70倍的碳,瑞士的大部分电力来自水电。该算法背后的研究[11]表明,如果一个更高效的计算中心比另一个效率更低的超级计算机使用更少的可再生能源,它可能很快失去其绿色优势。虽然估算任何算法的碳足迹都是基于硬件、任务所需时间以及数据中心或超级计算机的位置等关键因素,但绿色算法也有一个“实用比例因子”(PSF),用于估算实际执行计算的次数,这对排放量有直接影响。
图3绿色算法是估算算法碳足迹的免费工具。它使用了许多因素,包括工具的硬件要求、运行时间和数据中心的位置。用户可以评估他们的计算结果,或者估计在其他架构上重新部署它们的碳节省或成本。这张图比较了来自不同科学领域的许多算法的碳足迹——从粒子物理模拟和DNA辐射到大气科学和机器学习——并将每个只运行一次的算法与同一任务的重复计算(PSF)进行了比较。将以克(g)为单位的二氧化碳(CO2)当量(e)与树木吸收的碳量和常见活动(如驾驶汽车)的排放量进行比较。
事实上,大多数算法都要运行多次——有时甚至要用不同的参数运行数百次——而且次数会因任务和研究领域的不同而有很大差异(图3)。这项研究还发现,南非以及美国一些州的计算机排放量与澳大利亚相似。另一方面,冰岛、挪威和瑞典的电力碳密集度特别低。
有了云计算,研究人员现在更容易选择使用哪台超级计算机。但如果他们无法切换到不同的机器,还有其他方法可以减少排放。Lannelongue说,仅仅使用最新版本的软件就可以带来巨大的变化。他解释说:“如果你不能在本地采取行动,更新版本和使用优化的软件可能是下一个重要步骤,因为这将影响一切,因为这将减少计算需求。”
但是,不仅仅是超级计算机上的模拟可能是碳密集型的。法国索邦大学的KumikoKotera是GRANDneutrino项目的创始人之一,他说,当你看到实验预测的排放量时,“你会发现真正昂贵的是数据存储和数据传输”。Kotera和她的同事发现,在实验的原型阶段,数据存储和传输将占全年总排放量的大约一半,在中期阶段占四分之一,在全面实验期间占三分之一以上[12]。相比之下,在这三个阶段,数据分析和模拟将分别产生约16%、13%和7%的排放。
数据存储和传输的碳足迹来自数据中心的能源需求。与超级计算机一样,数据存储在一定程度上可以通过使用排放量较低的数据中心来解决。Kotera说,这个大项目也将寻求减少数据量的策略。她解释说,这可能需要注意存档的内容——“我们不需要保留所有东西”——并找到有效清理数据的方法。
她解释说:“如果我们能够很快清理数据,我们可能会减少大量的数量和排放量。对于数据传输来说,这很棘手,因为这是一个全球网络。”但清理和减少数据量仍然有所帮助,科学家也可以小心他们传输的内容。多人在世界各地重复传输相同的数据片段会很快累积起来。
该团队计算出,GRAND五年原型阶段的数据传输将排放tCO2e——类似于从巴黎到敦煌机场(在中国原型的实验场地附近)的大约次航班。事实上,研究人员发现,一年四次用飞机运输硬盘比在线传输数据的碳排放量要少很多个数量级。
加速器的足迹作为减少其整体碳排放的一部分,欧洲核子研究中心(CERN)聘请了一名环境工程师来监督未来建筑项目的土木工程。
由于数据中心的分布式和全球性,计算数据存储和传输的排放量可能会很棘手。Kotera警告说,他们的数字并不精确,因为有许多未知因素,而vanderTak不确定荷兰天文学的碳足迹分析涵盖了多少数据存储和传输,并补充说这可能是他们需要
转载请注明:http://www.abuoumao.com/hykh/8099.html