当前位置: 开发笔记 > 编程语言 > 正文

Nature盘点的这些代码，个个都改变了科学：Fortran、AlexNet还有arXiv等

作者：大航 | 来源：互联网 | 2023-10-12 19:52

杨净发自凹非寺量子位报道|公众号QbitAI今天，Nature的一篇报道有点不同。没有说最新的科学研究进展，也没有说这个时代的科学家们。而是将镜头聚焦在

杨净发自凹非寺
量子位报道 | 公众号 QbitAI

今天&＃xff0c;Nature的一篇报道有点不同。

没有说最新的科学研究进展&＃xff0c;也没有说这个时代的科学家们。

而是将镜头聚焦在计算机上&＃xff0c;更具体一点&＃xff0c;是聚焦在计算机代码上。

在过去的一年中&＃xff0c;Nature对数十名研究人员进行了调查&＃xff0c;以选出这几十年以来&＃xff0c;改变研究的关键代码。

现在&＃xff0c;评选结果新鲜出炉。

简单看了下&＃xff0c;有半世纪的“语言先驱”、“祖宗之法”Fortran&＃xff0c;理工科的老朋友了&＃xff0c;相信个中滋味很多人都能体会。

还有不知不觉已经“而立之年”的论文利器arXiv.org——全球最大的免费预印本平台&＃xff0c;每月吸引超过15000份投稿和3000万次下载。

……

究竟还有哪些代码改变了现在的科学&＃xff1f;Nature又为何Pick这些代码&＃xff1f;

“语言先驱”Fortran&＃xff08;1957&＃xff09;

说到Fortran&＃xff0c;相信很多大学生都受到它的摧残“洗礼”。

在知乎上有一个2015年的古早问答&＃xff1a;“和 C&＃43;&＃43; 相比&＃xff0c;用 Fortran 编程是怎样的体验&＃xff1f;”

其中一个高赞回答讲述了他被Fortran“洗礼”的经历&＃xff0c;引发广泛共鸣&＃xff0c;得到了1331个点赞。

即便如此&＃xff0c;依然没办法磨灭它在语言界的地位。

最早的现代计算机对用户&＃xff0c;尤其对科学家并不友好。其中的机器语言、编程语言需要科学家对计算机的体系结构有深入的了解。

直到在上个世纪50年代&＃xff0c;IBM团队开发了“公式翻译语言”Fortran&＃xff0c;情况发生了改变。

普林斯顿大学的气候学家Syukuro Manabe表示&＃xff0c;Fortran使非计算机科学家的研究人员可以访问程序。

他和他的同事使用该语言开发了全球第一个气候模型&＃xff0c;被美国国家海洋和大气管理局200年来发生的十大突破之一。

如今&＃xff0c;Fortran已经发展到第八个十年了&＃xff0c;它仍然被广泛地应用于气候建模、流体动力学、计算化学等一些涉及复杂计算的学科。

古早的Fortran代码库仍然活跃在实验室和全球的超级计算机上。

而立之年的arXiv.org&＃xff08;1991&＃xff09;

一定没有想过&＃xff0c;几乎所有科研人员都使用过的论文福音——arXiv已进入第三十个年头。

目前&＃xff0c;它已经收录约180万份预印本&＃xff0c;全部免费提供大家交流。

每月的投稿和下载数量也一直只增不减。

据Nature统计&＃xff0c;现在每月将吸引了15000多份投稿和约3000万次下载。

而它一开始&＃xff0c;也不过只是一个聚焦于高能物理的电子邮件自动回复系统。

在没有arXiv之前&＃xff0c;科学家们大多通过邮寄的方式将提交的手稿副本寄给同事&＃xff0c;以征求评价。

但寄出的数量有限&＃xff0c;看到论文的也不过几个人。

见到此状&＃xff0c;一位墨西哥州工作的高能物理学家Ginsparg决定编写了一个电子邮件自动回复系统。

订阅者每天都会收到预印本的清单&＃xff0c;每个清单都有一个文章标识符。

于是&＃xff0c;通过一封电子邮件&＃xff0c;世界各地的用户可以从实验室的计算机系统中提交或检索文章&＃xff0c;获得新文章列表或按作者、标题搜索。

一开始&＃xff0c;Ginsparg计划是将文章保留三个月&＃xff0c;论文内容限制在高能物理学界。

但在同事的说服之下&＃xff0c;1993年他将该系统迁移到互联网上。5年之后&＃xff0c;他给它起了今天的名字&＃xff1a;arXiv.org。

Hinton指导的AlexNet&＃xff08;2012年&＃xff09;

如果要说当前更接地气一点&＃xff0c;就要提到这个快速学习AI——AlexNet。

一开始&＃xff0c;人工智能有两种。一种是使用编码规则&＃xff0c;另一种使用计算机通过模拟大脑的神经结构来“学习”&＃xff0c;几十年来&＃xff0c;人工智能研究人员一直将后一种方法视为“废话”。直到2012年&＃xff0c;Hinton改变了这一格局。

最初的ImageNet全球挑战赛&＃xff0c;最好的算法错误率也有25%之高。

而Hinton的两位研究生提出的这个AlexNet&＃xff0c;一种深度学习算法&＃xff0c;直接将错误率降低到了16%。

Hinton表示&＃xff0c;我们基本上将错误率降低了一半&＃xff0c;或者说几乎降低了一半。而这样的成绩&＃xff0c;揭开了深度学习在各个领域上的应用。

200年“历史”的快速傅里叶变换&＃xff08;1965&＃xff09;

相信很多数学、工程领域的同学都对它很熟悉&＃xff0c; 快速傅里叶变换 (fast Fourier transform) 即利用计算机快速计算离散傅里叶变换&＃xff08;DFT&＃xff09;的统称&＃xff0c;简称FFT。

值得一提的是&＃xff0c;这里的基本思想早在1805年就已推导出来&＃xff0c;但直到在1965年才得到普及。

来自美国的两位数学家James Cooley和John Tukey提出利用算法让计算所需要的乘法次数大为减少&＃xff0c;特别是被变换的抽样点数N越多&＃xff0c;FFT算法计算量的节省就越显著&＃xff0c;计算速度也会提高。

比如&＃xff0c;对于1000抽样点数&＃xff0c;速度提升约100倍&＃xff1b;对于100万点&＃xff0c;速度提升5万倍。

由此&＃xff0c;快速傅里叶变换开启了数字信号处理、图像分析、结构生物学等方面的应用。它曾被IEEE科学与工程计算期刊列入20世纪十大算法。

软件驱动的生物数据库&＃xff08;1865&＃xff09;

数据库已经成为当今科学研究的一个重要组成部分&＃xff0c;以至于很少有人注意到它其实是由软件驱动的。

在过去十几年中&＃xff0c;数据库以肉眼可见的速度影响了很多领域&＃xff0c;但也许没有什么地方可以比生物学更为显著。

不管是从蛋白质序列发现癌症致病因子&＃xff0c;还是合成生物学等领域都少不了庞大基因组和蛋白质数据库的工作。

上个世纪60年代初&＃xff0c;当生物学家还在努力拆解蛋白质的氨基酸序列时&＃xff0c;Margaret Dayhoff&＃xff08;生物信息学先驱&＃xff09;则开始默默整理这些蛋白质信息&＃xff0c;创建蛋白质和核酸数据库以及查询数据库的工具。

她的《蛋白质序列和结构图谱》在1965年首次出版&＃xff0c;描述了当时已知的65种蛋白质的序列、结构和相似性。而且她还将其数据编码在打孔卡中&＃xff0c;这使得扩大数据库并进行搜索成为可能。

之后&＃xff0c;更多计算机化的生物数据库也随之而来&＃xff0c;蛋白质数据库于1971年上线&＃xff0c;今天它详细记录了17万多个大分子结构。

天气预报员&＃xff1a;一般流通模型&＃xff08;1969年&＃xff09;

“蚂蚁搬家蛇过道&＃xff0c;明天必有大雨到。”

以前的天气预报都是依靠人们的经验和直觉&＃xff0c;直到这个模型——一般流通模型的出现&＃xff0c;根据物理定律进行气候建模的工作&＃xff0c;由此开启了计算机预测天气的时代。

在20世纪40年代末&＃xff0c;现代计算机之父约翰·冯·诺依曼便成立了他的天气预测小组。

1955年&＃xff0c;第二个团队—地球物理流体动力学实验室也开始了所谓的 “无限预报”—即气候建模的工作。

直到1969年&＃xff0c;这其中才有人真正做出了天气预测模型&＃xff0c;使其首次能够在硅片中测试二氧化碳水平上升的影响。&＃xff0c;创造了2006年Nature形容的科学计算的“里程碑”。

今天的模型可以将地球表面划分为25×25公里的方块&＃xff0c;将大气层划分为几十个层次。

相比之下&＃xff0c;Manabe和Bryan的海洋-大气组合模型&＃xff0c;使用的是500公里的方块和9个层次&＃xff0c;只覆盖了全球的六分之一。

除此之外&＃xff0c;还有数字处理者BLAS&＃xff0c;显微镜必不可少的NIH Image&＃xff0c;序列搜索器BLAST&＃xff0c;数据浏览器IPython Notebook。

好了&＃xff0c;你Pick哪一款&＃xff1f;如果其他心仪的代码&＃xff0c;欢迎与我们分享。

更多细节可戳下方链接了解哦~

参考链接&＃xff1a;
https://www.nature.com/articles/d41586-021-00075-2
https://www.zhihu.com/question/28683874

— 完 —

本文系网易新闻•网易号特色内容激励计划签约账号【量子位】原创内容&＃xff0c;未经账号授权&＃xff0c;禁止随意转载。

加入AI社群&＃xff0c;拓展你的AI行业人脉

量子位「AI社群」招募中&＃xff01;欢迎AI从业者、关注AI行业的小伙伴们扫码加入&＃xff0c;与50000&＃43;名好友共同关注人工智能行业发展&技术进展&＃xff1a;

量子位 QbitAI · 头条号签约作者

վ&＃39;ᴗ&＃39; ի 追踪AI技术和产品新动态

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见~

推荐阅读

function
基于KVM的SRIOV直通配置及性能测试

SRIOV介绍、VF直通配置，以及包转发率性能测试小慢哥的原创文章，欢迎转载目录?1.SRIOV介绍?2.环境说明?3.开启SRIOV?4.生成VF?5.VF ... [详细]

蜡笔小新 2024-12-25 19:26:39
command
360SRC安全应急响应：从漏洞提交到修复的全过程

本文详细介绍了360SRC平台处理一起关键安全事件的过程，涵盖从漏洞提交、验证、排查到最终修复的各个环节。通过这一案例，展示了360在安全应急响应方面的专业能力和严谨态度。 ... [详细]

蜡笔小新 2024-12-27 11:10:05
jsp
新手指南：在Windows 10上搭建深度学习与PyTorch开发环境

本文详细记录了一名新手在Windows 10操作系统上搭建深度学习环境的过程，包括安装必要的软件和配置环境变量等步骤，旨在帮助同样初入该领域的读者避免常见的错误。 ... [详细]

蜡笔小新 2024-12-17 03:14:23
join
Transforming the Future of Virtual Worlds

Explore how Matterverse is redefining the metaverse experience, creating immersive and meaningful virtual environments that foster genuine connections and economic opportunities. ... [详细]

蜡笔小新 2024-12-28 09:44:49
java
寻找满足特定条件的整数N的最大和(a+b)

本文探讨了如何在给定整数N的情况下，找到两个不同的整数a和b，使得它们的和最大，并且满足特定的数学条件。 ... [详细]

蜡笔小新 2024-12-26 19:26:18
java
使用Vultr云服务器和Namesilo域名搭建个人网站

本文详细介绍了如何通过Vultr云服务器和Namesilo域名搭建一个功能齐全的个人网站，包括购买、配置服务器以及绑定域名的具体步骤。文章还提供了详细的命令行操作指南，帮助读者顺利完成建站过程。 ... [详细]

蜡笔小新 2024-12-26 16:36:34
function
基因组浏览器中的Wig格式解析

本文详细介绍了Wiggle（Wig）格式及其在基因组浏览器中的应用，涵盖variableStep和fixedStep两种主要格式的特点、适用场景及具体使用方法。同时，还提供了关于数据值和自定义参数的补充信息。 ... [详细]

蜡笔小新 2024-12-26 11:21:09
function
深入理解Redis的数据结构与对象系统

本文详细探讨了Redis中的数据结构和对象系统的实现，包括字符串、列表、集合、哈希表和有序集合等五种核心对象类型，以及它们所使用的底层数据结构。通过分析源码和相关文献，帮助读者更好地理解Redis的设计原理。 ... [详细]

蜡笔小新 2024-12-25 04:11:22
function
Python 工具推荐 | PyHubWeekly 第二十一期：提升命令行体验的五大工具

本期 PyHubWeekly 为大家精选了 GitHub 上五个优秀的 Python 工具，涵盖金融数据可视化、终端美化、国际化支持、图像增强和远程 Shell 环境配置。欢迎关注并参与项目。 ... [详细]

蜡笔小新 2024-12-21 14:45:11
function
智能投顾机器人：创业者如何应对新挑战？

随着智能投顾技术在二级市场的兴起，针对一级市场的智能投顾也逐渐崭露头角。近日，一款名为阿尔妮塔的人工智能创投机器人正式发布，它将如何改变投资人的工作方式和创业者的融资策略？ ... [详细]

蜡笔小新 2024-12-20 16:46:18
function
NVIDIA Titan RTX深度评测

NVIDIA的Titan RTX被誉为当前最强大的桌面显卡之一，其卓越的性能和高昂的价格吸引了众多专业人士和技术爱好者的关注。本文将详细介绍Titan RTX的技术规格、性能表现及应用场景。 ... [详细]

蜡笔小新 2024-12-19 20:04:56
function
阿里飞猪旅行搜索技术的革新与实践

本文由林睿（阿里飞猪）分享，经杜正海、Hoh编辑整理，并由DataFunTalk平台发布。文章探讨了旅行搜索技术从满足基本需求到集成高级功能的发展历程，特别是在阿里飞猪平台上的应用与创新。 ... [详细]

蜡笔小新 2024-12-14 08:56:16
function
黑客如何利用AI在暗网重建你的数字身份

随着技术的发展，黑客开始利用AI技术在暗网中创建用户的‘数字孪生’，这一现象引起了安全专家的高度关注。 ... [详细]

蜡笔小新 2024-12-12 17:45:26
function
吴恩达推出TensorFlow实践课程，Python基础即可入门，四个月掌握核心技能

量子位报道，deeplearning.ai最新发布了TensorFlow实践课程，适合希望使用TensorFlow开发AI应用的学习者。该课程涵盖机器学习模型构建、图像识别、自然语言处理及时间序列预测等多个方面。 ... [详细]

蜡笔小新 2024-12-08 17:26:10
function
百度服务再次遭遇技术问题，疑似DNS解析故障

近日晚间，百度多项在线服务出现加载异常，包括移动端搜索在内的多个功能受到影响。初步迹象表明，问题可能与DNS服务器解析有关。 ... [详细]

蜡笔小新 2024-12-26 12:52:25