程序员的未来属于“伪代码”！Nature专栏：用ChatGPT加速科研编程的三种姿势

2023年05月11日05:36:12 科技 6139

新智元报道

编辑：lrs

【新智元导读】chatgpt让科研编程不再难！

基于生成式人工智能工具，比如chatgpt、bard等聊天机器人的出现，以及如何将ai工具用于学术研究引发了巨大的争议，但与此同时，ai生成的代码用于科学研究的价值被忽视了。

与chatgpt生成文本导致的剽窃问题相比，用ai抄代码显然争议更小，开放科学甚至鼓励“代码共享”和“代码重用”，溯源起来也很方便，比如python里用到“import”导入依赖包就算引用。

最近nature上发表了一篇评论文章，作者团队讨论了chatgpt在科学编程领域的三个潜在能力，包括头脑风暴、分解复杂任务、以及处理简单但耗时的任务。

文章链接：https://www.nature.com/articles/s41559-023-02063-3

研究人员通过使用chatgpt将自然语言翻译成计算机可读代码，探索了使用生成式ai来增强科学编码的能力和局限性。

实验中的例子主要探索了可能与生态学、进化及其他领域相关的通用任务，研究人员发现，使用chatgpt可以完成80%-90%的代码编写任务。

如果任务被分解成小的、可管理的代码块，并带有精确的提示作为查询，chatgpt可以生成非常有用的代码。

值得注意的是，用google的bard进行同样的实验通常会得到类似的结果，但代码中的错误更多，所以这篇文章主要使用chatgpt进行实验。

第一作者cory merow是一位定量生态学家，主要研究方向是建立机制模型来预测人口和社区对环境变化的反应。即使是最好的数据集在预测全球变化反应方面也是不完善的，所以需要开发一些工具来结合数据源和探索数据集，以深入了解生物系统可能发生的变化。

chatgpt助力科学编码

chatgpt以回归模型gpt-3为基础，在海量的网页、书籍等文本上进行拟合训练，不需要搜索即可生成文本。

所以chatgpt更擅长内插（interpolating，即预测与训练数据相似的文本），而不擅长外推（extrapolating，即预测与训练样本不同的新文本）。

训练集的庞大规模是一个优势，意味着gpt-3已经看到了大量的语言模式，使其能够内插并增加生成对人类有用回复的可能性。

不过对代码生成任务来说，gpt-3并不知道如何编程，只是知道代码看起来像什么样，以及哪些词最可能出现在下一个位置，其工作原理类似于自动补全，基于概率模型预测下一个代码块（chunk），块通常比词（word）要小，也可以叫做token

生成正确token的概率基于所有token的概率乘积，即增加预测token的数量或降低选中token的确定性会增加任务的难度，从而降低获得正确token的概率。

因此，想要增加正确token的概率，需要缩短生成任务的长度，或是提供更具体的指令。

最后，研究人员提醒，chatgpt生成的文本有些看起来像代码，但可能无法执行，所以在编码过程中需要仔细观察调试。

头脑风暴工具

chatgpt可以很好地检索多个数据源，例如在生态领域可以同时获取植物性状、物种分布区域和气象数据。

虽然chatgpt提供的数据有些是不正确的，但通过其提供的链接可以很快地校正这些错误。

不过chatgpt并不能写爬虫从网站上下载数据，可能是因为r语言的包和底层应用程序接口（如r访问数据库的协议）更新过快，毕竟chatgpt的训练数据是在2021年构建的。

chatgpt可以在遇到特定问题时提出各种统计技术，在后续的提问中可以生成更多基于用户假设的指导意见，并提供一份初始代码。

不过综合（synthesis）过程只适用于提出并交流想法，仍然需要通过传统的数据源（如论文等）进行事实核查。

需要注意的是，一些网站声称chatgpt有能力对书籍写摘要，不过从研究人员的测试结果来看，这种摘要综合的结果完全不对，可能是因为测试用的书籍没有在gpt-3训练集中出现。

更难的任务需要更多的debug

chatgpt非常擅长生成模板代码，在特定指令下提供一份包含少量函数的短脚本代码。

比如下面的例子中，研究人员要求chatgpt将四个常用函数的输入和输出串一起。并提供一个将此函数用于模拟数据的示例代码。

可以看到chatgpt生成的结果几乎是完美的，调试代码只花了几分钟，不过需要在提示中非常具体地说明query，包括提供命名和用到的函数。

研究人员发现，成功的关键在于：

1、将复杂任务分解成多个子任务，每个子任务最好只需要少数几个步骤即可完成，毕竟chatgpt生成的代码是基于概率文本预测模型的结果。

2、chatgpt在使用已经存在的函数时表现最佳，因为这时只涉及内插而非外推。

例如，使用正则表达式（regex）从文本中提取信息的代码对于许多开发人员来说是非常困难的，不过因为已经有正则网站提供了大量在线示例，并可能出现在chatgpt示例中，所以chatgpt写正则的性能还是不错的。

3、学术界对chatgpt最大的批评之一是其信息来源缺乏透明度。

对于代码生成任务，通过指定“命名空间”（namespace），即在使用函数时显式调用包名可以实现一定程度的透明性。

不过chatgpt可能会直接复制个人的公开代码而没有引用出来，并且研究人员仍然有责任验证正确的代码归属人。

同时，如果要求生成更长的脚本会暴露出一些chatgpt的缺陷，例如伪造函数名或参数等，这也是stackoverflow禁用chatgpt生成代码的原因。

但如果用户提供了一组明确的执行步骤，chatgpt仍然可以生成一个有用的工作流模板，定义步骤之间的输入和输出之间的连接，这可能是用gpt-3外推生成新代码的最有用的途径。

目前chatgpt还不能将伪代码（用简单语言描述的算法步骤）转换为完美的计算机可执行代码，但这可能离现实并不遥远。

chatgpt对于初学者、不熟悉的编程语言来说特别有帮助，因为初学者只会写一些较短的脚本，调试更方便。

chatgpt更擅长非创造性任务

chatgpt最擅长解决的是耗时的公式化任务，可用于调试、检测和解释代码中的错误。

chatgpt在编写函数文档时也非常有效，例如使用roxygen 2的内联文档语法，在标识出所有参数及类上非常高效，不过却很少解释如何使用函数。

一个关键的限制是chatgpt的生成被限制在大约500个单词，只能专注于较小代码块的生成，同时还可以生成单元测试以自动化确认代码功能。

chatgpt给出的大多数建议在定义测试的结构和检查预期的对象类方面是很有帮助的。

最后，chatgpt在对代码进行重新格式化以遵循标准化（例如google）代码样式方面非常有效。

未来属于伪代码

chatgpt和其他人工智能驱动的自然语言处理工具已经准备好将开发人员的简单任务进行自动化，例如编写短函数，语法调试，注释和格式化，而扩展复杂性取决于用户的调试意愿（以及他们的熟练程度）。

研究人员总结了chatgpt在代码生成上的功能，可以简化科学领域的代码编写过程，不过人工检查仍然是必要的，可运行的代码并不一定意味着代码能够执行预期的任务，因此单元测试或非正式的交互式测试仍然至关重要。

在解决方案可能由人类开发，并由chhatgpt简单复制生成的情况下，确保正确的代码归属人至关重要。

目前已经有聊天机器人开始自动提供指向其来源的链接（例如，微软的必应），尽管这一步还处于起步阶段。

与传统方法相比，chatgpt提供了一种学习编码技能的替代方法，通过将伪代码直接转换为代码，可以缓解编写初始任务的障碍。

研究人员怀疑未来的进展将使用chatgpt这样的工具来自动调试编写的代码，根据遇到的错误迭代地生成、运行和提出新代码，在实验过程中，研究人员发现纠正代码的能力有限，只有在非常具体的指令针对小代码块时才会偶尔成功，调试过程的效率远低于人工调试。

研究人员猜想，随着技术的进步（比如最近发布的gpt-4模型，据称比gpt-3模型大10倍），自动化调试将会得到改进。

未来即将到来，现在是开发人员学习提示工程技能以利用新兴ai工具的时候了，研究人员预计，使用人工智能生成的代码将成为软件开发各个方面越来越有价值的技能，这些技能是科学发现和理解的基础。

参考资料：

科技

欧委会对微软发出警示可能因Gen AI风险信息缺失开罚数十亿美元 - 天天要闻

欧委会对微软发出警示可能因Gen AI风险信息缺失开罚数十亿美元

欧盟警告微软，根据该集团的在线管理制度 - 《数字服务法案》（DSA），该公司可能会被处以高达其全球年营业额 1% 的罚款，因为该公司未能对一项具有法律约束力的信息请求做出回应，而该请求的重点是其人工智能生成工具。

05月18日 1206

Google DeepMind 推出评估AI模型危险性的新框架 - 天天要闻

Google DeepMind 推出评估AI模型危险性的新框架

Google DeepMind 周五发布了一个框架，用于窥视人工智能模型内部，以确定它们是否正在接近危险能力。周五发布的论文描述了这样一个过程：每当用于训练模型的计算能力提高六倍，或者微调三个月，DeepMind 的模型就会被重新评估。

05月18日 1454

安全漏洞让CSC ServiceWorks的洗衣房服务可以无限免费用 - 天天要闻

安全漏洞让CSC ServiceWorks的洗衣房服务可以无限免费用

加州大学圣克鲁兹分校的两名学生研究员亚历山大-舍布鲁克（Alexander Sherbrooke）和伊科夫-塔拉嫩科（Iakov Taranenko）发现了一个安全漏洞，该漏洞使 CSC ServiceWorks 运营的 100 多万台洗衣机面临免费赠送洗衣服务的风险。

05月18日 1491

OPPO Reno12 和 Reno12 Pro 官方图片泄露包括所有颜色 - 天天要闻

OPPO Reno12 和 Reno12 Pro 官方图片泄露包括所有颜色

昨天，OPPO宣布了Reno12和Reno12 Pro智能手机的正式发布日期 - 5月23日。同样在昨天，该公司还发布了一些预告，曝光了这两款手机的背面设计。今天，@evleaks（又名Evan Blass）为我们带来了两款手机的泄露官方图片，以及它们将提供的所有颜色。

05月18日 1517

MMO卷到飞起的时候，腾讯做了一款“全国无代餐”的产品 - 天天要闻

MMO卷到飞起的时候，腾讯做了一款“全国无代餐”的产品

文/以撒我不知道MMO今年能不能“重新伟大”，我只知道今年一定会神仙打架。各家大厂各方面的努力，从此前闹得沸沸扬扬的“MMO之癫”事件就可见一斑了。不难看出，虽然老产品稳的依然很稳，但MMO品类已经走到了一个新的节点，大部分厂商都在想方设法地求变。其中，腾讯的《塔瑞斯世界》可能是个定位很特别的存在。这款由乐动...

05月18日 1793

为何雷军花100亿造车大卖，而恒大砸700亿却输得一塌糊涂？ - 天天要闻

为何雷军花100亿造车大卖，而恒大砸700亿却输得一塌糊涂？

同样是入局造车，恒大和小米为啥差距如此之大？恒大砸了700亿，结果只造出了900辆，可谓是功亏一篑。而小米雷军呢，只花了100亿，就成功造出了热销的小米Su7，一上市就被抢购一空。据说年规划产能达到一年15万辆。

05月18日 1730

阿里公益助力，山西平顺举办系列助残活动，科技赋能开创美好未来 - 天天要闻

阿里公益助力，山西平顺举办系列助残活动，科技赋能开创美好未来

在全国助残日之际，山西省平顺县政府携手山西省博物院、阿里巴巴公益及魔豆妈妈，在平顺县特殊教育学校精心策划了一系列助残活动，旨在鼓励残疾人群体更好地融入社会，共享和谐美好的生活。此次活动不仅为特殊教育学校的孩子们提供了一个展示自我、锻炼才能的平台，更是展现了科技在助残事业中的独特魅力和巨大潜力。平顺县...

05月18日 9748

想要更快实现科技成果转化？来成都这座“岛”！系列支持政策出台 - 天天要闻

想要更快实现科技成果转化？来成都这座“岛”！系列支持政策出台

在成都，有一座科技含量满满的“岛”，占地1006亩、建筑面积140万平方米，总投资200亿元。自2023年10月底试运营以来，这里已累计策划举办科创活动50余场，发布科技成果394项，成为全市科技成果转化有力有效的主平台。这就是成都科创生态岛。5月18日，2024投资成都招商大会在成都召开。大会上，聚焦投资者最关心的产业基金、...

05月18日 3169

世界电信日|率先“点亮”京城，5G-A如何改变生产和生活 - 天天要闻

世界电信日|率先“点亮”京城，5G-A如何改变生产和生活

这两天，北京的一些移动用户惊喜地发现，自己手机上的5G图标变成了5G-A图标。记者了解到，北京移动于上个月启动“5G-A点亮京城”行动。持有5G-A终端的用户进入“点亮”区域后，就能感受5G-A技术带来的超高速率。5G-A（全称5G-Advanced，也被部分厂商称作5.5G）是5G的增强，相较于5G，能够在容量、速率、时延、定位等方面实...

05月18日 4839

人工智能、深空宇宙、脑机接口……这场论坛带你奔赴科技的星辰大海 - 天天要闻

人工智能、深空宇宙、脑机接口……这场论坛带你奔赴科技的星辰大海

5月17日“世界电信日”当天，2024搜狐科技年度论坛在北京举办。科技工作者与产业界领袖齐聚一堂，畅谈人工智能、深空宇宙、脑机接口等前沿科技，奔赴科技的星辰大海。　　本届论坛线上线下结合，开启了全天的思想盛宴。搜狐创始人、董事局主席兼首席执行官、物理学博士张朝阳在致辞中表示，“科学是人类智慧的发现，科技工...

05月18日 3034