程序員的未來屬於「偽代碼」！Nature專欄：用ChatGPT加速科研編程的三種姿勢

2023年05月11日05:36:12 科技 6139

新智元報道

編輯：lrs

【新智元導讀】chatgpt讓科研編程不再難！

基於生成式人工智慧工具，比如chatgpt、bard等聊天機器人的出現，以及如何將ai工具用於學術研究引發了巨大的爭議，但與此同時，ai生成的代碼用於科學研究的價值被忽視了。

與chatgpt生成文本導致的剽竊問題相比，用ai抄代碼顯然爭議更小，開放科學甚至鼓勵「代碼共享」和「代碼重用」，溯源起來也很方便，比如python里用到「import」導入依賴包就算引用。

最近nature上發表了一篇評論文章，作者團隊討論了chatgpt在科學編程領域的三個潛在能力，包括頭腦風暴、分解複雜任務、以及處理簡單但耗時的任務。

文章鏈接：https://www.nature.com/articles/s41559-023-02063-3

研究人員通過使用chatgpt將自然語言翻譯成計算機可讀代碼，探索了使用生成式ai來增強科學編碼的能力和局限性。

實驗中的例子主要探索了可能與生態學、進化及其他領域相關的通用任務，研究人員發現，使用chatgpt可以完成80%-90%的代碼編寫任務。

如果任務被分解成小的、可管理的代碼塊，並帶有精確的提示作為查詢，chatgpt可以生成非常有用的代碼。

值得注意的是，用google的bard進行同樣的實驗通常會得到類似的結果，但代碼中的錯誤更多，所以這篇文章主要使用chatgpt進行實驗。

第一作者cory merow是一位定量生態學家，主要研究方向是建立機制模型來預測人口和社區對環境變化的反應。即使是最好的數據集在預測全球變化反應方面也是不完善的，所以需要開發一些工具來結合數據源和探索數據集，以深入了解生物系統可能發生的變化。

chatgpt助力科學編碼

chatgpt以回歸模型gpt-3為基礎，在海量的網頁、書籍等文本上進行擬合訓練，不需要搜索即可生成文本。

所以chatgpt更擅長內插（interpolating，即預測與訓練數據相似的文本），而不擅長外推（extrapolating，即預測與訓練樣本不同的新文本）。

訓練集的龐大規模是一個優勢，意味著gpt-3已經看到了大量的語言模式，使其能夠內插並增加生成對人類有用回復的可能性。

不過對代碼生成任務來說，gpt-3並不知道如何編程，只是知道代碼看起來像什麼樣，以及哪些詞最可能出現在下一個位置，其工作原理類似於自動補全，基於概率模型預測下一個代碼塊（chunk），塊通常比詞（word）要小，也可以叫做token

生成正確token的概率基於所有token的概率乘積，即增加預測token的數量或降低選中token的確定性會增加任務的難度，從而降低獲得正確token的概率。

因此，想要增加正確token的概率，需要縮短生成任務的長度，或是提供更具體的指令。

最後，研究人員提醒，chatgpt生成的文本有些看起來像代碼，但可能無法執行，所以在編碼過程中需要仔細觀察調試。

頭腦風暴工具

chatgpt可以很好地檢索多個數據源，例如在生態領域可以同時獲取植物性狀、物種分布區域和氣象數據。

雖然chatgpt提供的數據有些是不正確的，但通過其提供的鏈接可以很快地校正這些錯誤。

不過chatgpt並不能寫爬蟲從網站上下載數據，可能是因為r語言的包和底層應用程序介面（如r訪問資料庫的協議）更新過快，畢竟chatgpt的訓練數據是在2021年構建的。

chatgpt可以在遇到特定問題時提出各種統計技術，在後續的提問中可以生成更多基於用戶假設的指導意見，並提供一份初始代碼。

不過綜合（synthesis）過程只適用於提出並交流想法，仍然需要通過傳統的數據源（如論文等）進行事實核查。

需要注意的是，一些網站聲稱chatgpt有能力對書籍寫摘要，不過從研究人員的測試結果來看，這種摘要綜合的結果完全不對，可能是因為測試用的書籍沒有在gpt-3訓練集中出現。

更難的任務需要更多的debug

chatgpt非常擅長生成模板代碼，在特定指令下提供一份包含少量函數的短腳本代碼。

比如下面的例子中，研究人員要求chatgpt將四個常用函數的輸入和輸出串一起。並提供一個將此函數用於模擬數據的示例代碼。

可以看到chatgpt生成的結果幾乎是完美的，調試代碼只花了幾分鐘，不過需要在提示中非常具體地說明query，包括提供命名和用到的函數。

研究人員發現，成功的關鍵在於：

1、將複雜任務分解成多個子任務，每個子任務最好只需要少數幾個步驟即可完成，畢竟chatgpt生成的代碼是基於概率文本預測模型的結果。

2、chatgpt在使用已經存在的函數時表現最佳，因為這時只涉及內插而非外推。

例如，使用正則表達式（regex）從文本中提取信息的代碼對於許多開發人員來說是非常困難的，不過因為已經有正則網站提供了大量在線示例，並可能出現在chatgpt示例中，所以chatgpt寫正則的性能還是不錯的。

3、學術界對chatgpt最大的批評之一是其信息來源缺乏透明度。

對於代碼生成任務，通過指定「命名空間」（namespace），即在使用函數時顯式調用包名可以實現一定程度的透明性。

不過chatgpt可能會直接複製個人的公開代碼而沒有引用出來，並且研究人員仍然有責任驗證正確的代碼歸屬人。

同時，如果要求生成更長的腳本會暴露出一些chatgpt的缺陷，例如偽造函數名或參數等，這也是stackoverflow禁用chatgpt生成代碼的原因。

但如果用戶提供了一組明確的執行步驟，chatgpt仍然可以生成一個有用的工作流模板，定義步驟之間的輸入和輸出之間的連接，這可能是用gpt-3外推生成新代碼的最有用的途徑。

目前chatgpt還不能將偽代碼（用簡單語言描述的演算法步驟）轉換為完美的計算機可執行代碼，但這可能離現實並不遙遠。

chatgpt對於初學者、不熟悉的編程語言來說特別有幫助，因為初學者只會寫一些較短的腳本，調試更方便。

chatgpt更擅長非創造性任務

chatgpt最擅長解決的是耗時的公式化任務，可用於調試、檢測和解釋代碼中的錯誤。

chatgpt在編寫函數文檔時也非常有效，例如使用roxygen 2的內聯文檔語法，在標識出所有參數及類上非常高效，不過卻很少解釋如何使用函數。

一個關鍵的限制是chatgpt的生成被限制在大約500個單詞，只能專註於較小代碼塊的生成，同時還可以生成單元測試以自動化確認代碼功能。

chatgpt給出的大多數建議在定義測試的結構和檢查預期的對象類方面是很有幫助的。

最後，chatgpt在對代碼進行重新格式化以遵循標準化（例如google）代碼樣式方面非常有效。

未來屬於偽代碼

chatgpt和其他人工智慧驅動的自然語言處理工具已經準備好將開發人員的簡單任務進行自動化，例如編寫短函數，語法調試，注釋和格式化，而擴展複雜性取決於用戶的調試意願（以及他們的熟練程度）。

研究人員總結了chatgpt在代碼生成上的功能，可以簡化科學領域的代碼編寫過程，不過人工檢查仍然是必要的，可運行的代碼並不一定意味著代碼能夠執行預期的任務，因此單元測試或非正式的互動式測試仍然至關重要。

在解決方案可能由人類開發，並由chhatgpt簡單複製生成的情況下，確保正確的代碼歸屬人至關重要。

目前已經有聊天機器人開始自動提供指向其來源的鏈接（例如，微軟的必應），儘管這一步還處於起步階段。

與傳統方法相比，chatgpt提供了一種學習編碼技能的替代方法，通過將偽代碼直接轉換為代碼，可以緩解編寫初始任務的障礙。

研究人員懷疑未來的進展將使用chatgpt這樣的工具來自動調試編寫的代碼，根據遇到的錯誤迭代地生成、運行和提出新代碼，在實驗過程中，研究人員發現糾正代碼的能力有限，只有在非常具體的指令針對小代碼塊時才會偶爾成功，調試過程的效率遠低於人工調試。

研究人員猜想，隨著技術的進步（比如最近發布的gpt-4模型，據稱比gpt-3模型大10倍），自動化調試將會得到改進。

未來即將到來，現在是開發人員學習提示工程技能以利用新興ai工具的時候了，研究人員預計，使用人工智慧生成的代碼將成為軟體開發各個方面越來越有價值的技能，這些技能是科學發現和理解的基礎。

參考資料：

科技

Google DeepMind 推出評估AI模型危險性的新框架 - 天天要聞

Google DeepMind 推出評估AI模型危險性的新框架

Google DeepMind 周五發布了一個框架，用於窺視人工智慧模型內部，以確定它們是否正在接近危險能力。周五發布的論文描述了這樣一個過程：每當用於訓練模型的計算能力提高六倍，或者微調三個月，DeepMind 的模型就會被重新評估。

05月18日 1454

安全漏洞讓CSC ServiceWorks的洗衣房服務可以無限免費用 - 天天要聞

安全漏洞讓CSC ServiceWorks的洗衣房服務可以無限免費用

加州大學聖克魯茲分校的兩名學生研究員亞歷山大-舍布魯克（Alexander Sherbrooke）和伊科夫-塔拉嫩科（Iakov Taranenko）發現了一個安全漏洞，該漏洞使 CSC ServiceWorks 運營的 100 多萬台洗衣機面臨免費贈送洗衣服務的風險。

05月18日 1491

OPPO Reno12 和 Reno12 Pro 官方圖片泄露包括所有顏色 - 天天要聞

OPPO Reno12 和 Reno12 Pro 官方圖片泄露包括所有顏色

昨天，OPPO宣布了Reno12和Reno12 Pro智能手機的正式發布日期 - 5月23日。同樣在昨天，該公司還發布了一些預告，曝光了這兩款手機的背面設計。今天，@evleaks（又名Evan Blass）為我們帶來了兩款手機的泄露官方圖片，以及它們將提供的所有顏色。

05月18日 1517

MMO卷到飛起的時候，騰訊做了一款「全國無代餐」的產品 - 天天要聞

MMO卷到飛起的時候，騰訊做了一款「全國無代餐」的產品

文/以撒我不知道MMO今年能不能「重新偉大」，我只知道今年一定會神仙打架。各家大廠各方面的努力，從此前鬧得沸沸揚揚的「MMO之癲」事件就可見一斑了。不難看出，雖然老產品穩的依然很穩，但MMO品類已經走到了一個新的節點，大部分廠商都在想方設法地求變。其中，騰訊的《塔瑞斯世界》可能是個定位很特別的存在。這款由樂動...

05月18日 1793

為何雷軍花100億造車大賣，而恆大砸700億卻輸得一塌糊塗？ - 天天要聞

為何雷軍花100億造車大賣，而恆大砸700億卻輸得一塌糊塗？

同樣是入局造車，恆大和小米為啥差距如此之大？恆大砸了700億，結果只造出了900輛，可謂是功虧一簣。而小米雷軍呢，只花了100億，就成功造出了熱銷的小米Su7，一上市就被搶購一空。據說年規劃產能達到一年15萬輛。

05月18日 1730

阿里公益助力，山西平順舉辦系列助殘活動，科技賦能開創美好未來 - 天天要聞

阿里公益助力，山西平順舉辦系列助殘活動，科技賦能開創美好未來

在全國助殘日之際，山西省平順縣政府攜手山西省博物院、阿里巴巴公益及魔豆媽媽，在平順縣特殊教育學校精心策划了一系列助殘活動，旨在鼓勵殘疾人群體更好地融入社會，共享和諧美好的生活。此次活動不僅為特殊教育學校的孩子們提供了一個展示自我、鍛煉才能的平台，更是展現了科技在助殘事業中的獨特魅力和巨大潛力。平順縣...

05月18日 9748

想要更快實現科技成果轉化？來成都這座「島」！系列支持政策出台 - 天天要聞

想要更快實現科技成果轉化？來成都這座「島」！系列支持政策出台

在成都，有一座科技含量滿滿的「島」，佔地1006畝、建築面積140萬平方米，總投資200億元。自2023年10月底試運營以來，這裡已累計策劃舉辦科創活動50餘場，發布科技成果394項，成為全市科技成果轉化有力有效的主平台。這就是成都科創生態島。5月18日，2024投資成都招商大會在成都召開。大會上，聚焦投資者最關心的產業基金、...

05月18日 3169

世界電信日|率先「點亮」京城，5G-A如何改變生產和生活 - 天天要聞

世界電信日|率先「點亮」京城，5G-A如何改變生產和生活

這兩天，北京的一些移動用戶驚喜地發現，自己手機上的5G圖標變成了5G-A圖標。記者了解到，北京移動於上個月啟動「5G-A點亮京城」行動。持有5G-A終端的用戶進入「點亮」區域後，就能感受5G-A技術帶來的超高速率。5G-A（全稱5G-Advanced，也被部分廠商稱作5.5G）是5G的增強，相較於5G，能夠在容量、速率、時延、定位等方面實...

05月18日 4839

人工智慧、深空宇宙、腦機介面……這場論壇帶你奔赴科技的星辰大海 - 天天要聞

人工智慧、深空宇宙、腦機介面……這場論壇帶你奔赴科技的星辰大海

5月17日「世界電信日」當天，2024搜狐科技年度論壇在北京舉辦。科技工作者與產業界領袖齊聚一堂，暢談人工智慧、深空宇宙、腦機介面等前沿科技，奔赴科技的星辰大海。　　本屆論壇線上線下結合，開啟了全天的思想盛宴。搜狐創始人、董事局主席兼首席執行官、物理學博士張朝陽在致辭中表示，「科學是人類智慧的發現，科技工...

05月18日 3034

雷軍在杭州親自交付小米SU7：握手、鞠躬、送花感謝每位車主 - 天天要聞

雷軍在杭州親自交付小米SU7：握手、鞠躬、送花感謝每位車主

快科技5月18日消息，今天早上8:30，雷軍開啟了一場超過3小時的連續直播，駕駛小米SU7 Pro從上海世紀大道附近開往杭州。在杭州交付中心，雷軍親自為5位車主交付了SU7。雷軍還是保持了一如既往的高格局，向每一位車主鞠躬、握手，並送上花束，不斷的感謝車主。不過因為場地受限，所以並沒有像在北京工廠的首批交付上親自為車...

05月18日 5369