華為昇騰回應「大模型演示造假」:並非調取預置圖片

5月16日,針對網傳華為大模型文生圖現場疑似人工調取預置圖片的消息,華為昇騰社區回應稱,現場圖片為實時生成,調用的是開源大模型,並非調取預置圖片。

事件起源於5月10日的鯤鵬昇騰開發者大會,當時在一場面向開發者的技術討論會上,華為演示了mxrag sdk功能,展示如何通過十幾行代碼即可完成rag應用開發。

網傳視頻及聊天截圖顯示,華為在演示文生圖功能時,按下crtl-c中斷,顯示對應代碼為time.sleep(6),有網友解釋稱,代碼的意思是暫停6秒,然後調取預置圖片展示出來。

此消息一出,立刻引髮網友對技術能力真實性的討論。有部分觀點質疑,這是華為大模型能力演示造假,指控華為利用time.sleep(6)來模擬生成,實際是人工調取預置圖片。

網傳鯤鵬昇騰開發者大會現場圖片

針對網路上的質疑,昇騰社區回應稱,現場圖片為實時生成,調用的是開源大模型。代碼中有time.sleep(6)等表述,是命令等待讀取外部開源大模型實時生成的圖片,並非調取預置圖片。本次展示的均為真實代碼,也將在昇騰社區上開放,歡迎開發者使用並提出寶貴建議。

根據公開資料,mxrag的功能為檢索(retrieval)、增強(augmentation)和生成(generation)。這一能力是目前開發大語言模型(llm)所需的重要能力之一。

一些學術資料顯示,llm+rag被應用於包問答系統、聊天機器人、事實驗證、金融領域的決策支持等多個領域,未來還可以提高模型的可信度,開發多語言和多模態的ra-llms等。

儘管華為已公開回應,對於此次事件,網上多種觀點仍在辯論。

華為昇騰社區官網截圖

一些行業人士認為,time.sleep(6)可能是為了確保程序在演示過程中不會出現意外情況,而預設的一個緩衝步驟。這樣的做法在技術演示中並不少見,目的是為了展示過程的平穩和可控。

也有專家指出,大模型的計算和生成過程確實需要時間,而time.sleep(6)可能是為了展示模型計算的實際耗時。在ai領域,模型的計算速度是衡量技術先進性的重要指標之一。

但同時也有開發者認為,文生圖過程理論上「完全沒必要sleep(6)」。

截止目前,華為此次展示的mxrag sdk功能,還未在開發者資源下載中心上線。而由於昇騰社區暫未公布源代碼,開發者目前也僅能通過網傳代碼截圖進行經驗判斷和討論。

本文系觀察者網獨家稿件,未經授權,不得轉載。