劉濤 | 失聯的「蹤跡」：生成式AI圖像與圖像闡釋學的知識框架重構

2025年06月11日01:03:09 科技 1603

作為圖像學的主要流派，瓦爾堡學派將圖像置於藝術史脈絡中加以考察，由此形成了圖像闡釋學的基本知識框架。在傳統的圖像學那裡，圖像闡釋的主要對象是藝術圖像，而後續的圖像闡釋學，竭力地「追趕」各種新興的圖像形式。然而，這顯然是一項「未完成的工程」。隨著Midjourney、Runway、Sora等大語言模型的興起，一種新興的圖像「物種」——生成式AI圖像悄然誕生，並深度嵌入數字時代的圖像世界。區別於一般的技術圖像，生成式AI圖像是一種基於演算法生成的圖像。如何理解並闡釋生成式AI圖像，亟需進行圖像闡釋學的知識框架重構。劉濤教授的文章《失聯的「蹤跡」：生成式AI圖像與圖像闡釋學的知識框架重構》正是對此前沿問題的回應。文章以圖像闡釋學的三個基礎命題——「再現」「象徵」和「互文」為問題意識，批判性地反思生成式AI圖像對這三大問題的衝擊與挑戰，以此勾勒出智能時代圖像闡釋學的知識框架。作者提出「通用形象」這一原創性概念，認為應將演算法「黑箱」納入闡釋學的知識視域，從而揭示了語象和圖像在「計算」維度的通約可能。探索生成式AI圖像的闡釋理念、內涵與規則，有助於推進圖像闡釋學在智能媒介時代的知識體系重構。

——陳昌鳳清華大學新聞與傳播學院教授、博導

失聯的「蹤跡」：生成式AI圖像

與圖像闡釋學的知識框架重構

劉濤

暨南大學新聞與傳播學院教授、博導

原文載於《南京社會科學》2024年第8期

本文注釋略去

非經註明，文中圖片均來自網路

摘要

生成式AI圖像的興起，對圖像闡釋學帶來了巨大挑戰。唯有批判性地反思圖像闡釋學知識脈絡中的三大基礎命題——「再現」「象徵」和「互文」，才能重構人工智慧時代圖像闡釋學的知識框架。作為一種符號模式，「再現」揭示了世界對符號的依賴，亦揭示了圖像闡釋的語言基礎。如果說傳統圖像的再現之本質是及物性、摹仿性、鏡像性，生成式AI圖像則否定了圖像存在的再現基礎，也否定了圖像生產的再現語言，其本質上是不及物的、反再現的、生成性的圖像。Sora作為世界模擬器的意義，並不僅僅體現為對世界的視覺理解，更為深刻的裝置內涵在於形成了一套關於世界的「通用形象」，從而實現了文字之語象和圖像之形象之間的通約可能。相較於語言文本而言，建立在互文性基礎上的互文語境，為圖像闡釋提供了不可或缺的闡釋規則和錨定體系。然而，生成式AI圖像的出場，則宣告了伴隨文本的消亡，亦宣告了互文世界的坍塌，圖像不得不陷入一個沒有符號「蹤跡」的孤獨世界。

一、人工智慧時代的圖像闡釋學及其反思

人類文化的形成，離不開視覺秩序的構建，即通過發明和製造相應的圖像形式，建立一套理解世界的秩序系統。為了認識世界，「人類開始將世界看成客體，並基於此構建各類圖像——這也構成了這個時期的時代特徵」。作為圖像家族中的「進化」形式，現代圖像存在一個普遍而深刻的技術生成邏輯，並深度嵌入一個時代總體性的書寫模式。圖像中刻寫著時代的印記，也攜帶著媒介的語言，亦凝縮著思維的形式。從早期的傳統圖像，到後來的模擬圖像，再到當下的數字圖像，圖像的形式與命運已然嵌入技術演進的總體軌道——在技術驅動的圖像世界裡，人類走入圖像之中，並在圖像維度識別和發現不同的時代邏輯。因此，圖像、媒介與時代之間，存在著複雜的「共寫」模式，其結果便是形成了相應的文化形式及秩序。雷吉斯·德布雷（Régis Debray）以圖像和媒介為尺度，敏銳地發現了人類文明史上不同的「圖像時代」。

劉濤 | 失聯的「蹤跡」：生成式AI圖像與圖像闡釋學的知識框架重構 - 天天要聞

當圖像與媒介深度嵌入彼此的世界，圖像闡釋便亟需突破瓦爾堡學派（Warburg School）的「象徵依賴」，轉向「以媒介為方法」的圖像闡釋學。所謂「以媒介為方法」，即強調引入媒介的物質邏輯，將媒介從原本沉默的載體角色中「解救」出來，探討媒介技術對圖像表徵及其生成情景的配置方式，從而超越純粹的表徵結構，探尋由「物」及「圖」的意義「傳導」模型與機制。然而，媒介技術並非遵循統一的裝置原理，而是具有不同的媒介邏輯，由此形成了不同的圖像世界。即便是所謂的數字媒介或數字圖像，依舊因其裝置系統及程序語言的差異，呈現出不同的物質性內涵及媒介性特徵。

區別於web2.0時代的數字技術，當前的人工智慧（AI）技術已然超越了傳統的物質性內涵，亦超越了一般意義上的程序性邏輯。正是在技術變革的語境下，一種全新的圖像形式——生成式AI圖像已經全面闖入網路世界，其苦苦地追尋一切可能的應用場景，並深刻地改寫了「圖像時代」的底層規則。相較於一般意義上的數字圖像，生成式AI圖像作為一種典型的人工智慧生成內容（AIGC），不僅改寫了數字圖像的形成規則，而且改寫了圖像與技術之間的生成模型。Midjourney、DALL-E3、Stable Diffusion等AI繪圖工具的興起，已然宣告了生成式AI圖像時代的來臨。而Sora以其無與倫比的視頻生成能力，更是將生成式AI圖像的想像力推向了全新高度，由此，人們可以相對自由地想像世界，並形成關於世界的圖像。實際上，早在Sora誕生之前，類似的文字轉視頻、圖片轉視頻工具已經引起了廣泛的社會關注，如Runway除了基於提示語輸入、圖片輸入的AI視頻創作，還允許用戶調試並訓練自己的個性化視覺模型，以實現從文字/圖片到AI視頻的轉換與生成。需要特彆強調的是，本文所強調的生成式AI圖像，既包括靜態圖像，也包括動態圖像，即視頻文本。顯然，從AI繪圖到AI視頻，生成式AI圖像真正實現了「世界模擬器」的意義和功能——除了對世界圖像之「瞬間」的呈現，其更為深遠的意義便是突破了時間維度的束縛，賦予圖像以運動的屬性，由此實現了對世界「整體」的把握。

那麼，如何解釋生成式AI圖像這一新興的圖像「物種」，並反思人工智慧時代的圖像闡釋學？這一問題顯然難以從圖像自身的表徵體系中找到答案。唯有回到生成式人工智慧的技術規則及程序系統，從圖像形成的遊戲法則出發，才能真正重構圖像闡釋學在人工智慧時代的知識話語。基於此，本文主要以生成式AI圖像為研究對象，立足圖像闡釋的三個核心命題——闡釋本體維度的再現問題、闡釋語言維度的象徵問題、闡釋語境維度的互文問題，重點探討人工智慧時代圖像闡釋學面臨的核心問題及其理論進路。這三大命題直指圖像闡釋學的基礎問題，即圖像本體維度的「圖像攜帶了什麼」、圖像語言維度的「圖像如何呈現」以及圖像語境維度的「意義何以錨定」。相較於數字媒介時代的其他圖像形式，生成式AI圖像從根本上對上述三大問題發起了挑戰，這促使我們重新審視圖像闡釋學的理論話語。鑒於此，本文以圖像闡釋學知識脈絡中的三大基礎命題——「再現」「象徵」和「互文」為概念工具，批判性地審視傳統圖像闡釋學的闡釋困境，以期揭示人工智慧時代圖像闡釋學的核心概念範疇及其深層的知識話語。

二、生成AI圖像：從再現到生成

如何把握圖像與對象之間的指涉關係？像似性（iconicity）是一種基礎性的符號依據。作為一種典型的像似符，圖像在「像似」維度上確立符號與對象之間的關聯結構，並形成相應的指涉關係。由於像似性是圖像的第一符號屬性，圖像所「承載」的內容，必然指向圖像之外的世界，即那個「看上去如此」的外部對象。

（一）圖像、再現與摹仿

早在亞里士多德的《詩學》中，「再現」便被視為文藝作品的敘事基礎和意義原理，由此形成了再現的摹仿論，即文藝作品之所以能夠承載主題、傳達意義，根本上是因為其擁有一個基礎性的再現模型——摹仿世界。通過摹仿外部世界以達到認識世界的目的，是人類認識活動的重要途徑和方法。

圖像與世界的關係，根本上體現為符號學意義上的再現關係——圖像藉助一定的視覺語言，再現了事物的外在形態，亦再現了關於事物的理解方式，從而賦予事物一種符號化的感知和認識方式。符號學意義上的世界認知方式，存在不同的指涉邏輯，而圖像無疑提供了一種以像似性為基礎的再現模型。在威廉·弗盧塞爾（Vilém Flusser）的圖像哲學那裡，圖像被視為有意義的平面，其在本質上揭示了四維時空向二維平面轉化的可能。其中，轉化的語言和機制則是再現，尤其體現為對外部世界的再現。這裡的「外部世界」，不僅是指外部世界的客觀事物，亦指有關外部世界的觀念與認識。因此，摹仿作為圖像再現的本質，主體上體現為一種面向外部世界的「攝取」行為，最終「輸出」的是有關外部世界的視覺形態。相應地，圖像的再現之內涵，體現為藉助其他媒介對事物進行再次呈現或表達，以實現形式之臨摹、形態之描繪、性狀之顯示、徵兆之凸顯的意義「表徵」目的。

那麼，如何認識圖像所再現之「物」？這便需要回到圖像的符號本體維度加以考察。具體而言，之所以說圖像具有再現的意義潛能，是因為其擁有一個以外部世界的形式為基礎的參照框架，並能夠在此基礎上「抵達」世界的諸多意義面向。對於圖像符號而言，能指與所指之所以能夠建立一定的對應結構，是因為所指從概念維度揭示並演繹了能指的「像似」特徵或內涵。顯然，圖像的某些特徵或屬性投射到對象上，實現了圖像與世界之間的符號性勾連。

再現，作為一種符號模式，揭示了世界對符號的依賴，也揭示了圖像表意的符號基礎，亦揭示了圖像闡釋的語言基礎。圖像的再現機制可以從以下四個維度加以認識：一是圖像的再現對象，指向一個「看上去如此」的外部世界；二是圖像的再現語言，體現為基於視覺思維的表徵結構；三是圖像的再現模式，受制於媒介本身的技術邏輯及其設定的裝置規則；四是圖像的再現機制，本質上體現為一個以符號方法為基礎的符號學模型。儘管再現的闡釋依據是像似性，但是，「再現的相像並不是現實的複製品」。換言之，再現意味著一系列複雜的操作「語言」，其並非對外部世界的簡單臨摹，而是經由媒介裝置的調試與配置，最終「輸出」的是一種以摹仿為語義基礎的視覺系統或想像模型。相應地，圖像與世界的勾連，抑或圖像面向世界的抵達，主要依賴再現這一符號基礎，即藉助一定的視覺符碼，臨摹、描繪或刻畫世界的形式，以實現圖像指涉世界、圖像代替世界、圖像超越世界之可能。

（二）再現：圖像與世界的接合基礎

如果回到圖像的哲學「命運」中，再現便作為圖像揮之不去的「宿命」，伴隨著圖像的「生」與「死」。圖像無法直接代替世界，因而唯有訴諸再現的理念與手段，才能實現圖像對世界的象徵性把握。圖像在哲學史上的出場，始終未能擺脫「表徵的重負」——圖像無法直接捕捉真理，其對世界的把握，本質上是再現性的；而再現的對象，並非指向真理的宇宙，而僅僅是對現實世界有形之物的摹仿。因此，圖像的再現，往往被視為一種低級的臨摹，難以接近完美的理念，也難以抵達認識的本質。柏拉圖早在《理想國》中就已經闡釋了圖像的再現之本質，認為圖像的再現之「物」，乃是一個遠離真理的「摹本的摹本」。

柏拉圖肯定了圖像的再現之本質，只不過他否定了再現的意義潛能——圖像是對外部世界的再現，儘管這個「世界」遠離真理的世界，但其通過對外部世界的摹仿，成為真理在現實中投射的影子。從這個意義上講，早在古希臘哲學那裡，圖像便被置於一個再現結構中加以認識。而尼采開闢的理性主義批判傳統掀起了感覺主義「復活」的大幕，賦予圖像以「新生」，從而將圖像從低級的、從屬的、邊緣的、非本質的哲學「位置」中「解救」出來，使其具有積極的認識功能。圖像的「再現」之「宿命」延續至今，無論是古希臘的柏拉圖主義，還是尼采以降的現代西方哲學，都承認圖像的再現之本質，並以再現為認識起點，思考圖像深層的意義命題——只不過二者對再現之「內容」給出了不同的理解：前者認為圖像的再現能力僅限於對物的臨摹，無法打開理性的世界；後者則打通了圖像與理性之間的壁壘，認為圖像能夠再現更豐富的意義內容，並抵達觀念的世界。因此，無論沿著何種哲學脈絡切入，再現都是圖像研究的基礎問題，一切有關圖像的語言、功能、闡釋、實踐問題，本質上都是圍繞再現展開的，最終回應的亦是再現命題。

圖像的再現之本質，亦可以從弗盧塞爾的圖像哲學中找到類似的答案。弗盧塞爾在語言和圖像的關係中考察圖像，打通了圖像與概念之間的認識管道。如何認識圖像與世界的關係？弗盧塞爾給出了一個影響深遠的論斷：圖像是世界與人類之間的中介。而「中介」功能的實現，依賴於圖像形成的意義裝置——再現。由於人類存在於世界之中，世界包圍著人類，因此世界之於人類而言是陌生的，是難以直接把握的——不識廬山真面目，只緣身在此山中。唯有將世界投射到某個表面之上，成為目光的對象，世界才會獲得被識別、被認識之可能，而再現恰恰揭示了「投射」的內在語言。經由再現這一面向世界「進犯」的操作技術，世界被幻化為一種關於圖像的「縮影」，而「縮影」的「打開」方式，根本上取決於世界在人類面前的「再現」方式。

技術圖像的再現系統，已然超越了對現實經驗的直接描述，而上升為對經驗世界的重新配置與組裝。因此，圖像在符號學意義上的再現屬性，揭示了圖像的存在本質，亦揭示了圖像與世界的勾連基礎。可見，圖像從根本上揭示了世界被想像的方式，亦揭示了世界以圖像為「媒介」的感知方式。當世界被鏡頭推向遠處，成為目光盡頭的一個「縮影」——圖像時，圖像不再精確地指示世界，而是以畫布、銀幕、界面等存在形式，「不是把世界呈現出來，而是把它偽裝起來」。因此，圖像對世界的偽裝，恰恰建立在圖像的再現模型之上，並通過再現的方式加以實現。

（三）AI圖像：不及物的圖像

在圖像的表徵模型中，圖像具有及物性，即圖像始終在召喚對象，召喚外部世界的顯現。如同一個敞開的「容器」，圖像更像是外部世界投射在畫布上的影子，它並未如同文字一樣完全進入思維的世界，而是通過再現世界的方式，建立起與世界的聯繫。正是在及物性的意義上，圖像並非孤獨的存在物，世界也並未在圖像這裡終結；相反，圖像頑固地訴說著外部世界的可能「模樣」，嘗試在視覺與形式維度為外部世界提供一種闡釋的「鏡像」。同樣，正因為及物性深層的連接和接合屬性，圖像不僅具有召喚對象「出場」或「顯身」的能力，而且展現出模仿甚至代替世界的念頭和潛能。如果說及物性揭示了圖像在符號學意義上的本體屬性，即圖像以像似性為基礎的指示能力，那麼，薩特則關注圖像的純粹否定之特性，從而發現了圖像的另一種及物性內涵，即通過對時空的凝縮，發現並呈現事物的純粹物性。概括而言，圖像的及物性，揭示了圖像的再現之本質——既體現為超越畫框之限制，對外部世界進行指示性再現，也體現為將事物從時空限制中「解救」出來，對純粹物性加以還原與再現。

如果說再現的符號前提是圖像的及物性，生成式AI圖像則意味著一種全新的圖像觀念——不及物的圖像，其特點便是通過終止與外部世界的聯繫，從根本上否定圖像形成的再現基礎，也拒絕圖像表意的再現機制。在傳統圖像那裡，外部世界既是再現的摹仿對象，也是再現的參照坐標，亦是再現的神秘幽靈。而生成式AI圖像則徹底顛覆了圖像的再現之本性——圖像不再向外部世界敞開，其目的並非激活或召喚外部對象，它從演算法「黑箱」中走來，並從演算法裝置中獲取闡釋的資源。概括而言，傳統圖像的再現本質體現為及物性、摹仿性、鏡像性，而生成式AI圖像則背離了圖像存在的再現基礎，也否定了圖像生產的再現語言，其本質上是不及物的圖像，是反再現的圖像，是生成式的圖像。如果說傳統圖像從誕生的那一刻起，便毫無防備地進入媒介與傳播的轄域，進入主體意圖的接管視域，它苦苦地尋找著意義的歸宿，最終「回到家鄉」，那麼，生成式AI圖像則是「離家出走」的圖像，它割棄了外部世界的「牽掛」，進入一個「咒語」瀰漫的神秘世界——這是一個沒有語法的世界，是一個需要「獨自」面對的神秘世界，一切都處於永不停息的生成之中，變動不居，無「章」可循。

實際上，「生成」揭示了生成式AI圖像有別於再現性圖像的本體特徵——「再現」是語言性的，是符號性的，是可溯源的，是有蹤跡的，是可以藉助某種符號理據加以識別和理解的；相反，「生成」則拋棄了再現所預設的認識框架，其斷然否定並拋棄了語言、秩序、模式、對象、結構維度的知識話語，轉而迫使人們接受演算法「黑箱」的合法位置，並承認圖像本身之於闡釋活動的自主性。

在生成式AI圖像這裡，外部世界已不再是圖像的故鄉。圖像在「咒語」的「挾持」下出場，並隨著「咒語」的變化而「舞動」，最終因「咒語」的消失而獲得自由。進一步講，生成式AI圖像動搖了圖像得以存在的外部秩序，也否定了圖像得以解釋的語言規則，更拋棄了圖像得以出場的媒介遊戲。這使得圖像不再指向外部世界，也不再依賴於某個外在的參照對象而存在，它在圖像哲學意義上意味著一種由「內」而「外」的生成之「物」。比如，生成式AI圖像的闡釋，脫離了傳統圖像闡釋學所依賴的表徵、語言、象徵、意象等符號系統或修辭系統，轉而以大語言模型的深度學習系統為基礎，直接生成了一種「關於圖像的圖像」。大語言模型的演算法「黑箱」，切斷了一切來自外部的線索與想像——至少是人類意識、語言和思維難以捕捉的，並在圖像的「內」與「外」之間划出了一道嚴格的分割線——圖像「內部」乃是演算法「黑箱」，是「圖像自身」，是不為外界所知的「程序慾望」，這裡涌動著永不枯竭的生成能量，為圖像源源不斷地提供能量補給；圖像「外部」則是一個孤獨的世界，一個被圖像放逐的世界，這裡不再是圖像的故鄉，也不再為圖像提供太多的解釋語言，反而等待著圖像的「救贖」。

三、「通用形象」的誕生：

文字何以成為圖像？

關於圖像與對象之間的關係，目前學界討論較多的是模仿論、反映論、模擬論和代替論，其分別揭示了圖像維度的世界認知方式。作為一種符號形態，圖像不僅能夠再現事物的特徵與形態，而且擁有代替事物的潛能——立足「像似」基礎，依據「想像」模式，發生在「跨域」維度，最終體現為一種由此（圖像）及彼（事物）的隱喻模式。

相應地，圖像的想像力亦體現為圖像的象徵能力——當圖像的意指內容指向某種暗指意義，如話語、意識形態、文化母題等象徵意義時，圖像與外部世界的關係便呈現出巨大的接合潛能。在圖像符號系統中，象徵往往是以隱喻為基礎，只不過其內涵指向某一規約性的符號意義。作為圖像意指的含蓄意指，象徵意義必然是符號性的，是話語性的，是修辭性的。對於生成式AI圖像而言，無論是文本生產方式，抑或是意義傳達機制，都超越了以外部世界為參照的再現模式，也超越了傳統再現結構中的視覺語法邏輯，那麼，如何理解圖像闡釋中的象徵問題，又如何認識圖像對畫外空間的「打開方式」？這便需要回到象徵發生作用的心智基礎——想像（imagination）維度，以文字和圖像的關係為考察對象，重新審視生成式AI圖像的想像力。

（一）象徵：概念的形式

圖像並非一個絕對的封閉系統。在圖像的畫框之外，必然存在一個畫外，而圖像闡釋的基本思路便是竭力地召喚「畫外」的世界。相對於「畫內」的秩序和結構，「畫外」永遠是想像性的——至少需要藉助想像加以「填充」或「延伸」。

想像力是人存在的基本條件。離開想像力，意義的生產與秩序將無從談起。相對於語言的想像機制，圖像在符號維度的像似性特質，決定了想像之於圖像闡釋的思維基礎。圖像中的二維平面之所以具有表達四維時空的能力，根本原因在於圖像儲存、釋放意義的發生基礎是想像力。在弗盧塞爾看來，想像既是思維層面的概念，也是一種基本的圖像「技術」，具體包括圖像繪製的技術和圖像解讀的技術。相較於語言文字的實指性，圖像的虛指性決定了想像在圖像認知中扮演著極為重要的協調角色，即將現實時空關係「描繪」成二維平面關係，以想像關係代替現實關係，從而實現世界在圖像維度的「成像」。想像的結果便是創造了一種特殊符號，使圖像從原始的符號疆域中掙脫出來，成為一種象徵，由此實現了圖像形態與意義概念的連接。

圖像闡釋是以想像為思維基礎的。無論是認識維度的圖像思維，或是語言維度的圖像語法，抑或是實踐維度的圖像修辭，實際上都是在想像的基礎上確立了圖像認知的理據性與合法性。魯道夫·阿恩海姆將想像上升為一種視覺思維形式，並給出了「視知覺具有思維力」的論斷，從而彌合了感性與理性、感知與思維、藝術與科學之間長期存在的認知斷裂。

既然想像力在圖像形成及表達中發揮著至關重要的作用，那麼，何為人工智慧的想像力，又如何理解生成式AI圖像的想像力？有別於傳統圖像的想像方式，AI圖像既是提示語「輸出」的產物，也是從大語言模型中突然「降臨」的產物。因此，我們可以沿著兩個維度認識AI圖像的想像力：一是從語言和圖像的關係維度，認識AI圖像在回應語言與概念維度的「圖繪」潛能，即「圖繪概念」的想像力；二是立足演算法「黑箱」的技術裝置邏輯，探討AI圖像「無」中生「有」的「創造」潛能，即「創造世界」的想像力。

一方面，就「圖繪概念」而言，AI圖像的生成主要依據的是計算模型，當用戶輸入指令時，大語言模型瞬間開啟「思考」的開關，在語言「輸入」與圖像「輸出」之間尋求最優的匹配方式。必須承認，傳統圖像的想像力主要體現為德勒茲所說的第二種畫外空間的召喚及顯現能力，尤其體現為視覺象徵維度的概念生成，即以圖像為「媒介」，實現意指概念的生產。從圖像到概念的認知形成，依賴於視覺修辭維度的象徵實踐，常見的修辭策略是通過激活特定的視覺意象或視覺框架，打開形象之外的意義內涵。相較於傳統圖像對現實的摹仿，生成式AI圖像轉向了對現實的理解——這種理解是符號性的，是象徵性的，尤其是概念性的。在AI圖像的生成鏈條中，一端是用戶輸入的提示語（prompt），另一端是關於提示語的象徵形式。換言之，AI圖像最終形成的是一個概念的形式世界，其本質上體現為以概念為認識基礎所創建的一種「圖示」形式。以Sora為代表的大語言模型通過對其他海量圖像的訓練與理解，一方面以圖像為工具，形成現實認知的圖像關係，並在此基礎上形成相應的概念體系，另一方面以計算為方法，搭建概念與圖像之間的擬合模型，以探尋概念可能「釋放」的圖像形式。因此，AI圖像的想像力，主要體現為圖像對於提示語及其概念邏輯的理解能力，即圖像註解概念、圖示概念、還原概念的象徵能力。如果說一般的數字圖像主要以程序為控制基礎，即根據「輸入」的條件，啟動相應的程序配置，以實現特定的「輸出」功能，那麼，生成式AI圖像則呈現出一種全新的生成邏輯，其依託語言維度的提示語之描述方式，形成可能的「概念之形式」。

在Sora的運作機制中，圖像生產並非完全受制於程序的控制結構，而是依賴於人機之間的協作模式——人類通過輸入並調試相應的提示語，不斷「試探」大模型的輸出方式，以尋找人類認識與模型反饋之間的擬合模型與匹配模式，從而在人機協作中實現AI圖像的「圖繪概念」之功能。簡言之，傳統圖像的想像力主要體現為從圖像中識別和發掘出概念的象徵能力，即「從圖像到概念」的修辭能力；而生成式AI圖像的想像力則更多地體現為圖像在「概念之形式」維度的象徵能力，即「從概念到圖像」的闡釋能力。

另一方面，就「創造世界」而言，如果說傳統的技術圖像輸入的是現實之「信號」，輸出的是現實之「景觀」，那麼，輸入和輸出之間的信息處理方式，本質上遵循的是裝置語言——攝影機的機械馬達，決定了膠片的「轉動」速度及「展開」方式，由此形成了一種基於「視覺殘留」機制的成像方式。無論是攝影機的畫格累積，或是攝像機的掃描成像，技術圖像本質上是對世界的一種編碼方式。而早在圖像被「輸出」之前，技術裝置就已經默許了世界的形式與意涵，完成了圖像的概念化「操作」。正因如此，技術圖像是按照概念的邏輯被組織的，最終輸出的是一種有關概念的圖解模式。

必須承認，在弗盧塞爾的技術圖像理論那裡，圖像的模仿之「源」主要是現實，或者是現實「投射」之形象。然而，生成式AI圖像則背離了圖像的摹仿本性，其通過對海量圖像資源的深度學習，掌握了圖像構成的一般規律，從而在提示語的「激活」和「引導」下，按照大模型的計算「語言」生成世界的可能形式。具體而言，傳統的技術圖像依然受制於外部世界的束縛，圖像的想像方式主要體現為以「現實」為原點或基模的一次「遠眺」——無論是紀實圖像對現實世界的精準反映，或是藝術圖像對現實的自由聯想，抑或是數碼圖像對現實的虛擬模擬，實際上都未能徹底擺脫現實的影子。然而，作為深度學習的產物，AI圖像與生俱來的計算性，能夠將想像的方式引入一個智能化的計算世界——圖像內部的要素以何種方式組合，形成何種布局與結構，產生何種符號後果，已然超越了現實維度的事實性特徵，亦超越了藝術維度的聯想性原則，轉而指向一種以可能性為基礎的合理性原則。因此，如果說電子圖像模擬的是外部世界的構成形式，生成式AI圖像則是對外部世界之組織法則和運動規律的模擬，是對語言模型的模擬。從這個意義上講，生成式AI圖像意味著一種全新的關於世界的想像方式，其超越了傳統圖像所遵循的神學想像圖式，亦超越了電子圖像的奇觀想像圖式，進而從圖式的元語言出發，揭示了圖式之所以能「生髮」圖像、「派生」圖像、「配置」圖像的元圖像（meta-image）屬性。

（二）Sora的世界：語言的「通用形象」

生成式AI圖像無疑完成了一項神奇的符號「轉碼」工程，即創造了一種從語言到圖像的想像方式，由此實現了二者的象徵性勾連。兩種事物之所以能夠建立一種由「此」及「彼」的想像關係，根本上是因為二者之間的相似性被發現了，從而形成了一種以相似性為思維基礎的想像關係。文字和圖像原本屬於不同的符號域，彼此之間的意義「交換」主要是通過語圖之間的互文語境來傳遞並實現的。然而，生成式AI圖像所實現的「轉碼」工程——從概念到形式的轉換，根本上依賴於「形象」的發明，即通過發現圖像和概念之間的相似性聯繫，形成意義交換的想像空間——文字對特定想像「形式」的召喚與圖像對特定意義「概念」的建構，發生在同一想像模式中，並且在二者的「協商」中，實現了彼此之間的連接和通約。

那麼，作為分屬異質範疇的事物，文字和圖像之間究竟存在何種相似性？大語言模型又是如何基於這一相似性實現從語言到圖像的「轉換」工程？唯有找到文字和圖像之間的通約基礎，才能真正搭建文字和圖像之間的溝通「媒介」。必須承認，無論是從語言到圖像的轉換，抑或是從圖像到語言的闡釋，都離不開連接關係得以建立的共享符碼——形象。如果說圖像是物質性的，其中儲存著關於外部世界的物性，形象則是一個精神範疇的概念，其具有頑強的繁衍和克隆能力，存在於圖像之中，流動於媒介之間，生生不息。

實際上，「圖像轉向」之所以掀起了一場「圖像取代詞語」的浪潮，根本上是因為形象之生命力，已然超越了文字的流通與增殖能力，並主導了一個時代的想像模式，以至於對語言的理解和認識，在某些情況下不得不訴諸形象。而所謂的「語象」，不僅意味著一種有關語言的視覺形式，而且已然上升為一種符號圖式，揭示了語言對形象的深深依賴。米歇爾將指出，「語言和寫作本身也是兩種媒介，一種以聲音形象獲得實體，另一種則以圖形形象獲得實體」。不難發現，在語言這裡，形象提供了一種意義的「展開」方式；而在圖像這裡，形象揭示了文本的想像模式。正因如此，形象作為文字和圖像之間的交換「貨幣」，扮演著積極的「媒介」角色，其功能便是實現了二者之間的過渡與轉換。

因此，考察從文字到圖像的轉換模式，必須聚焦於「形象」的「媒介」機制，如此才能真正揭示生成式AI圖像的形成原理。儘管人工智慧遵循的是一種計算邏輯，其對於形象的理解顯然不同於人類的思維模型，但作為一個生成性的程序裝置，大語言模型的深度「學習」，必然體現為對圖像之形象的「學習」，最終的「訓練」結果則指向某種「形象的秘密」，尤其體現為文字與圖像進行轉換的加工模式，如圖式和意象。作為典型的形象之「形式」，圖式和意象更像是一個生成模型，其中儲存著圖像的「內部語言」，如圖像構成的機制、規律、要素關係等，因此能夠源源不斷地「釋放」出相應的圖像形式。在當前的大語言模型中，為了最大限度地還原提示語的指涉內涵，創作者往往需要採用更為細緻的描述方式，如精準地表述畫面的風格與色調，精確地描繪畫面中的要素結構和關係，翔實地描述主體的運動方式和過程，等等，以此最大限度地捕捉語言之形象，實現圖像維度的形象還原，從而完成從形象到圖像的視覺「繁衍」。

區別於一般的自動化程序裝置，Sora賦予了主體更為自由的調試空間和想像權力——如同「咒語」所打開的魔法世界，提示語本質上服務於形象的生產，以形成關於世界的想像方式。這裡的想像方式，主要體現為一種隱喻模式，即在文字和圖像之間識別並確立一種相似性聯繫，並將這種相似性轉化為一種共享的視覺圖式、意象等視覺形象，由此以形象為「媒」，打通文字和圖像之間的通約「路徑」。即便是當前備受關注的「讓老照片動起來」這一圖像轉視頻應用模型，本質上依舊是在語言「咒語」的提示下，賦予圖像一定的時間寬度和運動屬性，以復原「曾經」的場景。

實際上，每一次提示語的變化，都意味著對大模型參數的調整，其結果便是形成語言的「通用形象」（general image）。正因為「通用形象」的形成，文字之「語象」和圖像之「形象」之間不僅具有轉換之可能，而且具有通約之「語言」基礎。經由無數開發者的探索和實踐，目前網路上出現了一系列有關Midjourney、Stable Diffusion等大語言模型應用的風格代碼「咒語」，用戶只需複製相應的代碼，便可以得到理想的視覺風格。顯然，這些「咒語」的標準化生產，預示了語言的「通用形象」愈發穩定與成熟。因此，Sora作為世界模擬器的意義，並不僅僅體現為對世界的視覺理解，其更為深刻的內涵在於藉助演算法「黑箱」，形成一套關於世界的「通用形象」——人們以形象的方式「圖解」世界的可能形式，亦在「語像」維度建構了一套通用的視覺形式。相應地，語言與圖像的接合，逐漸擺脫了符號學意義上的意指模式，而沿著演算法邏輯展開，在彼此之間的反覆試探中，以「通用形象」的生產為方法，形成了相對穩定的通約「語言」。

四、不可見的符號「蹤跡」：

互文世界的坍塌

傳統圖像存在一個確定的出場方式——無論是藝術圖像，還是電子圖像，抑或是數碼圖像，都不可避免地攜帶著某種相對穩定的「出廠設置」。其作為圖像闡釋的元語言，不僅決定了圖像闡釋的基礎語言和規則，而且深刻地影響著圖像可能的「命運」軌跡。換言之，圖像從何處來，到哪裡去，服務於何種功能和目的？這些問題早在圖像誕生的那一刻，便如同一種視覺「基因」，刻寫在圖像的語言深處——待到圖像闡釋之際，這些潛藏在圖像深處的符碼、因素、線索，便會被「召喚」出來，作為一種頑固的解釋「力量」或闡釋「條件」，限定了圖像的意義方向。

傳統的圖像闡釋學賦予了語境極大的闡釋效力，認為圖像闡釋高度依賴於圖像所處的語境關係。相對於語言文本而言，圖像闡釋依賴於一定的錨定體系，不同的「錨定」方式，決定了不同的圖像闡釋方式。如果說語言文本闡釋具有相對的確定性，那麼，圖像文本與生俱來的符號特徵，使得其意義闡釋具有更大的浮動性與不確定性。這便需要藉助語境加以錨定，以確立圖像闡釋的意義起點和可能方向。

（一）互文語境：圖像闡釋的錨定體系

圖像闡釋包含三種常見的語境形態，即文化語境、情景語境和互文語境。作為一種基礎性的語境形態，互文語境從根本上揭示了文本的存在方式，亦揭示了闡釋行為所依賴的意義規則。具體而言，任何一個文本的存在與出場，都不可避免地攜帶著其他文本的「痕迹」與「影子」，並在與其他文本的互文關係中，獲得了來自外部的闡釋「線索」。這些為文本闡釋提供「資源」的文本形式便是符號學意義上的伴隨文本（co-text）。因此，所謂的互文語境，即是文本與其伴隨文本所搭建的文本網路與意義世界。

作為圖像闡釋的資源或線索，圖像的伴隨文本並非外部「闖入」的偶然因素，而是攜帶著一種規約性的闡釋「語言」，那裡儲藏著某種普遍的闡釋「密碼」。可以想像的是，離開彌散在圖像周圍的伴隨文本，圖像闡釋註定是艱難的，甚至是不可能的。正是在伴隨文本及其搭建的互文語境之中，圖像汲取生產的靈感與養料，也獲得了闡釋的依據和資源，最終在互文語境這裡獲得圖像闡釋所必需的錨定體系和符號規則。

區別於傳統圖像相對穩定的規約體系，生成式AI圖像的演算法「黑箱」，否定了符號學意義上的互文關係，亦否定了互文語境之於圖像闡釋的基礎性決定意義。比如，傳統圖像所攜帶的作者「印記」，已經難以在AI圖像那裡找到一定的「蹤跡」。按照作者論的基本假設，傳統文本那裡儲藏著一定的作者意圖和作者身份，其賦予了文本闡釋一定的背景信息和解讀視角。然而，作者論成立的前提是，文本的作者具有明確的指向性，即作者是存在的，作者意圖是可辨識的，作者身份是可識別的，作者風格也是可探尋的。作為一種典型的伴隨文本，作者在文本中的「復活」，賦予文本闡釋極為重要的闡釋依據。然而，建立在提示語基礎上的生成式AI圖像，則拒絕圖像生產的「作者」主體及其攜帶的「人格」底色。因此，任何嘗試通過作者這一伴隨文本來尋找闡釋「線索」的努力，在AI圖像這裡註定是無力的、徒勞的。

（二）深度「學習」：互文的幻象

互文語境形成的前提和基礎，乃是與圖像有關的其他信息在文本這裡的「闖入」或「顯現」。這些來自其他文本的互文信息，一方面攜帶著圖像闡釋不可或缺的破譯信息，另一方面構築了圖像闡釋必不可少的外部語境。

相反，生成式AI圖像對其他圖像的「接納」是有限的：它從互文世界中「抽身」出來，一方面拒絕圖像闡釋的互文語境，另一方面否認其他圖像對於闡釋行為的影響。如果說傳統圖像存在於互文語境之中，其闡釋過程離不開伴隨文本的在場，那麼，生成式AI圖像則宣告了互文語境的坍塌以及互文世界的衰落——由於一切都在演算法「黑箱」中默默地發生，AI圖像被推向一個「與世隔絕」的裝置系統之中，在那裡接受大語言模型的計算與調試，並形成了一種遠離其他圖像的圖像形式。無論是文本生成過程，還是意義闡釋方式，生成式AI圖像已然走出了互文世界，它隔斷了與外界的聯繫，也隔斷了與其他圖像的互文鏈條，從而將自身的「命運」完整地交給了演算法、程序與代碼。當演算法主導了AI圖像的內部「語言」時，其他圖像不過是平行世界中的「風景」，無聲地注視著AI圖像的自我指涉及魔幻表達。因此，生成式AI圖像離開了外部世界的牽制，也跳出了與其他圖像的互文結構，最終形成的並非外部世界的「鏡像」，亦非其他圖像投向「黑箱」的「影子」。

誠然，生成式AI圖像的形成，依賴於對其他圖像的深度學習，而常見的「學習」思路便是從其他圖像那裡汲取「養料」，但是，這一面向其他圖像的「學習」過程，是否依舊意味著一種互文關係？唯有重新認識AI圖像與其他圖像之間的關係，才能真正理解互文性之於圖像闡釋的適用性問題。儘管AI圖像的訓練模型建立在海量的圖像基礎之上，並依靠演算法加以實現，但一個不爭的事實是，深度學習的過程，並非對其他圖像之外在形式的簡單模仿，而是體現為以其他圖像為「媒介」，獲取世界構成之奧秘，最終在圖像維度形成關於世界之內涵與本質的理解模式。Midjourney、Runway、Sora、Genie、Pika的「記憶」里，儲存著關於世界之本質的「圖像密碼」——散落在網路世界的其他圖像「碎片」，僅僅參與大語言模型的訓練過程，而一旦訓練完成，它們的使命便宣告終結，如同「數字棄兒」一般被大模型拋棄，重返互文世界，回到「塵世」之中，回到原初的網路「位置」。

區別於互文理論所預設的文本之共同在場或意義之雙向流動，生成式AI圖像與其「學習」對象——散落在網路世界的其他圖像——之間的關聯，僅僅是一種單向的、微弱的、易逝的關聯。例如，Sora的擴散模型（diffusion models）超越了早期的循環網路（RNN）或生成對抗網路（GAN）。具體而言，GAN的基本原理是機器對人的模仿，即通過對其他圖像的機械模仿而達到相應的「創作」水平；相反，Sora的擴散模型則旨在實現「像人一樣思考」，其通過對模型的反覆調試和訓練，掌握相應的構圖規律、要素關係、時空結構等，並在此基礎上形成關於世界的理解模式，如關於「美」「恐怖」「和諧」等概念的圖式。

因此，Sora的訓練方式並非停留在簡單的圖像「創作」層面，而是要成為一個會「創作」的「人」，這便從根本上否定了生成式AI圖像與其他圖像之間的互文關係。具體而言，AI圖像與其他圖像之間並不存在一個可辨識、可互通、可通約的意義管道，人們難以從生成式AI圖像的再現結構中，識別出其他圖像的「影子」，也難以將其視作互文意義上的闡釋「線索」。其他圖像對於Sora的「貢獻」，僅僅體現為模型層面的數據關係，最終影響的是模型的參數和指標。在其他圖像離場的那一刻，Sora便作為一個獨立的演算法裝置，依靠提示語的「輸入」實現圖像內容的生成。

之所以說生成式AI圖像擺脫了互文關係的束縛，還有一個重要的原因在於：大語言模型的訓練數據，除了散落在外部世界的圖像，還包括模型本身生成的圖像素材，這使得建立在「投喂」和「訓練」基礎上的圖像關係及其深層的數據系統，超越了簡單的「學習」和「模仿」維度，而呈現出互文理論難以解釋的複雜內涵和過程——圖像的「輸入」過程，表面上是以「學習」的名義建立了一種互文性的作用結構，但實際上卻是一種互文的幻象。在AI圖像這裡，我們已經無法在漫無邊際的網路世界中精準地識別出大模型的「學習」對象，更無法識別出闡釋學意義上的符號「蹤跡」。換言之，網路世界的其他圖像，對於AI圖像而言並不具有伴隨文本的意義，其無法在互文維度協助生成式AI圖像實現圖像「出場」的溯源、圖像「語義」的錨定，以及圖像「命運」的追蹤。概括而言，當演算法「黑箱」主導了大語言模型的「學習」過程時，生成式AI圖像與其他圖像之間的關聯，實則被牢牢地捆綁在計算與代碼維度而非認知與意識向度——其他圖像並未為AI圖像帶來闡釋維度的錨定、限定、理解方式，相反，其意義僅局限於模型訓練的參數和指標維度，以賦予「圖像成為圖像」之可能。

概括而言，在演算法「黑箱」的衝擊下，建立在再現、象徵與互文基礎上的圖像闡釋學迫切呼喚知識話語的拓展與創新。唯有以再現、象徵、互文為概念工具，批判性地審視生成式AI圖像所面臨的闡釋困境及打開的知識話語空間，才能真正把握圖像闡釋學知識體系中的「變」與「不變」。具體來看，就闡釋本體維度的再現問題而言，生成式AI圖像的形成基礎是生成而非再現，因此，圖像闡釋亟需超越再現維度的符號表徵邏輯和視覺語言體系，回到「生成」這一圖像之本體屬性，從而以圖像的「自我指涉」為認識基礎，重構圖像與世界之間的認識關係；就闡釋語言維度的象徵問題而言，生成式AI圖像通過對「通用形象」的生產，調和了文字和圖像之間的矛盾，也賦予了二者一定的通約基礎，從而回答了「概念何以成為圖像」這一理論命題；就闡釋語境維度的互文問題而言，生成式AI圖像從互文性的意義規則中「逃逸」出來，擺脫了外部圖像對闡釋活動的限定與影響，由此呼喚一種全新的圖像闡釋規則。需要特彆強調的是，當不可知的、失去「蹤跡」的、沒有「語法」的演算法「黑箱」已然成為AI圖像的裝置基礎時，如何賦予演算法「黑箱」一定的理論位置，即將其納入闡釋學的知識框架中加以研究，無疑是人工智慧時代圖像闡釋學不得不回應的理論命題。

（原文為2.4萬字，文本系節選內容，詳細論述參見原文）

本文轉自 | 南京社會科學