【Prompt】如何寫好Stable Diffusion提示詞?

2023年04月21日18:12:02 科技 1087

作者:symon,騰訊PCG應用研究員
| 導語Stable Diffusion技術把AI圖像生成提高到了一個全新高度,文生圖Text to image生成質量很大程度上取決於你的提示詞Prompt好不好。本文從「如何寫好提示詞」出發,從提示詞構成、調整規則和chatGPT輔助工具等角度,對文生圖的提示詞輸入進行歸納總結。

一 背景介紹

Stable Diffusion是一種文生圖AI模型,由互聯網上數百萬圖像和文本描述對訓練而來,通過理解文本描述與圖像信息的內在關聯,不斷利用擴散過程進而得到滿意的生成圖片[1]。

比如,通過一串提示詞,midjourney會輸出這樣的情侶合照:

A pAIr of young Chinese lovers, wearing jackets and jeans, sitting on the roof, the background is Beijing in the 1990s, and the opposite building can be seen —v 5 —s 250 —q 2.
一對年輕的中國情侶,穿著夾克和牛仔褲,坐在屋頂上,背景是20世紀90年代的北京,可以看到對面的建築

【Prompt】如何寫好Stable Diffusion提示詞? - 天天要聞

圖1 用midjourney v5生成的情侶圖

沒錯,這兩位並不是真人,而是由AI一鍵生成的,毫無違和感!你可能會想這有什麼了不起的,隨手一搜就有好幾G嘛。這項技術的有趣之處在於,還可以讓模型生成一些先前不存在具有組合元素的高質量圖像。比如說,你可以生成不同畫家風格的明星照片,下面以19世紀印象派畫家Vincent van Gogh和19世紀美國畫家畫家John Sargent風格來畫下Emma Watson肖像畫(Emma Watson是《哈利波特》中赫敏的飾演者)

【Prompt】如何寫好Stable Diffusion提示詞? - 天天要聞

【Prompt】如何寫好Stable Diffusion提示詞? - 天天要聞

圖2 不同畫家風格下的Emma Watson肖像。prompt1: Vincent van Gogh』s painting of Emma Watson; prompt2: John Sargent』s painting of Emma Watson

從圖2可以看到,生成圖片對面部和陰影控制得比較好,整體藝術風格還是比較協調的,能把畫師風格和具體人物以一種比較和諧的方式融合到一起。

【Prompt】如何寫好Stable Diffusion提示詞? - 天天要聞

圖3 Stable Diffusion組成結構

那計算機是如何理解輸入文字呢?圖3給出了stable diffusion整體結構示意圖,利用文本編碼器text encoder(藍色模塊),把文字轉換成計算機能理解的某種數學表示,它的輸入是文字串,輸出是一系列具有輸入文字信息的語義向量。有了這個語義向量,就可以作為後續圖片生成器image generator(粉黃組合框)的一個控制輸入。stable diffusion更多技術介紹和文本編碼器工作原理可以查看《【AI繪畫】十分鐘讀懂Stable Diffusion運行原理》。要想生成出滿意照片,輸入合適提示詞就變得非常重要,接下來就從「如何寫好提示詞」出發,對文生圖的提示詞輸入方法進行歸納總結。

二 如何寫好提示詞?

寫出一份比較好的提示詞是文生圖技術的關鍵。但是,寫出一份好的prompt並不容易,下面針對「如何寫好提示詞」這個問題,從提示詞構成、調整規則和chatGPT輔助等角度,來介紹下如何優化輸入提示詞。

1 正面提示詞

要寫好一份提示詞,遵循原則為儘可能詳細並且具體,從不同角度進行詳細描述。下面從9個角度來介紹輸入關鍵詞。

常用的關鍵詞類別包括如下:

(1) 主體subject

(2) 媒介 medium

(3) 風格 style

(4) 畫家 artist

(5) website

(6) 解析度 resolution

(7) 額外細節 additional details

(8) 色調 color

(9) 光影 lighting

當然,輸入提示詞時,不需要包括到每個類別,只需作為一個列表檢查下哪些可以用到。下面通過添加每個類別的關鍵字來生成一些圖像,來說明和介紹下每個類別。為單獨觀察提示詞效果,實驗時不會使用負面提示詞(在下個模塊會更詳細介紹)。

(1)主體

主體subject,是指想在圖像中看到的主體,要儘可能詳細描述以避免出現描述不足的問題。假如要生成一個在施法的女巫,新手可能會這麼寫:

A sorceress

這個描述詞也太簡單了吧,要提到女巫長什麼樣,增加她形象相關的描述詞,比如說她穿了什麼?在施什麼魔法?是站著,跑著,或者飄浮在天上?主體背景在哪裡?

Stable diffusion並不能猜到這些內容,我們要更詳細地表達各個元素信息。畫人物對象的一個常用技巧是使用名人的名字,名人由於在訓練集中出現頻次較大而訓練充分,是控制生成人物形象的一種好辦法。

作為演示,把女巫形象設置成Emma Watson的樣子,她因飾演《哈利波特》中的赫敏一角紅遍全球,也是stable diffusion里最常使用的一個關鍵詞。把她想像成一個會使用閃電的神秘女巫,並增加一些形象要求,提示詞如下:

Emma Watson as a powerful mysterious sorceress, casting lightning magic, detailed clothing

對應的生成圖如下:

【Prompt】如何寫好Stable Diffusion提示詞? - 天天要聞

圖4 Emma Watson女巫圖

利用名人名字來控制人物形象,直接原因就是訓練時用到了一定量樣本,包括不同角度和不同場景,使Emma Watson得到了充分訓練。要是使用更早些或者小眾點的演員,效果就不一定這麼好了。

(2)畫風

畫風medium,是指生成圖片的畫風,包括插畫illustration、油畫oil painting或攝影風photography等。這類描述詞影響力很大,單獨一個畫風描述詞就能很大程度地改變風格。比如添加下關鍵字「digital painting(數字繪畫)」,

Emma Watson as a powerful mysterious sorceress, casting lightning magic, detailed clothing, digital painting

對應的生成圖如下:

【Prompt】如何寫好Stable Diffusion提示詞? - 天天要聞

圖5 Emma Watson女巫圖+畫風

可以看到,這些圖像的畫風從普通照片變成了數字繪畫風。這裡也列出一些常用畫風,

關鍵詞

說明

Portrait

肖像畫風,用於生成臉部或者頭像

Digital painting

數字藝術風格

Concept art

2D插圖風格

Ultra realistic illustration

畫風真實和逼真,用於生成人物

Underwater portrait

模擬水下的人物特寫,頭髮會飄起來

(3)風格

風格style,是指主體形象的藝術風格,比如印象派、超現實主義波普藝術等。

通過添加一些風格描述詞"hyperrealistic, fantasy, surrealist, full body",

Emma Watson as a powerful mysterious sorceress, casting lightning magic, detailed clothing, digital painting, hyperrealistic, fantasy, Surrealist, full body

對應的生成圖如下:

【Prompt】如何寫好Stable Diffusion提示詞? - 天天要聞

圖6 Emma Watson女巫圖+風格

這裡感覺又多了一些變化,前面關鍵字已經包含了部分風格關鍵字導致變化不大,但是保留這些風格提示詞也可以。這裡也列出一些常用風格,

關鍵詞

說明

hyperrealistic

超現實主義,會增加細節和解析度

pop-art

波普藝術風格

Modernist

現代派,色彩鮮艷和高對比度

art nouveau

新藝術風格,追求平面化

(4)畫家

畫家artist,類似於強修飾符,是指用特定畫家作為參考來生成他們風格的圖像。當然也可以使用多個畫家名字來生成混合風格。

繼續在提示詞里再加上19世紀的超級英雄漫畫家Stanley Artgerm Lau和肖像畫家Alphonse Mucha,

Emma Watson as a powerful mysterious sorceress, casting lightning magic, detailed clothing, digital painting, hyperrealistic, fantasy, Surrealist, full body, by Stanley Artgerm Lau and Alphonse Mucha

對應的生成圖如下:

【Prompt】如何寫好Stable Diffusion提示詞? - 天天要聞

圖7 Emma Watson女巫圖+不同畫家

這裡看到,把兩位畫家的風格融合到一起,效果還不錯。這裡也列出一些常用畫家,

關鍵詞

說明

John Collier

19世紀肖像畫家

Stanley Artgerm Lau

偏寫實和現代風格

John Singer Sargent

擅長女性肖像,偏印象派

Alphonse Mucha

擅長畫平面肖像

(5)網站

有一些小眾圖片網站,比如說Artstation和Deviant Art這樣的網站收集了許多畫風獨特的圖像。在提示詞中添加網站名稱,也可以把圖像引向這些風格。

試下在提示詞里再加上「artstation 」,

Emma Watson as a powerful mysterious sorceress, casting lightning magic, detailed clothing, digital painting, hyperrealistic, fantasy, Surrealist, full body, by Stanley Artgerm Lau and Alphonse Mucha, artstation

對應的生成圖如下:

【Prompt】如何寫好Stable Diffusion提示詞? - 天天要聞

圖7 Emma Watson女巫圖+網站

圖片變化不是很大,但看起來有點像Artstation網路下載下來的了。

(6)解析度

解析度Resolution,表示生成圖像的清晰度和細節程度。繼續添加這方面關鍵字「highly detailed, sharp focus」,

Emma Watson as a powerful mysterious sorceress, casting lightning magic, detailed clothing, digital painting, hyperrealistic, fantasy, Surrealist, full body, by Stanley Artgerm Lau and Alphonse Mucha, artstation, highly detailed, sharp focus

對應的生成圖如下:

【Prompt】如何寫好Stable Diffusion提示詞? - 天天要聞

圖8 Emma Watson女巫圖+解析度

看起來變化不大,因為前面生成圖片已經非常清晰了,但補充一下也無妨。

(7)額外細節

額外細節additional details,可以繼續用來修改圖片。繼續添加這方面關鍵字「sci-fi, stunningly beautiful, dystopian」,

Emma Watson as a powerful mysterious sorceress, casting lightning magic, detailed clothing, digital painting, hyperrealistic, fantasy, Surrealist, full body, by Stanley Artgerm Lau and Alphonse Mucha, artstation, highly detailed, sharp focus, sci-fi, stunningly beautiful, dystopian

對應的生成圖如下:

【Prompt】如何寫好Stable Diffusion提示詞? - 天天要聞

圖9 Emma Watson女巫圖+額外細節

(8)色調

色調color,是指通過添加顏色關鍵字來控制圖像整體顏色,可以把顏色應用到某個物品上或者是整體色調。

利用關鍵字"iridescent gold"讓整張圖片黃一點,

Emma Watson as a powerful mysterious sorceress, casting lightning magic, detailed clothing, digital painting, hyperrealistic, fantasy, Surrealist, full body, by Stanley Artgerm Lau and Alphonse Mucha, artstation, highly detailed, sharp focus, sci-fi, stunningly beautiful, dystopian, iridescent gold

對應的生成圖如下,看起來就很黃了!

【Prompt】如何寫好Stable Diffusion提示詞? - 天天要聞

圖10 Emma Watson女巫圖+色調

(9)光照

光照lighting,是指圖像里的光照描述,改變光照可以對圖像效果產生巨大影響。試試添加關鍵字「cinematic lighting, dark」,

Emma Watson as a powerful mysterious sorceress, casting lightning magic, detailed clothing, digital painting, hyperrealistic, fantasy, Surrealist, full body, by Stanley Artgerm Lau and Alphonse Mucha, artstation, highly detailed, sharp focus, sci-fi, stunningly beautiful, dystopian, iridescent gold, cinematic lighting, dark

對應的生成圖如下,影視光照就出來了!

【Prompt】如何寫好Stable Diffusion提示詞? - 天天要聞

圖11 Emma Watson女巫圖+光照

總結下,圖片生成時針對主體添加一些關鍵字,就能夠得到比較不錯的圖片;通常不需要填寫很多提示詞來獲得高質量圖片,比如畫家、網站和風格在一定程度上是有些重合的。也可以藉助一些stable diffusion提示詞網站來獲取更多靈感。

2 負面提示詞

負面提示詞和正面提示詞是同等重要的,使用負面提示詞也是生成迭代過程的一個重要環節。要解釋負面提示詞的工作原理,這裡需要先理解不使用負面提示詞時採樣是如何工作的。

不使用負面提示詞的採樣過程

在stable diffusion採樣階段,①首先用文本提示詞作為指導條件,利用條件採樣對圖像進行去噪;② 採樣器使用無條件採樣對同一圖像進行去噪,這裡不使用文本指導,但它仍然會擴散到某一個圖像,比如說下面的籃球或者紅酒杯(它可以是任何隨機主體);③ 擴散過程中實際上是計算條件採樣和無條件採樣的差異,並按照採樣步數重複這個過程。

【Prompt】如何寫好Stable Diffusion提示詞? - 天天要聞

圖12 不使用負面提示詞的採樣過程

使用負面提示詞的採樣過程

負面提示詞是通過影響無條件採樣實現的。利用負面提示詞,在上面第②步里就不是使用空提示來生成隨機對象了。從技術上說,正面提示詞會引導採樣過程生成與文本相關的圖像,負面提示詞則會在採樣過程來引導遠離相關圖像。需要說明,擴散過程是發生在隱空間latent space里,而不是圖像空間,這裡僅作為技術示意。

【Prompt】如何寫好Stable Diffusion提示詞? - 天天要聞

圖13 使用負面提示詞的採樣過程

負面提示詞,即填入不想要的主體或者身體部位,以在採樣過程中避免出現。比如說,sd v1版本不擅長生成手,就可以在負向提示詞里輸入「hand」或者「extra limbs」來隱藏或修正。下面會從4個角度來介紹可以使用負面提示詞的應用場景,分別是:

(1) 移除物體removing things

(2) 修改圖片 modifying images

(3) 關鍵詞切換 keyword switching

(4) 修改風格 modifying styles

(1)移除物體

負面提示詞的第一個直接用法是移除任何不想在圖片中看到的內容。比如,在提示詞輸入「Portrait photo of a man」,得到下面兩張圖片,都看起來比較嚴肅。

【Prompt】如何寫好Stable Diffusion提示詞? - 天天要聞

圖14 提示詞輸入「Portrait photo of a man」的生成圖片

接下來試著去掉他們鬍子,看起來更年輕一點,因此在負向提示詞里輸入「mustache」,就可以生成一些沒有鬍子的男人,如圖15所示。當然,要想完全去除右邊男人的鬍子,可通過增強負向提示詞「(mustache:1.3)」來告訴採樣過程去除鬍子操作的重要度提高30%。

【Prompt】如何寫好Stable Diffusion提示詞? - 天天要聞

圖15 在負向提示詞里添加「mustache」的生成圖片

(2)修改圖片

負向提示詞也可以用於在得到較滿意圖像時,利用負面提示詞進行微調。這裡不需要移除任何東西,而只需要對主體做一些細微修改。

比如,利用下面提示詞得到一張比較滿意的唯美照片後,發現可能由於颳風導致頭髮都飄起來了,就可以添加負面提示詞「windy」讓頭髮正常下垂。

正面提示詞輸入如下,

emma watson as nature magic celestial, top down pose, long hair, soft pink and white transparent cloth, space, D&D, shiny background, intricate, elegant, highly detailed, digital painting, artstation, concept art, smooth, sharp focus, illustration, artgerm, bouguereau

【Prompt】如何寫好Stable Diffusion提示詞? - 天天要聞

圖16 添加負面提示詞「windy」後的左右變化,右邊為修改後圖片

要是不想調整頭髮,而是想讓頭髮遮住耳朵呢?通過添加帶有不同強度的負面提示詞「ear」來調整隱藏強度。下面是強度分別為1.3、1.6和1.9的效果,由於ear在強度為1時已被大比例遮住,繼續增大時變化不多。但負面強度設置為1.9時,圖像組成也發生了變化,這說明負面提示詞對擴散過程的影響是比較大的。

【Prompt】如何寫好Stable Diffusion提示詞? - 天天要聞

圖17 負面提示詞「ear」不同強度的生成圖片

(3)關鍵詞切換

要是真的想使用強度為1.9的負向提示詞,有什麼不改變圖片總體結構的方法呢?用關鍵詞切換技術,先使用一個無意義的單詞作為負面提示詞,再在後面的採樣步驟里切換到(ear:1.9)。

比如,使用「the」作為無意義的負面提示詞,可以把它放在負面提示詞里先驗證下它的無用性。在驗證添加「the」的生成圖像跟沒有添加時幾乎一樣後,就可以使用這個「the」單詞作為負面提示詞,

the: (ear:1.9): 0.5

由於採樣步數設置了20,意味著在第1~10步時使用負面提示詞「the」,第11~20步使用負面提示詞「(ear:1.9)」。這是因為,擴散過程的初始階段是確定圖片主體結構,後面步驟只是在對細節進行更精細調整,比如用頭髮遮住耳朵。

【Prompt】如何寫好Stable Diffusion提示詞? - 天天要聞

圖17 負面提示詞「the: (ear:1.9): 0.5」的生成圖片

通過這種方式,就對負面提示詞使用更大強度1.9,且不改變圖片組成,得到了接近原始圖像的微調圖像,並且把耳朵用頭髮遮得更嚴實。

(4)修改風格

負面提示詞不僅能用來修改圖片內容,也可以用來修改圖片風格。為什麼要用負面提示詞來修改圖片風格?在正面提示里添加過多單詞也會混淆擴散過程,把一部分信息放在負面提示詞里的效果會更明顯。

操作1 「Sharpening」。為了讓圖片更清晰,除了在正面提示詞里使用關鍵字「sharp」或者「focused」,也可以在負面提示詞里使用「blur」,來讓圖片更為清晰。

【Prompt】如何寫好Stable Diffusion提示詞? - 天天要聞

圖18 添加負面提示詞「blurry」的生成圖片

操作2 「Photorealistic」。使用負面提示詞「painting」或者「cartoon」,使生成圖片更傾向寫實主義。當然,要是想保持原有圖片結構,可繼續使用前面提到的關鍵詞切換,使用負面提示詞「the: (painting cartoon:1.9): 0.3」,可得到圖19中更接近原始圖像但增加了寫實主義風格的生成圖像。

【Prompt】如何寫好Stable Diffusion提示詞? - 天天要聞

圖19 負面提示詞「the: (painting cartoon:1.9): 0.3」的生成圖片

下面給出了一份通用的負面提示詞,可以復用到你的場景,這些負面提示詞可以讓圖片主體更突出,具有層次感。

ugly, tiling, poorly drawn hands, poorly drawn feet, poorly drawn face, out of frame, extra limbs, disfigured, deformed, body out of frame, bad anatomy, watermark, signature, cut off, low contrast, underexposed, overexposed, bad art, beginner, amateur, distorted face, blurry, draft, grainy

總結下,負面提示詞也扮演著十分重要的作用,用負面提示詞在採樣過程引導遠離相關圖像。如上面介紹,可以用來微調生成圖片,如移除物體、修改圖片,或者修改風格等一系列操作。

3 微調提示詞

利用正面和負面提示詞還不能生成很滿意的照片,還需要做進一步細節調整?還有一些提示詞調整技巧,下面會從3個用法角度來介紹如何微調提示詞,

(1) 關鍵詞權重

(2) ()和[]語法

(3) 關鍵詞混合

(1) 關鍵詞權重

關鍵詞權重,是指通過語法「(keyword: factor)」來調整關鍵詞權重,其中factor為權重值,小於1表示減低重要度,大於1表示增大重要度。

下面這個例子調整了關鍵字「dog」的權重值。如下圖所示,增大「dog」權重一般會生成更多狗,減少權重則降低了生成狗的數量。這種技術也可以應用到風格style或者光照lighting調整。

dog, autumn in paris, ornate, beautiful, atmosphere, vibe, mist, smoke, fire, chimney, rain, wet, pristine, puddles, melting, dripping, snow, creek, lush, ice, bridge, forest, roses, flowers, by stanley artgerm lau, greg rutkowski, thomas kindkade, alphonse mucha, loish, norman rockwell.

【Prompt】如何寫好Stable Diffusion提示詞? - 天天要聞

圖20 不同權重提示詞「dog」的生成圖片

(2)()和[]符號

調整關鍵詞強度的另一種等效方法是使用()和[]符號。(keyword)把關鍵詞強度增加到1.1倍,與「(keyword:1.1)」效果一致;[keyword]把關鍵詞強度降低到0.9倍,與「[keyword:0.9]」效果一致。

這裡可以使用多個,跟數學裡的連乘操作是一樣的。

(keyword): 1.1
((keyword)): 1.21
(((keyword))): 1.33

(3) 關鍵詞混合

這裡還可以通過混合兩個關鍵詞來實現更有趣效果,使用語法為「[keyword1 : keyword2: factor]」,其中factor值控制了把keyword1切換到keyword2的步驟值,是一個介於0到1之間的數字。

舉個例子,輸入提示詞「Oil painting portrait of [Joe Biden: Donald Trump: 0.5]」,採樣步數設置為30。這裡指的是,第1~15步,提示詞為「Oil painting portrait of Joe Biden」;第16~30步,提示詞為「Oil painting portrait of Donald Trump」。解釋一下,factor值決定了關鍵詞的切換節點,設置為0.5時指的是在30*0.5 = 15步時切換。

【Prompt】如何寫好Stable Diffusion提示詞? - 天天要聞

圖21 關鍵詞混合的生成圖片

通過關鍵詞融合技術可以把兩個主體容易在一起。要注意的是,Trump穿著白色西裝(這好像是Biden的打扮),是因為第1個關鍵詞(即早期擴散過程)決定了總體組成,後面步驟只會微調細節。

用關鍵詞混合技術還能用於生成高度相似的圖片編輯。下面是使用相同提示詞生成了兩張圖片,隨機種子和迭代步數保持不變,只修改了[apple: fire: factor]里的factor權重。這背後的工作理論是,生成圖片的總體組成是由早期擴散過程決定的,後面的一些關鍵詞調整不會對圖像整體產生很大影響,只會改變一小部分。

【Prompt】如何寫好Stable Diffusion提示詞? - 天天要聞

圖22 關鍵詞混合[apple: fire: factor]的生成圖片

4 用chatGPT生成

手動改prompt很麻煩?能不能用chatGPT生成高質量提示詞來實現穩定擴散?答案是可以的,但需要用一些技巧來引導。chatGPT是openAI在2022年11月發布的聊天機器人,在GPT3.5大語言模型的基礎上進行了微調。GPT3系列使用了千億級別文本訓練出來的,chatGPT還進一步引入了RLHF強化學習來學習人類偏好。因此,chatGPT包含了大量人類知識,可以生成文章、詩歌、小說甚至是各種計算機代碼。

那chatGPT了解stable diffusion技術嗎?答案是不了解,因為它的訓練數據只截止於2021年9月。幸運的是,它了解什麼是文生圖text-to-image和DALL-E模型,可以利用這塊知識構建提示詞工程。

【Prompt】如何寫好Stable Diffusion提示詞? - 天天要聞

圖23 chatGPT是否了解stable diffusion、text-to-image和DALL-E技術?

如何調用chatGPT呢?最直接的方式是上chat.openai.com使用,內網也有一些中轉方式,比如用企微里的chatGPT機器人或者搭建一些內部平台,這裡不過多介紹。下面介紹使用chatGPT來生成一個人物特寫照片,這是比較難的一個任務。

讓chatGPT生成高質量提示詞,也是需要一些技巧的,包括以下三點:(1) 指定圖片畫風,比如oil-painting油畫風等;(2) 確定圖片主體,如前面提到用一個明星名字是個不錯選擇;(3) 給出具體例子的話往往學的更快。

綜合一下,輸入ChatGPT的提示詞如下:

Examples of high quality prompt for stunning close-up photorealistic illustration of Ana de Armas for text-to-image models (Stable Diffusion, midjourney or Dalle2) are
– portrait of beautiful happy young ana de armas, ethereal, realistic anime, trending on pixiv, detailed, clean lines, sharp lines, crisp lines, award winning illustration, masterpiece, 4k, eugene de blaas and ross tran, vibrant color scheme, intricately detailed
– alberto seveso and geo2099 style, A highly detailed and hyper realistic portrait of a gorgeous young ana de armas, lisa frank, trending on artstation, butterflies, floral, sharp focus, studio photo, intricate details, highly detailed, by Tvera and wlop and artgerm
Give me more examples.

chatGPT的回復為:

A photorealistic, highly detailed illustration of Ana de Armas in a vintage Hollywood style, reminiscent of the golden age of cinema, with a focus on glamour and elegance.
A close-up illustration of Ana de Armas in a neo-noir style, reminiscent of the film noir genre, with a focus on shadows, contrasts, and a sense of danger.

把這些提示詞輸入到stable diffusion v1.5里,使用DPM++ 2M Karras採樣器,迭代步數為25,圖片解析度為502×704。負面提示詞使用上面提到的通用版本。

chatGPT提示詞1:

A photorealistic, highly detailed illustration of Ana de Armas in a vintage Hollywood style, reminiscent of the golden age of cinema, with a focus on glamour and elegance.

【Prompt】如何寫好Stable Diffusion提示詞? - 天天要聞

圖24 chatGPT提示詞1的生成圖片

chatGPT提示詞2:

A close-up illustration of Ana de Armas in a neo-noir style, reminiscent of the film noir genre, with a focus on shadows, contrasts, and a sense of danger.

【Prompt】如何寫好Stable Diffusion提示詞? - 天天要聞

圖25 chatGPT提示詞2的生成圖片

這裡只進行了初步嘗試,生成效果看起來還不錯,後續可以進一步深入挖掘。

此外,還可以使用magicPrompt模型。基於GPT-2模型,它使用了大約8萬條stable diffusion優質提示詞訓練而來,旨在為stable diffusion生成完善提示詞。只要輸入圖片主體,就能補全各種細節,體驗網址如下:

MagicPrompt Stable Diffusion - a Hugging Face Space by Gustavosta

【Prompt】如何寫好Stable Diffusion提示詞? - 天天要聞

圖26 magicPrompt功能示例

三 本文小結

AI繪畫各種技術和應用不斷湧現,也很大程度上提高了不少行業產出效率。這篇文章主要介紹stable diffusion里的提示詞prompt,從提示詞構成、調整規則和chatGPT輔助等角度出發,介紹如何更好地輸入提示詞,才能更好地控制AI繪畫生成。

參考鏈接

1 Stable Diffusion GitHub - CompVis/stable-diffusion: A latent text-to-image diffusion model

2Denoising Diffusion Probabilistic Models https://arxiv.org/abs/2006.11239

3 How to come up with good prompts for Stable Diffusion? How to come up with good prompts for Stable Diffusion - Stable Diffusion Art

科技分類資訊推薦

上海:將加快開源人形機器人原型機研發 - 天天要聞

上海:將加快開源人形機器人原型機研發

IT之家 5 月 18 日消息,在今日舉行的第五屆上海創新創業青年 50 人論壇上,上海市經信委主任張英表示:昨天國家地方共建人形機器人創新中心在上海揭牌成立,這也是(人形機器人領域)國家首個公共平台。通過這個公共平台,將打造集技術研發、成果孵化、人才培育、平台支撐為一體的創新生態,同時加快開源人形機器人原型機...
軟銀賣光阿里股份,阿里終變「中國企業」,孫正義為何溜這麼快? - 天天要聞

軟銀賣光阿里股份,阿里終變「中國企業」,孫正義為何溜這麼快?

視頻請點擊下方鏈接:軟銀賣光阿里股份,阿里終變「中國企業」,孫正義為何溜這麼快?軟銀跑了,孫正義賣光了阿里所有股份,撕破了過去親手畫的投資大餅!5月14號,軟銀集團宣布,手裡的阿里巴巴股份清零。以前軟銀有48%的凈資產都是靠阿里撐起來的,而現在持股比例接近於零。
騰訊雲「注入」大模型獨角獸 - 天天要聞

騰訊雲「注入」大模型獨角獸

5月17日,騰訊雲與AI大模型獨角獸百川智能簽署戰略合作協議,雙方將在大模型產品、企業安全、用戶增長以及生態等領域展開深度合作。
度小滿六周年用戶回饋日|提額、降息、返現、抽獎任你選 - 天天要聞

度小滿六周年用戶回饋日|提額、降息、返現、抽獎任你選

5月21日,度小滿即將迎來獨立運營六周年。周年慶之際,度小滿推出了「越用越實惠 六周年,送好禮」用戶回饋日活動,感恩用戶六年來的一路陪伴與支持。據悉,度小滿「六周年用戶回饋日」活動將於2024年5月21日正式啟動,一直持續至今年6月30日。用戶登錄度小滿App/有錢花App/度小滿小程序主頁面即可參與,其中包括周年慶好禮...
四川開展「雙萬兆」技術試點 成都成全國首批「雙萬兆」試點城市 - 天天要聞

四川開展「雙萬兆」技術試點 成都成全國首批「雙萬兆」試點城市

5月17日,四川省信息通信業以「數字創新促進可持續發展」為主題,舉辦2024年世界電信和信息社會日活動。四川省通信管理局黨組書記、局長鄭蕾在活動上介紹說,四川已建成西部地區規模最大、技術領先的信息通信網路;5G基站達到18.84萬個,實現雙千兆網路鄉鄉通達,工業園區萬兆光網全覆蓋。四川省通信管理局黨組書記、局長鄭...
Google DeepMind 推出評估AI模型危險性的新框架 - 天天要聞

Google DeepMind 推出評估AI模型危險性的新框架

Google DeepMind 周五發布了一個框架,用於窺視人工智慧模型內部,以確定它們是否正在接近危險能力。周五發布的論文描述了這樣一個過程:每當用於訓練模型的計算能力提高六倍,或者微調三個月,DeepMind 的模型就會被重新評估。
OPPO Reno12 和 Reno12 Pro 官方圖片泄露 包括所有顏色 - 天天要聞

OPPO Reno12 和 Reno12 Pro 官方圖片泄露 包括所有顏色

昨天,OPPO宣布了Reno12和Reno12 Pro智能手機的正式發布日期 - 5月23日。同樣在昨天,該公司還發布了一些預告,曝光了這兩款手機的背面設計。今天,@evleaks(又名Evan Blass)為我們帶來了兩款手機的泄露官方圖片,以及它們將提供的所有顏色。