【原】一些AI文生圖的方法

王智遠同學 2024-09-29 發布于北京

展開全文

文：王智遠 | ID:Z201440

用過用AI做圖嗎？感覺怎么樣？

想必大部分人都有過這樣的經歷：想要做一張圖。滿懷期待地告訴 AI 后，生成結果總覺得不是那么回事。

于是，失望之下，關閉了 AI 作圖工具，不再使用。

經過一段時間探索后，我發現大部分人都存在偷懶的心理，他們期望通過一個步驟就把所有事情都做好，就像AI 能一步到位地做出完美的 PPT 一樣，這顯然不可能。

文生圖也要好幾個步驟，并且要認識一些基礎的東西。

01

我們先弄清楚兩個名詞：AI繪圖（AI-generated art）和文生圖（Text-to-image）。為什么要了解它？

因為我在學習階段時，查閱各種資料，發現大家統稱的叫法不一樣，有的說AI繪圖、有的說文生圖，把我搞的迷迷糊糊。

后來查閱后才知道，AI繪圖是大概念，它包括了用人工智能創建圖形的所有方法；比如：用文字來生成圖像，或者是改變圖片的風格、編輯圖片、修復細節、增強圖像等。

而文生圖，指一種特定類型的繪圖。這類產品、或能力，專門通過文字解析，并根據描述生成圖像。

我記得，當年文生圖剛出來時，OpenAI的DALL-E和MidJourney是最先讓人知道的。這類軟件，你給它一段文字，它就能幫你做成圖片；但做完后你不能再改，只能調整你的描述，然后再生成一次。

所以，文生圖是AI繪圖的一個小分支。現在市面上的AI作圖軟件大致分為三類：

全功能型（例如DALL-E、MidJourney）
風格遷移型
增強與編輯型

這三種的主要區別是重點不同，在各自商業場景中的用途不同。

全能型，功能比較全，能生成多種風格的圖片；風格遷移是，AI幫你把一張圖片的風格搬到另一張上。

比如：

Adobe Photoshop里有個叫“神經濾鏡”的工具，用了它，你可以把普通照片變成像梵高、畢加索這樣的名畫風格。

國內的即夢AI里，也有類似的功能叫“墊圖”，簡單講，這類模型共性特征是，算法會分析你照片的顏色、紋理等，然后把視覺元素應用到你的圖片上，讓圖片看起來像是那種風格的畫家畫的。

增強和編輯型，這個好理解，就是在原有的圖片基礎上做創新。像Camera、桌面版美圖秀秀都有這種功能，但它們不支持文生圖，只能編輯圖片。

所以，我們可以說，文生圖軟件的競爭主要看模型的能力，也就是，軟件能不能提供多種模型，讓用戶有更多風格的圖片選擇。

我查了查，即夢AI現在給用戶提供5種模型選擇，有的是人物方面的，有的是英文提示詞，還有的和場景相關。

而可靈AI就沒有給用戶提供選擇模型的選項，但在創意描述中，它提供很多不同的風格嘗試，比如霓虹城市、仙女、新娘、海水。

或許，當不同風格被人使用足夠多時，平臺才會再把模型單獨拎出來。

02

既然知道，文生圖是文字做圖的一種辦法，那就意味著對“描述功底”有較高的要求。

什么是描述功底？

你能不能用一句話、一段話把一個需求表達明白的能力。比如：“我想要一張海邊的圖”。這個描述太模糊，可能導致AI生成各種風格和場景的海邊圖片。

而一個清晰的描述應該是這樣的：

我想要一張夏日黃昏時，一對穿著休閑裝的年輕情侶，在沒有人的金色沙灘上散步的圖片，背景是落日和平靜的海面。

這樣詳細的描述，就能幫助AI更精確地理解并生成你心中想象的場景。

沒錯，一開始我也是這么學習的，后來我發現，不對。比描述更重要的是得讀懂自己的需求，換言之，需求排在描述之前。

為什么需求很重要？

如果我們都不清楚自己究竟想要什么，就更難去描述它。后來，帶著疑惑，我就重新學習了「如何表達自己作圖的需求」。

我的需求既簡單又復雜。一開始，我用AI作圖主要想做公眾號小綠書的封面；你如果注意看我的公眾號，應該會發現小綠書里的配圖很講究。

比如：

前一段時間，我要把新書《自醒》當中的內容做成圖文分享出來，卻找不到與自醒相關的圖片。

用海報，又明顯覺得與實際場景不相關。要拍攝《自醒》圖書的照片，又發現要天天去咖啡廳或各種地方找場景，這實在是太難了。

所以，我的需求是想要一些既能表達《自醒》主題又和文章意境匹配的圖片或海報。這樣的圖、文搭配才略顯品質。

需求有了，接下來該怎么辦？

心理學中有個概念叫“否定性選擇”（Negative Selection），人們面對選擇時，可能不清楚自己確切想要什么，但他們能夠確定自己不喜歡或不想要什么。

作圖方面也是，我怎么可能一開始就清楚自己喜歡什么風格？更何況，我對繪畫、作圖本來就沒什么天賦，更不用說洞察到自己的具體喜好了。

因此，我開始通過排除法，確定不喜歡的風格。

我用的是即夢AI，它上面有國風美學、海報設計、動漫游戲、未來科技、動物萌寵、繪畫繪本、寫真人像、產品設計、以及3D藝術和LOGO設計幾種。

點進去大眼一看，動物萌寵、寫真人像、產品設計、LOGO設計這肯定與「自醒」無關呀，于是，直接排除掉。

什么樣的更符合呢？根據《自醒》，我提煉了幾個關鍵詞，比如頓悟、覺醒、醒悟、空間感、和意境唯美。

但是，我不能總停留在這些抽象的概念上，如果太抽象了，生成文生圖可能會更加模糊不清。因此，我參考了一些其他人編寫的具體提示詞。

比如：

一張挑戰視覺極限的海報，以極簡主義手法展現'披著羊皮的狼’。畫面上，狼皮與羊皮巧妙地交織在一起，難以分辨，只有那雙深邃的眼睛透露出真實的自我。

大師運用光影效果，營造出一種神秘而緊張的氛圍，讓觀者在極簡的構圖中感受到強烈的視覺沖擊。這幅作品不僅是對偽裝與真實的探討，也是一次視覺藝術的盛宴。

還有：

一幅極簡主義風格的海報，以海與天交匯的美景為背景，兩者相連成線，展現自然的遼闊與和諧。

沙洲上似乎還殘留著未說完的話語，但畫面以留白代替，留給觀者無限的想象空間。

蘆葦花以純白色調覆蓋，營造出一種靜謐而深邃的氛圍。愛過的容顏雖已成過往，但在極簡的筆觸與色彩下，那份情愫被賦予了新的生命，視覺沖擊力強烈，無需文字，情感已躍然紙上，大師之作，令人回味無窮。

這些圖片出來的效果，有我想要的感覺、又避免了那種繁瑣復雜的細節，它抓住了主題的核心，又展現了我心中的想法，如果用一個詞來形容的話，即：深刻簡潔。

畢加索有一句名言叫：好的藝術家復制，偉大的藝術家竊取。在中國商業上也有類似的觀點叫“先模仿，后創新”，作圖亦是如此，有感覺找對了，才能融入自己的東西。

于是，我把別人的一些提示詞拷貝下來，修改關鍵內容，先生成幾個看看。

我覺得即夢AI 這一點上做得非常棒，它能把提示詞公布出來，供別人學習；在經過多輪嘗試之后，才找到基礎感覺。

因此，文生圖第一步，是找需求，弄清楚需求，根據平臺提供的樣式，知道自己不想要什么，才能縮小選擇范圍并聚焦重要的元素。

03

第二步是什么？我認為是：給提示詞下定義。

中國人有一種思維方式，凡事喜歡自己干；AI時代，這種思維要發生變化；AI本身是一個生產工具，雖然它沒有自主意識，但可以進行各種角色扮演。

我理解中的“定義”，就像是在現實生活中，我們要完成某個任務時，會找一個專家來幫忙一樣；在用AI做圖時，定義就意味著你可以告訴AI，你想讓它成為什么樣的專家。

以前我看別人的攻略，他們會說，你可以這樣下定義，例如：“你是一個頂尖的設計大師”，但實踐后發現，這種定義并不夠精準。

我們給AI的角色定義，要像具體要求一樣精確。

比如：

比如，如果我想要一種極簡風格的圖案，我就會定義它為：“你是一位頂尖的極簡風格設計師?！?/strong>這樣AI就能更精確地理解我想要的是什么。

理解了它，就能據不同的設計需求，為AI定義更具體的角色。

舉幾個例子：

如果你要一張現代都市風格的圖像，可以告訴AI：“你是一位專注于現代城市風格的建筑攝影師。”這樣AI就會專注于捕捉城市的節奏和建筑的線條。

如果你想要一幅富有東方藝術風格的設計，可以定義為：你是一位擅長東方藝術的古典藝術家。

假設做商業海報比較多，我們可以這樣表達：“你是一位商業廣告設計師，專門為品牌創造引人注目的營銷視覺?！边@樣，它生成的作品更有相關性。

除此之外，我在實踐中發現，有時候我想要的風格和AI設計出來的風格不一致，這該怎么辦？

比如：

我想要一幅具有復古感的插畫，但AI卻生成了一幅非常現代和抽象的作品，顯然這不是我想要的。

第三步，要學會添加“關鍵詞”，什么是關鍵詞呢？就是幾個特別的詞，用來告訴AI你想要什么樣的圖。

如果你只告訴AI你想要一幅“復古”的畫，它可能不夠清楚你的具體意圖；但如果你補充說需要“1920s風格”或“爵士樂元素”，AI就能更好地把握你的意思了。

談到這個，我們思考一個問題：

如我前面所述的“自醒”、“覺悟”、“醒悟”，算關鍵詞嗎？說算，也可以說不算。

算的原因是，這些詞能用來指導AI創作出具有某些特定主題的作品；它們能讓AI朝著一定的情感、哲學方向發展，比如：探索個人成長或精神覺醒的主題。

但另一方面，這些詞也不算是理想關鍵詞，因為過于抽象，這意味著它沒辦法描繪出主要圖像。

這時，該怎么辦？

我的一個技巧是，將“抽象詞”用作起點，讓AI根據詞生成一個初步的圖像，生成后基于初稿，提供更具體、更準確的指令來精細調整。

很多時候，你不完全確定自己想要什么，但當看到AI的初稿后，思路會逐漸清晰。然后，就可以優化你的提示詞，添加新的元素或調整主題，以達到更好的效果。

因此，下好定義，給出鋪路詞，這就是迭代的過程。

04

文生圖中最難把握的部分之一是氛圍。所謂氛圍，是過程中，能夠喚起特定情感、情緒或場景氛圍的詞匯；這些詞是感覺至上，很難描述。

為了更好地掌握抽象元素，我把它們分成了七類：

情緒、光線和色彩、時間和環境、場景空間、藝術風格、動作和狀態、質感和材料

乍一看，這些詞匯很常見，但要詳細描述它們的具體影響和應用，確實不容易。

這些詞雖然聽起來很熟悉，但要詳細解釋它們具體的影響和用法，確實有點難。比如說“光線”和“色彩”，大家都知道這很重要，但要準確說出用什么樣的光線、什么樣的色彩才最合適，這可不簡單。

如果要我用不同的方式來描述光，我可能也說不出來，這時候，怎么辦呢？可以借助AI。

我會用Kimi Chat，會對它說：“現在做一張文生圖，要一些關于光線的提示詞，特別是關于明暗、冷酷的，我想不起來了，你幫我寫寫。

這樣，就能解決大腦氛圍詞缺失的問題。

我還發現，如果一個提示詞能把主題、環境、動作、風格、色彩、光線和氛圍都描述清楚，那生成的作品基本就能達到我們的預期。

這是我寫的一個提示詞例子：

一張由海報設計大師操刀的極簡風格作品；以黑白灰為主色調，通過極簡的線條與形狀，勾勒出一個地球；讓人感受到一種超越現實的寧靜與美好；大師級的構圖與色彩運用，讓這幅海報成為極簡主義美學的典范，插畫風格：深色為主。

把描述直接給AI后，出來的作品非常符合想要的感覺。當然，還可以根據需要加入其他元素，比如二分法、三分法或對稱構圖等。

因此，雖然精準的提示詞表達對文生圖至關重要，但過程不是一蹴而就，唯有多試幾次、迭代幾次，才能達到想要的效果。

總結

學會分步驟，過程變簡單。

AI作圖已經在多個領域商業化，目前我也看到一些個人接單幫公司作圖。反正，多學個技能總沒錯，你試試看。

————

近期熱文：

1.《釘釘個人助理，做對了什么？》

2.《剪映，令人愛恨交加》

覺得有價值，歡迎點個在看，每個人都應該擁有獨立思考的能力，舍滿取半，歡迎分享給更多人。

贊賞

共11人贊賞

少妇脱了内裤让我添,久久久久亚洲精品无码网址蜜桃,性色av免费观看,久久人妻av无码中文专区

【原】一些AI文生圖的方法