文:王智遠 | ID:Z201440用過用AI做圖嗎?感覺怎么樣? 想必大部分人都有過這樣的經歷:想要做一張圖。滿懷期待地告訴 AI 后,生成結果總覺得不是那么回事。于是,失望之下,關閉了 AI 作圖工具,不再使用。經過一段時間探索后,我發現大部分人都存在偷懶的心理,他們期望通過一個步驟就把所有事情都做好,就像AI 能一步到位地做出完美的 PPT 一樣,這顯然不可能。文生圖也要好幾個步驟,并且要認識一些基礎的東西。 01 我們先弄清楚兩個名詞:AI繪圖(AI-generated art)和文生圖(Text-to-image)。為什么要了解它? 因為我在學習階段時,查閱各種資料,發現大家統稱的叫法不一樣,有的說AI繪圖、有的說文生圖,把我搞的迷迷糊糊。后來查閱后才知道,AI繪圖是大概念,它包括了用人工智能創建圖形的所有方法;比如:用文字來生成圖像,或者是改變圖片的風格、編輯圖片、修復細節、增強圖像等。而文生圖,指一種特定類型的繪圖。這類產品、或能力,專門通過文字解析,并根據描述生成圖像。我記得,當年文生圖剛出來時,OpenAI的DALL-E和MidJourney是最先讓人知道的。這類軟件,你給它一段文字,它就能幫你做成圖片;但做完后你不能再改,只能調整你的描述,然后再生成一次。所以,文生圖是AI繪圖的一個小分支。現在市面上的AI作圖軟件大致分為三類:這三種的主要區別是重點不同,在各自商業場景中的用途不同。全能型,功能比較全,能生成多種風格的圖片;風格遷移是,AI幫你把一張圖片的風格搬到另一張上。Adobe Photoshop里有個叫“神經濾鏡”的工具,用了它,你可以把普通照片變成像梵高、畢加索這樣的名畫風格。國內的即夢AI里,也有類似的功能叫“墊圖”,簡單講,這類模型共性特征是,算法會分析你照片的顏色、紋理等,然后把視覺元素應用到你的圖片上,讓圖片看起來像是那種風格的畫家畫的。增強和編輯型,這個好理解,就是在原有的圖片基礎上做創新。像Camera、桌面版美圖秀秀都有這種功能,但它們不支持文生圖,只能編輯圖片。所以,我們可以說,文生圖軟件的競爭主要看模型的能力,也就是,軟件能不能提供多種模型,讓用戶有更多風格的圖片選擇。我查了查,即夢AI現在給用戶提供5種模型選擇,有的是人物方面的,有的是英文提示詞,還有的和場景相關。而可靈AI就沒有給用戶提供選擇模型的選項,但在創意描述中,它提供很多不同的風格嘗試,比如霓虹城市、仙女、新娘、海水。或許,當不同風格被人使用足夠多時,平臺才會再把模型單獨拎出來。 02 既然知道,文生圖是文字做圖的一種辦法,那就意味著對“描述功底”有較高的要求。 你能不能用一句話、一段話把一個需求表達明白的能力。比如:“我想要一張海邊的圖”。這個描述太模糊,可能導致AI生成各種風格和場景的海邊圖片。我想要一張夏日黃昏時,一對穿著休閑裝的年輕情侶,在沒有人的金色沙灘上散步的圖片,背景是落日和平靜的海面。這樣詳細的描述,就能幫助AI更精確地理解并生成你心中想象的場景。沒錯,一開始我也是這么學習的,后來我發現,不對。比描述更重要的是得讀懂自己的需求,換言之,需求排在描述之前。如果我們都不清楚自己究竟想要什么,就更難去描述它。后來,帶著疑惑,我就重新學習了「如何表達自己作圖的需求」。我的需求既簡單又復雜。一開始,我用AI作圖主要想做公眾號小綠書的封面;你如果注意看我的公眾號,應該會發現小綠書里的配圖很講究。前一段時間,我要把新書《自醒》當中的內容做成圖文分享出來,卻找不到與自醒相關的圖片。用海報,又明顯覺得與實際場景不相關。要拍攝《自醒》圖書的照片,又發現要天天去咖啡廳或各種地方找場景,這實在是太難了。所以,我的需求是想要一些既能表達《自醒》主題又和文章意境匹配的圖片或海報。這樣的圖、文搭配才略顯品質。心理學中有個概念叫“否定性選擇”(Negative Selection),人們面對選擇時,可能不清楚自己確切想要什么,但他們能夠確定自己不喜歡或不想要什么。作圖方面也是,我怎么可能一開始就清楚自己喜歡什么風格?更何況,我對繪畫、作圖本來就沒什么天賦,更不用說洞察到自己的具體喜好了。我用的是即夢AI,它上面有國風美學、海報設計、動漫游戲、未來科技、動物萌寵、繪畫繪本、寫真人像、產品設計、以及3D藝術和LOGO設計幾種。點進去大眼一看,動物萌寵、寫真人像、產品設計、LOGO設計這肯定與「自醒」無關呀,于是,直接排除掉。什么樣的更符合呢?根據《自醒》,我提煉了幾個關鍵詞,比如頓悟、覺醒、醒悟、空間感、和意境唯美。但是,我不能總停留在這些抽象的概念上,如果太抽象了,生成文生圖可能會更加模糊不清。因此,我參考了一些其他人編寫的具體提示詞。一張挑戰視覺極限的海報,以極簡主義手法展現'披著羊皮的狼’。畫面上,狼皮與羊皮巧妙地交織在一起,難以分辨,只有那雙深邃的眼睛透露出真實的自我。大師運用光影效果,營造出一種神秘而緊張的氛圍,讓觀者在極簡的構圖中感受到強烈的視覺沖擊。這幅作品不僅是對偽裝與真實的探討,也是一次視覺藝術的盛宴。一幅極簡主義風格的海報,以海與天交匯的美景為背景,兩者相連成線,展現自然的遼闊與和諧。沙洲上似乎還殘留著未說完的話語,但畫面以留白代替,留給觀者無限的想象空間。蘆葦花以純白色調覆蓋,營造出一種靜謐而深邃的氛圍。愛過的容顏雖已成過往,但在極簡的筆觸與色彩下,那份情愫被賦予了新的生命,視覺沖擊力強烈,無需文字,情感已躍然紙上,大師之作,令人回味無窮。 這些圖片出來的效果,有我想要的感覺、又避免了那種繁瑣復雜的細節,它抓住了主題的核心,又展現了我心中的想法,如果用一個詞來形容的話,即:深刻簡潔。畢加索有一句名言叫:好的藝術家復制,偉大的藝術家竊取。在中國商業上也有類似的觀點叫“先模仿,后創新”,作圖亦是如此,有感覺找對了,才能融入自己的東西。于是,我把別人的一些提示詞拷貝下來,修改關鍵內容,先生成幾個看看。我覺得即夢AI 這一點上做得非常棒,它能把提示詞公布出來,供別人學習;在經過多輪嘗試之后,才找到基礎感覺。因此,文生圖第一步,是找需求,弄清楚需求,根據平臺提供的樣式,知道自己不想要什么,才能縮小選擇范圍并聚焦重要的元素。 03 第二步是什么?我認為是:給提示詞下定義。 中國人有一種思維方式,凡事喜歡自己干;AI時代,這種思維要發生變化;AI本身是一個生產工具,雖然它沒有自主意識,但可以進行各種角色扮演。我理解中的“定義”,就像是在現實生活中,我們要完成某個任務時,會找一個專家來幫忙一樣;在用AI做圖時,定義就意味著你可以告訴AI,你想讓它成為什么樣的專家。以前我看別人的攻略,他們會說,你可以這樣下定義,例如:“你是一個頂尖的設計大師”,但實踐后發現,這種定義并不夠精準。比如,如果我想要一種極簡風格的圖案,我就會定義它為:“你是一位頂尖的極簡風格設計師?!?/strong>這樣AI就能更精確地理解我想要的是什么。理解了它,就能據不同的設計需求,為AI定義更具體的角色。如果你要一張現代都市風格的圖像,可以告訴AI:“你是一位專注于現代城市風格的建筑攝影師。”這樣AI就會專注于捕捉城市的節奏和建筑的線條。如果你想要一幅富有東方藝術風格的設計,可以定義為:你是一位擅長東方藝術的古典藝術家。假設做商業海報比較多,我們可以這樣表達:“你是一位商業廣告設計師,專門為品牌創造引人注目的營銷視覺?!边@樣,它生成的作品更有相關性。除此之外,我在實踐中發現,有時候我想要的風格和AI設計出來的風格不一致,這該怎么辦?我想要一幅具有復古感的插畫,但AI卻生成了一幅非常現代和抽象的作品,顯然這不是我想要的。第三步,要學會添加“關鍵詞”,什么是關鍵詞呢?就是幾個特別的詞,用來告訴AI你想要什么樣的圖。如果你只告訴AI你想要一幅“復古”的畫,它可能不夠清楚你的具體意圖;但如果你補充說需要“1920s風格”或“爵士樂元素”,AI就能更好地把握你的意思了。如我前面所述的“自醒”、“覺悟”、“醒悟”,算關鍵詞嗎?說算,也可以說不算。算的原因是,這些詞能用來指導AI創作出具有某些特定主題的作品;它們能讓AI朝著一定的情感、哲學方向發展,比如:探索個人成長或精神覺醒的主題。但另一方面,這些詞也不算是理想關鍵詞,因為過于抽象,這意味著它沒辦法描繪出主要圖像。我的一個技巧是,將“抽象詞”用作起點,讓AI根據詞生成一個初步的圖像,生成后基于初稿,提供更具體、更準確的指令來精細調整。很多時候,你不完全確定自己想要什么,但當看到AI的初稿后,思路會逐漸清晰。然后,就可以優化你的提示詞,添加新的元素或調整主題,以達到更好的效果。因此,下好定義,給出鋪路詞,這就是迭代的過程。 04 文生圖中最難把握的部分之一是氛圍。所謂氛圍,是過程中,能夠喚起特定情感、情緒或場景氛圍的詞匯;這些詞是感覺至上,很難描述。 為了更好地掌握抽象元素,我把它們分成了七類: 情緒、光線和色彩、時間和環境、場景空間、藝術風格、動作和狀態、質感和材料
乍一看,這些詞匯很常見,但要詳細描述它們的具體影響和應用,確實不容易。 這些詞雖然聽起來很熟悉,但要詳細解釋它們具體的影響和用法,確實有點難。比如說“光線”和“色彩”,大家都知道這很重要,但要準確說出用什么樣的光線、什么樣的色彩才最合適,這可不簡單。 如果要我用不同的方式來描述光,我可能也說不出來,這時候,怎么辦呢?可以借助AI。 我會用Kimi Chat,會對它說:“現在做一張文生圖,要一些關于光線的提示詞,特別是關于明暗、冷酷的,我想不起來了,你幫我寫寫。 這樣,就能解決大腦氛圍詞缺失的問題。 我還發現,如果一個提示詞能把主題、環境、動作、風格、色彩、光線和氛圍都描述清楚,那生成的作品基本就能達到我們的預期。 
這是我寫的一個提示詞例子: 一張由海報設計大師操刀的極簡風格作品;以黑白灰為主色調,通過極簡的線條與形狀,勾勒出一個地球;讓人感受到一種超越現實的寧靜與美好;大師級的構圖與色彩運用,讓這幅海報成為極簡主義美學的典范,插畫風格:深色為主。 把描述直接給AI后,出來的作品非常符合想要的感覺。當然,還可以根據需要加入其他元素,比如二分法、三分法或對稱構圖等。 因此,雖然精準的提示詞表達對文生圖至關重要,但過程不是一蹴而就,唯有多試幾次、迭代幾次,才能達到想要的效果。 總結 學會分步驟,過程變簡單。 AI作圖已經在多個領域商業化,目前我也看到一些個人接單幫公司作圖。反正,多學個技能總沒錯,你試試看。 ———— 
覺得有價值,歡迎點個在看,每個人都應該擁有獨立思考的能力,舍滿取半,歡迎分享給更多人。
|