您現在的位置是:首頁 > 影視首頁影視

別慌,AI 繪畫殺不死藝術

由 愛範兒 發表于 影視2023-02-05
簡介具體來說,Stable Diffusion 透過潛在的擴散模型,學習影象和文字之間的聯絡

網路運營具體做什麼工作內容

AI 繪畫一日,人間一年。

上半年走紅的 Dall-E 2、Midjourney,下半年風頭完全被 Stable Diffusion 蓋過。

近期火熱的繪圖產品,名字裡都有「diffusion」,它們均得益於人工智慧「擴散」演算法。該演算法突破了 AI 繪畫的應用臨界點,更易上手,效果更好。

別慌,AI 繪畫殺不死藝術

機器作畫已經有半個世紀的歷史,而兩年之內,AI 繪畫忽然成了「進擊的巨人」,不僅質量肉眼可見的提升,生成圖片的速度也從年初的幾個小時縮短到十幾秒鐘。

AI 繪畫技術的大幅度進步,激發了人們對「創意 AI」的興趣——從美術到詩歌,一系列 AI 工具正在模仿人類的創造力。但沒有什麼人真正覺得惶恐。

前一陣子,有不少人猜測生物學家顏寧離美歸國,是因為 AlphaFold 人工智慧系統能夠預測蛋白質結構,被搶了飯碗。實際上,能寫新聞資訊的軟體早就存在,並沒有記者為此失業。AI 連寫豆腐塊的人都無法替代,更不用說能替代頂尖科學家了。

擴散演算法是什麼?

當下的人工智慧模型,使用的都是深度學習神經網路。自學習模型,比如 GPT-3 是其中最著名的模型,它會在大約 45 TB 文字資料的神經網路上「學習」,生成和人類產出相差無幾的作品。

Stable Diffusion 是深度學習家族的一部分。具體來說,Stable Diffusion 透過潛在的擴散模型,學習影象和文字之間的聯絡。它的工作原理是,獲取影象資料,並對其新增「噪點」。噪點,也叫噪聲,是指數碼攝影器材拍攝的影象中,存在的粗糙點,一般受電子干擾產生。

一幅畫面被逐步加入噪點,一直到整個畫面都變成白噪點。該模型記錄這一過程,進行逆轉,給 AI 學習。

別慌,AI 繪畫殺不死藝術

從 AI 的角度,先看到的是一幅佈滿噪點的畫面,再看到畫面一點點變清晰,最後成為畫作。AI 學的是整個去噪點的過程,特別是如何處理高斯噪聲,最後生成畫作。

高斯噪聲指的是機率密度函式服從高斯分佈(即正態分佈)的一類噪聲,擴散演算法新增高斯噪聲,一是為了驗證「實際」影象的有效性,因為使用環境裡的影象都是帶噪點的;一是為了方便學習,只要噪點不符合標準正態分佈,就算失效。

Stable Diffusion 的基礎資料庫叫 LAION-Aesthetics,包含了帶圖說的影象,還根據「審美風格」進行過濾。其他經訓練的人工智慧模型也對資料庫進行「修正」,來預測人們如何回答「你有多喜歡這幅畫」時的打分評級,以便消除一些黃暴內容。

和「前輩」有何差別?

Stable Diffusion 和 Dall-E 2、Midjourney 類似,都要靠「文字描述」生成影象。

不過,Stable Diffusion 是開源的,其基礎程式碼也是公開的。而 Open AI 和 Google 都沒有開放自己的人工智慧模型。

Stability AI 由 4000 多個英偉達 A100 GPU 組成,在亞馬遜雲(AWS)中執行。據報道,Stability AI 公司的運營和雲支出成本,超過 5000 萬美元。

別慌,AI 繪畫殺不死藝術

該公司聲稱可以提供「速度和質量的突破」,記憶體低於 10 G 的 GPU 也能跑。他們還會提供執行在 AMD、蘋果 M1/M2 晶片的版本。

目前,Stable Diffusion 的功能是,可以在幾秒內將文字轉換為 512×512 畫素的影象;影象可以轉換、放大、修改和替換;使用 GFP-GAN 建模,允許使用者上傳模糊的面部影象,進行放大或恢復原貌。

上個月,Stability AI 公司融資 1。01 億美元。執行長 Emad Mostaque 畢業於牛津大學,獲數學和計算機科學碩士學位,此前曾在多家對沖基金擔任分析師。目前,該公司估值 10 億美元,除了 Stable Diffusion,還有 Dance Diffusion——可以進行音樂剪輯。

別慌,AI 繪畫殺不死藝術

Stability AI 的賺錢計劃是,為客戶訓練「私有」模型和通用基礎設施平臺。它有一個平臺 DreamStudio,個人使用者也能訪問。現在 DreamStudio 擁有超過 150 萬用戶,建立了 2 億張左右的影象。算上所有渠道,Stable Diffusion 使用者超過 1000 萬。

該公司還高調聘請了 Google 科學家、未來學家 Daniel Jeffries。

這算藝術嗎?

隨著各種各樣的人工智慧公佈,相關的道德法律問題也在增多。Stable Diffusion 允許生成真人影象,問題就愈發顯得「嚴重」。

Stable Diffusion 已經被使用者拿來創作了不少敏感內容,偽造的名人照片滿天飛。Getty Images 已經禁止上傳 Stable Diffusion 生成的圖片,原因是擔心智慧財產權糾紛。

美國眾議院眾議員 Anna G。 Eshooo 最近公開發信,敦促美國國家安全顧問和科學技術政策辦公室解決這些「不安全的模型」。

Stability AI 在釋出公告中,公佈了一份「允許商業和非商業用途的寬鬆許可證」,實際上就是和使用者之間的協議。它指望使用者自我規範行為,做「正確的事」,也沒什麼效力處罰不遵守規則的使用者。

別慌,AI 繪畫殺不死藝術

除了法律問題,人工智慧生成的作品,也飽受懷疑。

反正美國版權局認為這些影象「不是藝術」。今年 2 月,版權局的審查委員會就駁回了由人工智慧生成的圖片的索賠申請。

審查委員會強調,「人類作者身份是版權保護的先決條件」,並且需要「人類思想與創造性表達之間的關係」。美國聯邦法院也在近期的判決中認為人工智慧不能算專利「發明人」。

人工智慧藝術吸引力很大,雖然法律上不被承認,但市場承認。2018 年,佳士得就以 43。5 萬美元的價格出售人工智慧繪畫作品。而且,絕大多數消費者,都分辨不出 AI 繪畫和人類畫家的作品。

最具爭議的是今年 9 月的科羅拉多州博覽會(Colorado State Fair)的美術比賽,人工智慧的作品《空間歌劇院(Théâtre D’opéra Spatial)》獲得頭獎,由 Midjourney 製作,操作者 Jason Allen 說「藝術已經死了,人工智慧贏了,人類輸了」。

別慌,AI 繪畫殺不死藝術

其實倒不用一概而論,對人工智慧的創作,既無需樂觀過頭,也不用誇大悲觀。

人工智慧的藝術創作,是按人類的「邏輯」產生的,自然比不上人類精英,但超過其中的庸才,當然是綽綽有餘了。