藝術創(chuàng)作中的人工智能生成方式研究
引言
人工智能(Artificial Intelligence),是智能學科重要的組成部分,在機器人、語言識別、圖像識別、自然語言處理、專家系統(tǒng)、機器學習,計算機視覺等方面都有著深遠的發(fā)展。在發(fā)展的過程中,取得了一系列突破,其中有關于人工智能生成內容,也就是AIGC,更是引起了非常廣泛的關注。而藝術是對人類心理活動的映射,無論任何藝術作品的完成都離不開人類的藝術思維。
文章初步要概括藝術思維的概念與分類,分析生成式人工智能,探討藝術思維與人工智能中生成式人工智能在藝術領域中的關系,以及對未來進行展望。
一、人類藝術思維的概念與分類
藝術思維所指的就是現(xiàn)代藝術家在進行藝術創(chuàng)作時經(jīng)常使用的思維方式,具有很強的概括作用。對客觀世界在感性的技術上進行學習、概括、推理以及歸納。在創(chuàng)作時主要依靠的除了高超的藝術技能外,最重要就是藝術思維的把握。
(一)形象思維
形象思維是藝術創(chuàng)作的主要思維方式,以直觀形象和表象為支柱的思維過程。藝術家在認識世界的過程中,對于客觀事物的表象進行了解和取舍。在對生活累積感受和在大腦中進行有選擇的存儲后,結合人成長過程中所形成的感性判斷,來進行手段形式的選擇,創(chuàng)造出符合思維的一種視覺形象。
(二)抽象思維
抽象思維又名邏輯思維,通常情況下會運用語言、符號、理論、概念、數(shù)字等抽象材料來完成活動實踐。形象思維偏向于本元,無論人在發(fā)展中如何變化,形象思維都如同根一樣扎根在人的大腦中。而抽象思維則如同枝蔓一樣,在成長過程里不斷的被外界所影響,從而進行學習與變化,發(fā)展出的一種工具性思維方式。
(三)靈感思維
靈感思維在藝術方面里體現(xiàn)在藝術創(chuàng)作過程中,大腦里會突然涌現(xiàn)出靈感的一種思維過程。這一現(xiàn)象的產生正是因為人的大腦皮層處于高度興奮時的一種狀態(tài),從而迸發(fā)出來的想法,即憑直覺領悟事情的本質。
“靈感”一詞最早源自于希臘,柏拉圖在德謨克里特、蘇格拉底闡釋的基礎上,將靈感說系統(tǒng)化、理論化,引用到文學創(chuàng)作里。他認為詩人創(chuàng)作的優(yōu)秀詩歌靠的是神賜予的靈感而不是技藝。古希臘哲學家德謨克利特曾說:“一位詩人以熱情并在神圣的靈感之下所作成的一切詩句,當然是美的”。這更加說明了靈感思維在藝術創(chuàng)作中屬于創(chuàng)新的核心。
二、生成式人工智能的發(fā)展及特征
生成式人工智能是一種利用復雜的算法、模型和規(guī)則。生成模型不僅可以學習輸入和輸出之間的關系,還學習了生成輸入數(shù)據(jù)的過程。它可以分析不同數(shù)據(jù)的關系來生成新的樣本。生成式人工智能的出現(xiàn)凝聚了人類社會的智慧,并且也會對我們社會產生一定的反作用。
(一)生成式人工智能的發(fā)展歷程
生成式模型在人工智能領域有著悠久的歷史。隱馬可夫模型是一連串事件接續(xù)發(fā)生的機率,用以探索看不到的世界,現(xiàn)象和事實的數(shù)學工具,而高斯混合模型可以用高斯概率密度函數(shù)(正態(tài)分布曲線)精確地量化事物。這兩個模型在上個世紀50年代被開發(fā)出來,生成了序列數(shù)據(jù),比如語音或時間序列。
神經(jīng)網(wǎng)絡(Neural Network)也被稱為人工神經(jīng)網(wǎng)絡,是深度學習算法的核心。靈感來源于人腦內部的神經(jīng)元,模仿生物神經(jīng)元之間相互傳遞信號的方式,從而達到學習經(jīng)驗的目的。神經(jīng)網(wǎng)絡在1943年被提出,這個神經(jīng)元模型開啟了人類研究生物神經(jīng)網(wǎng)絡的篇章。
生成式人工智能與藝術領域的新結合則是在1971年,加州大學圣地亞哥分校的科恩教授進行機械臂的繪畫嘗試,這是最早的AI繪畫實踐。在之后的時間里,人類探索出了VAE和GAN,圖像生成后面的發(fā)展,很大程度是建立在這兩個模型之上。而現(xiàn)如今,因為GAN模型在生成器和判別器上的缺陷,加州大學伯克利分校的學者提出去噪擴散模型DDPM,衍生出近幾年關注度極高的繪圖網(wǎng)站DALL-E2,Stable Diffusion,Midjourney和NovelAI等等。
(二)生成式人工智能的基本特征
1. 隨機性與視覺一致性
藝術家在構建生成式算法時,雖然可以設定圖形紋理、顏色配比、對稱性等參數(shù)。算法的隨機性會讓每一件作品都不一樣,但是整個體系的作品也會具有視覺表達的整體一致性。以Midjourney舉例,2022年7月12日上線。只需要用戶輸入文本就可以得到需要的圖像。而用戶輸入提示詞后,系統(tǒng)會生成4張圖片。這四張圖片風格統(tǒng)一,細節(jié)各不相同。在用戶輸入更改風格的提示詞后,系統(tǒng)依舊生成另外四張其他系列的圖像。
2. 高效率和易迭代
相比于傳統(tǒng)的藝術創(chuàng)作需要從藝術體驗、藝術構思再到藝術創(chuàng)作等長周期的活動來看。生成式人工智能往往可以跨過藝術體驗和創(chuàng)作等步驟。藝術創(chuàng)作者僅需要藝術構思,即從傳統(tǒng)藝術主體創(chuàng)作者,轉變?yōu)樗囆g創(chuàng)作系統(tǒng)的架構著。在完成生成系統(tǒng)程序的建構后,就可以重復的去使用。除了可以設置主體風格,還可以將程序遷移到不同的生成藝術作品創(chuàng)作中結合使用。
三、藝術思維與生成式人工智能的關系
從仿生學的角度來看,生成式人工智能主要依賴的模型——神經(jīng)網(wǎng)絡模型,與人腦神經(jīng)元有著密不可分的關系。人工智能的大腦就是一臺高智能的計算機,來模仿人腦的活動內容,并且針對于人類日常生活中的一些習慣與活動來進行規(guī)律的總結。
每個人的人腦都由數(shù)十億的神經(jīng)元構成,是神經(jīng)系統(tǒng)最基本的結構和功能單位,中間由細胞體作為獨立的個體,周圍的突起部分將每個神經(jīng)元進行連接。區(qū)別于人類神經(jīng)元的分布規(guī)律錯綜復雜,神經(jīng)網(wǎng)絡的神經(jīng)元按照一定的規(guī)則連接起來,形成了一個神經(jīng)網(wǎng)絡,每一排的神經(jīng)元需要通過訓練,來下發(fā)不同的任務。
了解了有關于人類神經(jīng)元和神經(jīng)網(wǎng)絡中神經(jīng)元的異同,同比到藝術視角下,二者依舊有著千絲萬縷的聯(lián)系。從一般意義來講,傳統(tǒng)對于藝術的創(chuàng)作過程可以分為三類。即清代畫家鄭板橋總結歸納的“眼中之竹、胸中之竹和手中之竹”分別對應了藝術體驗、藝術構思和藝術表現(xiàn)。
(一)藝術體驗與數(shù)據(jù)采集
藝術體驗是整個創(chuàng)作過程的第一步,是一切藝術創(chuàng)作的前提和基礎。在實際的藝術創(chuàng)作中,藝術家需要對想表達的作品進行地域性的深入了解,才能創(chuàng)作出一幅真正具有地方或是種族特色的藝術作品。
徐悲鴻的馬十分經(jīng)典,不同形態(tài)的馬通過水墨簡單勾勒就能傳達出神韻。正是因為他通過與馬在實際的觀察與寫生,才能夠對于馬的形態(tài)、肌肉以及生活中的習性了如指掌。
而生成式人工智能想要進行精確的圖像生成,自然而然地就需要前期對于數(shù)據(jù)的大量采集。從而獲取高質量、多樣性和豐富性的數(shù)據(jù),以滿足人工智能算法和模型的需求。其中主要依賴于圖像數(shù)據(jù)采集和語音數(shù)據(jù)采集等等。
使用圖像采集需要選擇多分辨率和類型的圖像進行獲取。為了保證數(shù)據(jù)質量,采集前需要對所有圖像進行簡單的字符串或文本標注。2021年1月OpenAI使用了大約120億的參數(shù)量對其進行訓練,可以應用于任意的視覺分類任務。與同時期的其他競爭者拉開差距。數(shù)據(jù)采樣越多,就意味著可以匹配越多的視覺分類,在選擇上就可以找到更加準確的數(shù)據(jù)庫。
(二)藝術構思與模型架構
藝術構思則是藝術創(chuàng)作的第二部,在完成了藝術體驗后。藝術家需要將腦中對于最終想法來進行和施行的方案?;谏钪械乃夭膩砀脑靹?chuàng)作,將零散的碎片拼湊出完整的視覺形象。實現(xiàn)自己對于審美價值的藝術意象。
藝術構思大體可以分為三個階段,具體進行時各階段的區(qū)分不是絕對的。以美國著名大地藝術家羅伯特·史密森創(chuàng)作的《螺旋形的防波堤》舉例。首先藝術家要在生活中因為某一個人、事、物的觸發(fā)從而產生表現(xiàn)欲望,而該作品所處18世紀中期,工業(yè)文明盛行。藝術家認為工業(yè)文明帶來了很多負面的結果,所以他想通過大地藝術來完成一場人與自然的對話。第二階段為對需要加工的材料進行選擇、提煉,重新排列組合,讓藝術作品的雛形在腦海中愈發(fā)清晰。《螺旋形的防波堤》的構思以一個大型的螺旋狀來表達湖水的流動與大自然的“鬼斧神工”。 第三階段則需要一些靈感,從而讓大腦處于活躍的狀態(tài),把已具雛形的藝術意象進一步具體、生動、典型化,使之成為栩栩如生的藝術形象。
人腦新皮質的皮質柱的神經(jīng)元結構是微小的柱狀體,且結構是不變的,通過大腦新皮質中約50萬個皮質柱,我們可以在大腦中儲存大量的信息,作為功能列表存儲起來,形成知識的“模塊”。當我們需要使用的時候,我們可以將各“模塊”自由組合,通過學習能力,將舊知識運用于新的經(jīng)驗上,在這一點上,人工智能大腦是還需要學習和進步的。
生成式人工智能在收集大量數(shù)據(jù)后,大多數(shù)網(wǎng)站依靠著Transformer的模型架構來對數(shù)據(jù)進行梳理和擺放。在其核心位置,Transformer模型由編碼器和解碼器兩個模塊進行組合。完整的Transformer模型通過將多個編碼器和解碼器層堆疊在一起來構建。每個層獨立處理輸入序列,使模型能夠學習分層表示并捕獲數(shù)據(jù)中的復雜模式。編碼器將其輸出傳遞給解碼器,后者根據(jù)輸入生成最終的輸出序列。
人腦的藝術構思雖然較比人工智能更為隨意,但二者都需要對所處容量的數(shù)據(jù)做出內容與數(shù)量的選擇。一味的以多來取勝并不可靠,反而會影響最終效果的呈現(xiàn)。
(三)藝術表現(xiàn)與圖像生成
經(jīng)過藝術體驗與藝術構思前兩個步驟,想要將藝術家腦中的想法付諸于實踐的落實活動,將藝術意象物態(tài)化就是藝術表現(xiàn)。藝術表現(xiàn)需要運用手段與技巧,來將前面的藝術體驗與構思進行捏合與實踐,完成藝術意象物態(tài)化。本質上是一種審美表現(xiàn)活動。如同梵高所繪畫的《星月夜》,無論是從個人經(jīng)歷還是藝術構思,最終所以色調和極其具有藝術風格的線條,表達出了他希望通過自己身邊的事物去描繪他內心的想法。希望大家通過畫去了解他當時處境是多么的艱難,但他依然在努力的向上生長造作,直到死去。
而目前生成式人工智能普遍依賴于擴散模型來進行圖像的生成。用戶只需要在界面輸入關鍵詞,系統(tǒng)就會在數(shù)據(jù)庫中進行相關文本與圖像的連接,生成更加真實和更加準確的畫像。以最新生成式人工智能的成果Sora舉例,通過文本指令,Sora 可以直接輸出長達 60 秒的視頻,并且包含高度細致的背景、復雜的多角度鏡頭,以及富有情感的多個角色。通過觀察大量數(shù)據(jù),系統(tǒng)學會了許多關于世界的物理規(guī)律。但也在一些個別情況下會超出電腦的運算范圍,出現(xiàn)不合邏輯的漏洞,例如多跟手指或者是平地起高樓的情況。
有趣的是和人類不同,人類可以在藝術實踐中感受到與設想不足之初并加以改善。但是在人工智能眼里,一切還沒有完善的程序內所做出的決策都是正確的,往往會產生出錯誤中的藝術。人之所以有思維,就是人可以自我的判斷一種情況的錯誤,是不是可以變成另一種情況的正確。人工智能的極限就是自我意識。如果它認為自己的漏洞是一種創(chuàng)新的話,那某種意義上來講他們也擁有著所謂的創(chuàng)新藝術思維。
四、結語
事實上,人類一直在探索關于知識與學習的奧秘,洞穴之喻(Allegory of the Cave)是柏拉圖在《理想國》中描述的對人類知識的基本想象。而洛克的白板說主張人生下來就是一塊白板,后天的學習與經(jīng)驗積累讓這張白紙有了內容。人工智能就是通過數(shù)據(jù)的輸入與歸類,來讓機器提高它的學習能力,而這里的數(shù)據(jù)就是我們人類所指的“經(jīng)驗”。在不斷的學習中機器模仿人類對于抽象思維和審美創(chuàng)造力。
人工智能作為人類實踐的產物,目前來看還只是作為輔佐人類藝術的工具,沒有具備真正意義上的主體性。作為客體,技術可以反推人的審美和生活。有沒有一種可能技術會反推人類發(fā)展出一個新的視覺領域和世界和思維空間,到那個時候主體與客體會達到一種新的平衡與統(tǒng)一。
從藝術思維到生成式人工智能,我們領略到了人腦與機器之間的關聯(lián)。通過對腦神經(jīng)的不斷挖掘與探索,可以優(yōu)化神經(jīng)網(wǎng)絡模型,為未來的藝術領域做出更大的貢獻。在這個過程中,我們也可以不斷的克服自身學習的局限和缺點,提升我們的藝術思維與方法,激發(fā)人類對于學習活動的更多思考,為人類帶來更加美好的未來。
文章來源: 《新美域》 http://12-baidu.cn/w/qk/29468.html
- 2025年中科院分區(qū)表已公布!Scientific Reports降至三區(qū)
- 官方認定!CSSCI南大核心首批191家“青年學者友好期刊名單”
- 2023JCR影響因子正式公布!
- 國內核心期刊分級情況概覽及說明!本篇適用人群:需要發(fā)南核、北核、CSCD、科核、AMI、SCD、RCCSE期刊的學者
- 我用了一個很復雜的圖,幫你們解釋下“23版最新北大核心目錄有效期問題”。
- 重磅!CSSCI來源期刊(2023-2024版)最新期刊目錄看點分析!全網(wǎng)首發(fā)!
- CSSCI官方早就公布了最新南核目錄,有心的人已經(jīng)拿到并且投入使用!附南核目錄新增期刊!
- 北大核心期刊目錄換屆,我們應該熟知的10個知識點。
- 注意,最新期刊論文格式標準已發(fā)布,論文寫作規(guī)則發(fā)生重大變化!文字版GB/T 7713.2—2022 學術論文編寫規(guī)則
- 盤點那些評職稱超管用的資源,1,3和5已經(jīng)“絕種”了