廢中雜談: 有關AI 繪圖

2023年2月26日星期日

有關AI 繪圖

偶然在youtube 看到介紹AI 繪圖的片段，特地看一下才發現只出現了幾年的繪圖AI 已經進步到自己想像不到的程度。

有不少報道指出目前AI 繪圖的弱點在於人體結構，例如跌倒的構圖或是手指的方向等，但在一般情況下我完全分不出AI 繪圖和一般繪師畫出來的圖。以下圖片主要來自AI繪圖模型網站 "civitai.com" 的模型，我不認為一般人能分清這是由人還是由AI 創作出來的插畫。

當今的漫畫多數也有用電腦輔助，所以看起來和AI 做出來的圖差不多也是合情合理的? 我本來也是這樣想，如果換成照片的話自己應該能分得出真人跟AI "假人"。請看看以下兩張，AI 既能畫人也能畫風景，你真的還有信心能分辦出這是畫還是照片?

上邊兩張都是同一個模型的生成的圖像。使用AI 製圖時，我們要給予資料告訴AI 我們想要/不想要什麼，宅圈中的人戲稱這是呪文詠唱。例如上圖的大叔就用了"RAW photo, a portrait photo of 50 y.o japanese man in clothes, night tokyo, (high detailed skin:1.2), 8k uhd, dslr, soft lighting, high quality, film grain, Fujifilm XT3", 也有反面關鍵字"(earings, deformed iris, deformed pupils, semi-realistic, cgi, 3d, render, sketch, cartoon, drawing, anime:1.4), text, close up, cropped, out of frame, worst quality, low quality, jpeg artifacts, ugly, duplicate, morbid, mutilated, extra fingers, mutated hands, poorly drawn hands, poorly drawn face, mutation, deformed, blurry, dehydrated, bad anatomy, bad proportions, extra limbs, cloned face, disfigured, gross proportions, malformed limbs, missing arms, missing legs, extra arms, extra legs, fused fingers, too many fingers, long neck"。雖然是英文但很像外星文吧? 這就是這些關鍵字被稱呪文的原因。

使用AI 繪圖第一個問題是版權問題，一般人如我會想像這些圖片背後是基於無數圖片去掫取合成，所以這不能算原創，背後會有一大堆版權問題。但後來發覺是我想多了，在訓練過程中，AI 掫取的是畫風、筆觸甚至構圖。而開始繪圖時AI 是由零去創作，也沒有特地在素材中抄襲(你總不能說依照特定文法/筆觸是抄襲吧?)。版權方面則有點複雜，相比起你的關鍵字，中間的演算法才是重點。所以一般來說提供AI 繪圖服務的公司會有幾個方案，免費使用的話就按CC4.0可以在非商業中使用，付費的話版權就歸創作者。

20年前，我唸大學時Google 帶來了搜索引擎的突破；20 年後這些AI 的應用看來也能帶來另一波的突破。雖然技術面上我已經追不上(剛進公司的年輕人已經申請了ChatGPT account 再開server 然後連到TG 中讓我們玩)，但至少希望自己在應用面上能追貼一點，至少不至於被科技淘汰呢。

相關youtube 片段: