當下最火的AI作畫神器Midjourney已暫停免費試用。其公司創始人兼CEO David Holz表示,做出此舉的主要原因是新用戶的大量涌入。
David Holz在本周二公布了這項決定,他在社交軟件Discord上發布消息時,提到了存在 “怪異需求和試用濫用”。Holz還表示叫停免費服務 “是因為很多人為了回避付費而注冊一次性賬戶”。
但Holz之前曾經提到 “濫用”,這讓人們不禁懷疑此次叫停也許與 Midjourney 近期生成的一系列病毒式傳播圖像有關。包括 Trump 被捕和教皇身著時尚夾克的偽造圖像,都被部分網民誤認為真實存在。
不過 Holz 自己將早期報道稱為“誤讀”,并強調 Midjourney 的免費試用服務從未開放過最新版本的 Midjourney 5,而這些病毒圖片中的逼真圖像似乎是出自這個最新版本之手。
Midjourney 5 顯著提高了人物圖像的描繪質量。例如,以往 AI 生成圖像總是處理不好手部形態,這在新版本中已不再是問題。光照和面料質感更加真實,新系統還能生成無數名人和公眾人物的形象。
技術層面的改進,也讓 Midjourney 的新作在最近幾周迅速躥紅。其中不僅包括 Trump 被捕和教皇身著時髦服裝等噱頭滿滿的照片,還有法國總統馬克龍走過巴黎抗議隊伍、馬斯克與美國政界“最美女議員” 亞歷山德里婭·奧卡西奧-科爾特斯牽手等真假難辨的場景。
到目前為止,Midjourney 通過偽造圖像引發政治威脅的反應還比較零散,也沒有激起該公司對管控政策的重大調整。
Midjourney 的內容限制確實比其他競爭對手(例如 OpenAI 的 DALL-E)更寬松,但目前的管控寬松之王仍然是 Stable Diffusion。
Holz 提到,“把握合理的尺度非常困難,我們很快就會推出改進的系統。我們正在聽取專家和社區的反饋和建議,希望努力做到審慎適度。”
Holz 去年 10 月曾經提到,Midjourney 保留了一份禁用詞清單。“根據各國家/地區用戶的投訴,這些禁用詞與不同國家/地區的習俗相關。”但 Midjourney 并沒有公開完整的禁用詞清單,免得引起“麻煩”。Holz 強調,“除非是要專門跟我們的‘服務條款’對著干,否則幾乎沒人會注意到‘禁用詞清單’。別用我們的工具來找麻煩。”
但隨著偽造圖片鋪天蓋地涌出,Midjourney 公司開始擴大這份清單。例如最近他們已經開始禁用“逮捕”一詞,這似乎是在回應調查記者 Eliot Higgins 在熱門推文中公布的“Trump 被捕瞬間”。Higgins 隨后表示,他的 Midjourney 賬戶已經被封禁。
但這類限制并不難繞過。根據實際測試,雖然無法直接生成“Trump 被捕”的圖像,但使用“Trump 戴著手銬,身邊圍著多名警察”的提示詞也能得到相似的輸出。
目前,Midjourney 仍未恢復免費試用服務,但后續可能有所松動。Holz 表示,“我們仍在想辦法更好地開放免費試用。之前我們要求提供真實有效的郵件地址,但這顯然不夠,所以現在還要認真規劃一番。”
Midjourney v5 逼真程度驚艷眾人
3 月 17 日,Midjourney 發布了其商用 AI 圖像合成服務的第 5 版。該服務可以生成非常逼真的圖像,其質量水平極高,一些 AI 藝術愛好者認為這些輸出令人毛骨悚然且“過于完美”。Midjourney v5 現在處于 alpha 測試階段,提供給訂閱 Midjourney 服務的客戶,該服務可通過 Discord 獲取。
“MJ v5 給我的感覺就像是在長期視力不佳,自己都習慣了以后終于戴上了眼鏡,”經常在 Twitter 上分享她用 Midjourney 創作的平面設計師 Julie Wieland 這樣評價。“突然間你看什么都是 4k 效果,感覺不可思議但又令人驚嘆。”
Wieland 與 ArsTechnica 分享了她用 Midjourney v5 創作的一些作品。Midjourney 初版于 2022 年 3 月首次發布,而最新的這些作品確實能看出圖像細節的明顯進步。該服務第 3 版于 8 月推出,第 4 版于 11 月首次亮相。
Midjourney 的工作機制與 Stable Diffusion 和 DALL-E 等圖像合成器相近,它使用了經過數百萬人造藝術作品訓練的 AI 模型,根據稱為“提示”的文本描述生成圖像。
最近,Midjourney 陷入了版權爭議的風暴,一本使用該服務早期版本的漫畫書引發了版權質疑。
在對 v5 做了一天的試驗后,Wieland 注意到新版改進之處包括“極其逼真的”皮膚紋理和面部特征;更逼真的或電影照明;更好的反射、眩光和陰影;更具表現力的角度或場景概覽,以及“近乎完美且不再搖搖晃晃的眼睛”。
在過去的一年里,人工智能藝術作品生成器無法正確渲染手這一情況甚至成了網上流行的梗。但值得注意的是,Midjourney v5 可以很好地生成逼真的人手。“大多數時候,它畫出來的手是正確的,一只手有 5 個手指,而不是7~10個,”Wieland 說。
在新版服務的 Discord 發行說明中 Midjourney 還指出,v5 現在的輸出比 v4 具有“更廣泛的風格范圍”,同時對提示更加敏感,生成的無意義文本更少,圖像分辨率也翻倍了。
對 AI 藝術愛好者來說,如果要談一談 Midjourney 新版輸出看起來有什么缺點,可能就是生成的圖像如此逼真和“完美”,以至于模型的高精度帶走了“一些重復生成 AI 圖像以找到合適結果”的快感——人們可能把這種現象稱為“老虎機效應”。
盡管一位名叫 PhilippLenssen 的 Twitter 用戶指出,“如果你想出了一個圖像主題想用它實現,選圖的過程還是有點像摸彩,但中獎機會比 v4 更高。”
相關新聞