ChatGPT 的 DALL·E-3 與 Mid Journey:生圖AI對比分析
Huaying Tsai
2023年10月21日
結果的圖像與我描述的意圖高度契合。 最近,隨著 ChatGPT 推出的 DALL·E-3 圖像生成技術,生圖AI領域再次引起廣大的關注。身為 MidJourney 的使用者, 其實一直沒有辦法好好的利用它的能力來達成我要的目的,這次 ChatGPT 也出了圖像生成的功能,以下我將分享我所觀察到的差異並深入探討這兩者背後的運作原理。
我的測試與觀察
我的目標相當明確:製作與「托特」品牌息息相關的圖片。我用非常口語的方式描述我的需求,並夾帶了些關鍵字:讀書會、交換技能、找家教、斜槓、創業。
- DALL·E-3:這個工具表現得相當聰明。它不僅捕捉到我所提供的每一個關鍵字,還能洞察其間的關聯,結果的圖像與我描述的意圖高度契合。當然,它不是完美的,比如文字有時出現錯誤,或某些細節未能完全符合我心中想要的。但整體來說,它完成了我心中70%的理想畫面。
- Mid Journey:相對之下,Mid Journey 更加注重每個詞語的具體含義。我認為它做的事情是把你的提示都繪入細緻的筆觸中。每一張圖像都像是經過藝術家的巧手塑造,生動展現了每一關鍵字的內涵。但可惜的是,當我下了以上關鍵字時,他並沒辦法接受到我想要的資訊。圖片很精緻美觀,但並不是我想要的樣子。
使用場景總結
在我認為,MidJourney 就像是一個藝術大師,能量都在每一筆畫裡,細緻且有溫度。而 DALL·E-3 則是你的 UI 設計師,能依據你的需求做出有目的的圖畫。其實這兩個工具的核心,都是基於 Transformer 這個神經網絡架構,有可能是 ChatGPT 多了一層,把你的文字先消化了一遍以後幫你做出更精準的提示詞。正確答案還要請教專家了。
最後,每一個工具都有它的獨特性,希望這篇文章能幫助你根據自己的需求做出最佳選擇!
# 平台故事# 學習資源