ChatGPT 的 DALL·E-3 與 Mid Journey：生圖AI對比分析

Huaying Tsai

2023年10月21日

結果的圖像與我描述的意圖高度契合。最近，隨著 ChatGPT 推出的 DALL·E-3 圖像生成技術，生圖AI領域再次引起廣大的關注。身為 MidJourney 的使用者, 其實一直沒有辦法好好的利用它的能力來達成我要的目的，這次 ChatGPT 也出了圖像生成的功能，以下我將分享我所觀察到的差異並深入探討這兩者背後的運作原理。

我的測試與觀察

我的目標相當明確：製作與「托特」品牌息息相關的圖片。我用非常口語的方式描述我的需求，並夾帶了些關鍵字：讀書會、交換技能、找家教、斜槓、創業。

DALL·E-3：這個工具表現得相當聰明。它不僅捕捉到我所提供的每一個關鍵字，還能洞察其間的關聯，結果的圖像與我描述的意圖高度契合。當然，它不是完美的，比如文字有時出現錯誤，或某些細節未能完全符合我心中想要的。但整體來說，它完成了我心中70%的理想畫面。

DALL·E 2023-10-21 23.07.16 - Wide photo of a contemporary reading space with the brand name 'Thoth' elegantly written in the center. The background features a bookshelf filled wit.jpg

DALL·E 2023-10-21 23.07.17 - Wide illustration of a diverse group of people sitting in a semi-circle, actively engaged in reading and skill-sharing. Above them, the word 'Thoth' i.jpg

Mid Journey：相對之下，Mid Journey 更加注重每個詞語的具體含義。我認為它做的事情是把你的提示都繪入細緻的筆觸中。每一張圖像都像是經過藝術家的巧手塑造，生動展現了每一關鍵字的內涵。但可惜的是，當我下了以上關鍵字時，他並沒辦法接受到我想要的資訊。圖片很精緻美觀，但並不是我想要的樣子。

huaying0953_facebook_banner_education_skill_exchange_study_grou_b573490d-9a40-4412-997b-133af2bc22c7.jpg

使用場景總結

在我認為，MidJourney 就像是一個藝術大師，能量都在每一筆畫裡，細緻且有溫度。而 DALL·E-3 則是你的 UI 設計師，能依據你的需求做出有目的的圖畫。其實這兩個工具的核心，都是基於 Transformer 這個神經網絡架構，有可能是 ChatGPT 多了一層，把你的文字先消化了一遍以後幫你做出更精準的提示詞。正確答案還要請教專家了。

最後，每一個工具都有它的獨特性，希望這篇文章能幫助你根據自己的需求做出最佳選擇！

# 平台故事# 學習資源