logo托特 | 部落格

ChatGPT 的 DALL·E-3 與 Mid Journey:生圖AI對比分析

Huaying Tsai
Huaying Tsai
2023年10月21日

結果的圖像與我描述的意圖高度契合。 最近,隨著 ChatGPT 推出的 DALL·E-3 圖像生成技術,生圖AI領域再次引起廣大的關注。身為 MidJourney 的使用者, 其實一直沒有辦法好好的利用它的能力來達成我要的目的,這次 ChatGPT 也出了圖像生成的功能,以下我將分享我所觀察到的差異並深入探討這兩者背後的運作原理。

我的測試與觀察

我的目標相當明確:製作與「托特」品牌息息相關的圖片。我用非常口語的方式描述我的需求,並夾帶了些關鍵字:讀書會、交換技能、找家教、斜槓、創業。

  • DALL·E-3:這個工具表現得相當聰明。它不僅捕捉到我所提供的每一個關鍵字,還能洞察其間的關聯,結果的圖像與我描述的意圖高度契合。當然,它不是完美的,比如文字有時出現錯誤,或某些細節未能完全符合我心中想要的。但整體來說,它完成了我心中70%的理想畫面。

DALL·E 2023-10-21 23.07.16 - Wide photo of a contemporary reading space with the brand name 'Thoth' elegantly written in the center. The background features a bookshelf filled wit.jpg

DALL·E 2023-10-21 23.07.17 - Wide illustration of a diverse group of people sitting in a semi-circle, actively engaged in reading and skill-sharing. Above them, the word 'Thoth' i.jpg

  • Mid Journey:相對之下,Mid Journey 更加注重每個詞語的具體含義。我認為它做的事情是把你的提示都繪入細緻的筆觸中。每一張圖像都像是經過藝術家的巧手塑造,生動展現了每一關鍵字的內涵。但可惜的是,當我下了以上關鍵字時,他並沒辦法接受到我想要的資訊。圖片很精緻美觀,但並不是我想要的樣子。

huaying0953_facebook_banner_education_skill_exchange_study_grou_b573490d-9a40-4412-997b-133af2bc22c7.jpg

使用場景總結

在我認為,MidJourney 就像是一個藝術大師,能量都在每一筆畫裡,細緻且有溫度。而 DALL·E-3 則是你的 UI 設計師,能依據你的需求做出有目的的圖畫。其實這兩個工具的核心,都是基於 Transformer 這個神經網絡架構,有可能是 ChatGPT 多了一層,把你的文字先消化了一遍以後幫你做出更精準的提示詞。正確答案還要請教專家了。

最後,每一個工具都有它的獨特性,希望這篇文章能幫助你根據自己的需求做出最佳選擇!

# 平台故事# 學習資源
聯絡我們 support@thoth.tw
托特部落格FacebookInstagram
隱私權政策
© 2024 托特 thoth
隱私權政策
© 2024 托特 thoth