四格諧音梗對話圖的創意生成

四格諧音梗對話圖的創意生成
探索藝術與語言的幽默結合，創造更具影響力的作品，促進心理健康
指導老師 : 余瑞琳老師
專題成員 : 郭鎧瑄、黃舜煜、關赫、陳佳暐、黃郁軒、陳亮安、李宗哲
研究動機與目的
四格漫畫與梗圖的結合：加強視覺與傳播力
在台灣，諧音梗無所不在，無論是日常對話、廣告標語，甚至是政治宣傳，都可以看到諧音的影子。這種語言遊戲能帶來幽默感，增加互動性，使得溝通更有趣味。人們透過創意性的諧音梗，將複雜的資訊簡單化，或是用輕鬆的方式討論嚴肅話題。
如果我們能將諧音梗以四格漫畫的方式呈現，必定能帶來更強的衝擊力。四格漫畫的敘事方式簡單且具有節奏感，能讓讀者迅速理解並產生共鳴。此外，漫畫搭配梗圖的設計，更能吸引社群媒體的使用者，促進分享與二次創作，進而擴大影響力。
步驟一
我們希望透過蒐集網路上的諧音梗,並利用強大的語言模型 GPT-2 來訓練模型。透過這樣的方式,我們期望能夠自動生成有趣的四格諧音梗對話圖。
諧音梗是一種常見且深受大家喜愛的幽默形式,能夠帶來輕鬆愉悅的體驗。我們認為如果能夠自動生成這種類型的內容,不僅能夠節省創作者的時間和精力,也能為網路使用者帶來更多歡樂。
步驟二
要製作有趣的諧音梗圖,首先要找到最適合的場景。選擇生動有趣的背景設置,可以為對話增添許多新意。
透過強大的語言模型(LLM)技術,我們能夠快速生成豐富創意的場景描述。這不僅能夠為梗圖添加吸引人的元素,也能大幅提高整個創作過程的效率。
步驟三
在創作有趣的諧音梗圖時,首先要找到適當的情境圖片作為基礎。這些圖片可以透過使用Stable Diffusion等AI生成技術來獲得。有了生動有趣的圖片作為起點,才能進一步發展出引人入勝的對話內容。
利用Stable Diffusion等AI技術,我們可以快速生成各種不同風格的圖片素材。這不僅能夠滿足創作者的需求,也能大幅提高整個創作過程的效率。
步驟四
在完成了前面的幾個步驟後,接下來就是要將生成的文本內容和情境圖片結合在一起,形成一個完整的漫畫布局。這一步需要使用到圖像處理庫Pillow來完成。
Pillow是一款強大的Python圖像處理庫,它提供了豐富的API可以用來對圖像進行各種操作。我們可以利用Pillow來將步驟一生成的文本元素與步驟三生成的情境圖片進行融合,從而創造出一個具有喜劇感的四格漫畫。
在使用Pillow進行圖像合成時,需要考慮到文本元素的大小、位置、對齊方式等因素,確保它們能夠自然地融入到整個漫畫畫面之中。同時,還要注意字體、顏色等細節,讓整個作品的視覺效果更加協調統一。
步驟五
經過反复的調整和優化,我們終於完成了這個富有創意和幽默感的四格諧音梗對話圖
研究結果 - 笑話生成
起始句：
五月是哪一種動物睡覺的月份?
回應句：我不知道
答案： 豹，因為豹睡月
起始句：
 生病的樹要種在哪邊?
回應句：我不知道
答案：江邊，因為行江救木
結論
我們能靈活且低成本生成諧音梗圖，並且依需求的不同，客製化使用工具，生成多樣化的場景，我們製作出的諧音梗生成器，使用者使用門檻低，能幫助創作生成各式式諧音梗梗圖。
 未來展望
持續提高諧音梗多樣性，未來我們嘗試加入更多諧音梗樣本訓練模型
增加評分的指標提供有效的標準來衡量模型輸出的質量
圖片與笑話的匹配度可提升，著重將場景的敘述更加完善，讓生成出的圖片符合我們的需求
Made with Gamma