課程概述與目標(Course Overview and Goals):多模態生成式 AI 模型的運作方式就像人類利用各種感官來感知現實一樣。如同映照了大腦結合感官輸入以對世界形成細緻、全面的理解的能力,多模態生成式 AI 模型,透過全方位模態(Omnimodal AI)無縫感知多種輸入並同時生成輸出的能力,使其能夠以創新、變革的方式與世界互動,代表著 AI 領域的重大進步。本課程將認識生成式AI朝向多模態 AI 的轉變,這潛藏著更大範圍的應用和更複雜的使用案例的可能性。透過結合來自不同來源的不同類型內容(包括文字、圖像、音訊和影片)的優勢,多模態生成式 AI 模型能夠以更全面的方式理解數據,能夠處理更複雜的查詢,並減少不準確或誤導性的輸出。