作者:陳若玄
俗話說:「無好地基,著起無好厝。」
也就是說,如果我們不瞭解一項事物的基礎觀念,就難以運用這項知識或技術,取得良好與豐碩的成果。在生成式AI應用上也是相同的道理,若我們不明白甚麼是生成式AI,諸如它的定義、訓練過程、技術概念、特性、運作邏輯等,不明白它的結果是如何產生的,那麼我們也就無法妥善利用這項技術,協助自己創造更好的成果。
因此,在開始利用生成式AI輔佐我們做各種事情之前,讓我們回頭思考,甚麼是生成式AI?
💡甚麼是人工智慧(Artificial Intelligence, AI)?
在瞭解生成式AI之前,首先,更基礎的問題是「人工智慧」是甚麼?
顧名思義,人工智慧,就是希望能創造出模擬人類智慧的技術。(或許有些人會思考,那麼「智慧」是甚麼?但這牽扯到另外的概念了,我們改天再談。)
引用Cole Stryker和Eda Kavlakoglu非常淺顯易白的定義:「人工智慧是一種讓電腦和機器模擬人類學習、理解、解決問題、做決策、創造與自治的科技(Artificial intelligence (AI) is technology that enables computers and machines to simulate human learning, comprehension, problem solving, decision making, creativity and autonomy.)」。
所以,人工智慧的定義其實是相當廣泛的。我們常聽見的機器學習(machine learning)、深度學習(deep learning),及這篇文章要談的生成式AI(generative artificial intelligence),都是它一個發展。
這些名詞之間的概念,可以參考AI for Education繪製的這張圖:

💡甚麼是生成式AI?
所以,甚麼是生成式AI呢?白話地說,生成式AI就是一種專注於產生內容的AI技術。
引用McKinsey & Company的定義:「生成式AI是一種可以用來產生如聲音、編碼、圖像、文字等新內容的演算法,例如ChatGPT(Generative artificial intelligence (AI) describes algorithms (such as ChatGPT) that can be used to create new content, including audio, code, images, text, simulations, and videos.)」。
那麼生成式AI是怎麼運作的呢?Cole Stryker和Eda Kavlakoglu將運作過程分成三個階段:訓練(training)、微調(tuning),及產生、評估及更多的調整過程(generation, evaluation and more tuning)。
在訓練過程中,工程師會餵給演算法模型非常多的資料,讓模型從中學習。等到學習結束了之後,會進行模型的微調,讓模型可以更好地滿足它被創造的目的與需求。最後,就會進入產生資料、評估,以及調整的階段,如此重複幾次之後,生成式AI就成型了。
為什麼這樣生成式AI就完成了呢?我們再更白話一點來說明這件事情。
當我們還是學生的階段(也就是最初的演算法模型),學校給了我們許多教育(也就是訓練資料集),我們便會開始學習這些內容。根據不同的目的,我們學習不同的知識與技能程度可能也會不同(微調),然後經過表達與考試(也就是產生、評估),就會知道這個小孩子哪裡明白了,表現是否及格,若不及格就需要進行重補修等過程(再次進入微調的過程),最後成為取得學位(也就是成為正式可以利用的生成式AI模型了)。
在這樣的過程中,我們有兩件事情需要思考:
- 學生(生成式AI)在學習完相同的內容之後,儘管表現已經非常優異,仍有出錯的可能性。
- 學生(生成式AI)著重學習的學科不同,最後能呈現的知識和技能程度會不同。
因此,在使用生成式AI的時候,我們必須要知道:
- 生成式AI的答案可能有誤,因此必須要自己再查驗一次。
- 根據使用的目的,選用合適的生成式AI相當重要!
💡Garbage In, Garbage Out!(GIGO原則)
在資通科技領域中的基礎概念:「垃圾進,垃圾出!」
意思是,將不好的、無意義的資料提供給電腦系統,那麼系統也只能產出相同的垃圾,返回給使用者。
套用到生成式AI的概念上,我們有兩個面向可以切入思考:工程師端、使用者端。
首先,在工程師端,若一開始用來訓練AI模型的資料不夠好,就像是我們給學生的教材亂編,那麼學生的學習成果可能會不好。
再者,我們培養了一批語文資優生(語文強項的生成式AI),結果使用者卻用來詢問與回答微積分問題,那麼可想而知,不會獲得太好的結果。同樣的道理,如果我們今天沒有釐清自己的問題,就到處找人問問題,一般人都有可能聽不懂我們的需求了,何況是AI模型呢?
因此,再次證明了根據使用目的選用合適的AI模型,以及(對人或對AI)問問題的技巧,都有多麼重要!
所以,下一篇文章,我們將會探討怎麼向AI問問題(指令工程),以及如何評估AI給予的回覆。
參考資料:
- Stryker, C. & Kavlakoglu. (n.d.). What is AI?. https://www.ibm.com/think/topics/artificial-intelligence
- Mckinsey & Company. (2024). What is generative AI?. https://www.mckinsey.com/featured-insights/mckinsey-explainers/what-is-generative-ai
- AI for Education. (2023). Genrative AI explainer. https://www.aiforeducation.io/ai-resources/generative-ai-explainer