人工智慧 – 模型、資料、到工程

我曾經教授一門以專案為導向的碩士畢業課程,內容關於人工智慧與機器學習。學生們可以自由選擇自己的專案,而我則指導他們完成整個過程。這種讓學生透過新挑戰和實際應用來學習的方法,與現實世界中的人工智慧實踐非常相似。
最初,我專注於教授底層的模型和理論。許多學生,或許是受到學術思維的影響,過度專注於模型。雖然模型是基礎,但至關重要的是要明白,它們並不是唯一的焦點。有些人錯誤地認為最先進、最複雜的模型總是必要的,而忽略了簡單模型通常能更有效地緩解的過度擬合風險。人們必須考慮使用複雜的解決方案是否真正適合手頭的任務。
下一個關鍵階段是資料。雖然看到模型收斂令人滿意,但資料問題的現實很快就會浮現。問題可能來自於資料的乾淨度、多樣性、完整性以及各種其他因素。作為指導老師,我會預先審查所有專案提案,在某些情況下,如果我預計會出現嚴重的資料稀缺或其他難以克服的資料挑戰,我會建議學生們更換專案。與資料搏鬥是學習的關鍵部分,能讓學生更接近實際應用。
最後,雖然學生在課程期間較少遇到,但還有工程挑戰。幾乎所有 AI/ML 產品最終都會達到這個階段。當追求更高的效能時——無論是速度、準確性還是規模——焦點就會轉向工程。這涉及處理完整的技術堆棧和大規模工程問題,通常需要超出教科書知識的專業技能。這種技能只能透過經驗和對實作細節的一絲不苟才能獲得。雖然資料仍然很重要,但效能最佳化需要調整許多其他工程參數。