CDA三級認證考試往期實操計畫原題
主講老師:李禦璽
【專家講師】
李禦璽 (Yue-Shi Lee),台灣大學電腦工程博士,銘傳大學電腦工程學系教授兼系主任暨所長,銘傳大學資料探勘中心主任,廈門大學資料探勘中心顧問,中國人民大學資料探勘中心顧問。其研究領域專註於資料倉儲、資料探勘、與文本挖掘。
在其相關研究領域已發表超過 300 篇以上的研究論文,同時也是國科會與教育部多個相關研究計劃的主持人。
服務過的客戶包括:中國工商局、中信銀行、台新銀行、聯邦銀行、新光銀行、第一銀行、永豐銀行、遠東銀行、美商大都會人壽、新光人壽保險公司、台灣微軟、零售業如全聯、赫蓮娜 (Helena Rubinstein) 化妝品公司、特立和樂 (HOLA) 公司、航空公司如東方航空公司、中華航空公司、汽車行業如福特 (Ford) 汽車公司;政府行業如中國工商局、國稅局等。
【課程大綱】
第一天 進階機器學習技術(半監督式學習、利潤最大化學習、目標類別不平衡學習、整合學習)及實操案例分享
傳 統模型評估方法與利潤最大化評估方法
增益圖與利潤圖
案例一:利潤最大化模型實作: 以產品行銷模型為例 (2018/12考題)
目標類別不平衡的問題
目標類別不平衡的處理方式
案例二:目標類別不平衡模型實作: 找出有資金需求的中小企業借貸戶並銷售其貸款產品 (2019/12考題)
傳統監督學習方法與非監督學習方法
半監督學習方法概述
案例三:半監督學習模型實作: 以電信業客戶流失模型為例 (2019/6考題)
傳統學習與整合學習
整合學習的分類:模型融合與機器學習元演算法
案例四:整合學習方法實作與比較: 從租賃特征、房源特征、房主特征、位置特征、以及聲譽特征的資訊,預測共享住宿的日租價格 (2022/9考題)
第二天 英文文本分析技術、Hugging Face經典英文模型使用及實操案例分享
文本分析簡介及文本分析流程
英文文本數據預處理方法 (詞性標註、字根還原、停用詞處理、關鍵詞擷取、詞袋模型)
案例五:英文文本分析模型實作: 從產品的消費者評論中辨識此評論的情緒是正評或負評 (2021/09)
案例六:英文文本分析模型實作: 從評論資訊中辨識此評論是否為不當的評論 (2021/12)
案例七:英文文本分析模型實作: 從產品的圖片及產品的描述資訊中,預測哪些是相同的產品 (2023/03)
案例八:英文文本分析模型實作: 從文章的描述資訊中,預測此文章是否由AI所產生出來的 (2023/06)
案例九:英文文本分析模型實作: 從兩兩一組的文章段落中,預測哪些在語意上是具有高度語意相似性 (2023/ 0 9)
Hugging Face經典英文語言模型使用並與傳統機器學習模型比較
第三天 中文文本分析技術、Hugging Face經典中文模型使用及實操案例分享
中文文本數據預處理方法 (分詞、詞性標註、停用詞處理、關鍵詞擷取、詞嵌入模型)
案例十:中文文本分析模型實作: 從貼文的資訊中預測此貼文是否能獲得高響應 (2021/3)
案例十一:中文文本分析模型實作: 從貼文的短資訊中辨識此貼文的情緒 (2021/6)
案例十二:中文文本分析模型實作: 從使用者過去的觀影行為、電影名稱以及電影劇情描述的資訊,預測使用者對電影的評分 (2022/06)
案例十三:中文文本分析模型實作: 從產品描述的資訊中,預測產品類別 (2022/12)
Hugging Face經典中文語言模型使用並與傳統機器學習模型比較
第四天 影像分析技術、Hugging Face及Facenet經典影像嵌入模型使用及實操案例分享
影像處理基礎 (opencv、人臉偵測、人臉特征擷取、人臉辨識)及遷移學習(Transfer Learning)
案例十四:影像分析模型實作: 從兩兩一組的植物影像中,預測哪些影像是相同的植物,哪些是不同的植物 (2023/12)
案例十五:影像分析模型實作: 從給定的汽車影像中,預測汽車的廠牌以及它的顏色 (2024/03)
案例十六:影像分析模型實作: 從給定的人像中,進行人像聚類,並將相似的人像聚在一同一群中
Hugging Face經典影像嵌入模型模型使用並與傳統機器學習模型比較
Facenet人臉定位及嵌入模型使用並與傳統機器學習模型比較
【課程收益】
透過本課程的培訓,上課學員應具備以下能力:
(1) 掌握利潤最大化學習技術,並套用於產品行銷模型的建置;
(2) 掌握目標類別不平衡學習技術,並套用於銀行貸款模型的建置;
(3) 掌握半監督式機器學習技術,並套用於電信客戶流失模型的建置;
(4) 掌握並實作整合學習技術,並套用於共享住宿日租價格模型的建置;
(5) 掌握英文文本分析的流程及預處理技術;
(6) 實作社群網站的英文貼文響應分析模型;
(7) 實作社群網站的英文貼文情緒分析模型;
(8) 實作電影網站的電影評分模型;
(9) 實作產品分類預測模型;
(10) 運用Hugging Face的大型英文預訓練語言模型解決英文文本分析的問題;
(11) 掌握中文文本分析的流程及預處理技術;
(12) 實作消費者評論的情緒分析模型;
(13) 實作不當評論的分析模型;
(14) 實作從產品的圖片及產品的描述資訊,預測相同產品的分析模型;
(15) 實作AI文章鑒識預測模型;
(16) 實作語意相似性模型
(17) 運用Hugging Face的大型中文預訓練語言模型解決中文文本分析的問題;
(16) 實作貼文高響應預測模型
(17) 實作貼文情緒預測模型
(18) 實作電影的評分預測模型
(19) 實作產品分類模型
(20) 實作植物影像辨識模型
(21) 實作汽車廠牌及顏色辨識模型
(22) 實作人像聚類模型
(23) Hugging Face經典影像嵌入模型模型使用
(24) Facenet人臉定位及嵌入模型使用
課程特色 |
|
課程物件 |
|
課程時間 | 202 4年7月 2 0日 -2 1日、27-28日(兩個周末) |
課程收費 | 面授 4 6 00 元 / 人,遠端直播 3 8 00 元 / 人。 ( CDA 持證人會員、全日制在讀本科、研究生享九折優惠。) |
課程方式 | 北京西直門中坤大廈 / 線上直播 |
授課時間 | 上午 9 : 00-12 : 00 ,下午 13 : 30-16 : 30 。 |
其 他 安排 |
|
【繳費帳戶】
公司名稱:北京國富如荷網路科技有限公司
開戶行:中信銀行北京福碼大廈支行
帳號:8110701012702422581
行號:302100011536
【咨詢報名】
樊老師
電話: 18611083334
QQ: 646658992
微信:fanyuliangnb
備註:機器學習報名
以上圖文為廣告內容