當前位置: 妍妍網 > 資訊

Python師資培訓系列課程丨專為學術套用量身打造

2024-04-25資訊

Python學習路徑建議

編程基礎及數據清洗→(爬蟲)→機器學習→文本分析&機器學習進階

Python師資培訓課程矩陣

  • 編程基礎與數據清洗

  • 爬蟲套用

  • 文本分析

  • 機器學習

  • 機器學習進階

  • 課程資訊

    課程時長:

    編程基礎:918分鐘

    爬蟲:611分鐘

    文本:611分鐘

    機器學習:2160分鐘

    深度學習:1440分鐘

    上課方式: 線上學習,提供全部資料及授課老師答疑

    授課與答疑均是授課老師陳遠祥本人,非助教答疑

    不同於其他Python課程,單獨為學術研究打造的 Python機器學習 學術套用課程

    講師簡介

    陳遠祥老師,北京郵電大學副教授 。2014年畢業於北京大學,獲通訊與資訊系統專業博士學位,2015年-2017年在北京大學做博士後研究。

    發表SCI/EI學術論文100余篇,其中第一或通訊作者論文60余篇,申請發明專利20項。

    主持國家自然科學基金面上計畫,國家重點研發計劃子課題,國家自然科學基金青年計畫及博士後基金等多個國家級和省部級計畫。

    IEEE、OSA會員,Optics Express, IEEE Photonics Technology Letters,Photonics Journal,Applied Optics等多個SCI期刊審稿人。

    陳遠祥老師近2年開設的Python師資培訓系列課程受到了高校群體的認可:

    課程內容

    Python編程基礎與數據清洗

    C1 :前言

    C2 :Python語言概述

    C3 :Python中的數據型別

    C4 :控制流

    C5 :函式設計與使用

    C6 :物件導向編程

    C7 :檔操作

    C8 :Numpy

    C9 pandas

    C10 matplotlib 繪圖

    C11 :pyechart繪圖

    Python爬蟲

    1. 爬蟲基礎

    1.1 爬蟲基本概念

    1.2 通用爬蟲和聚焦爬蟲

    1.3 http的請求與響應

    1.4 網頁基礎知識

    2. 簡單爬蟲實作

    2.1 爬蟲基本原理

    2.2 爬蟲與反爬蟲

    2.3 正規表式

    2.4 requests庫實作http請求

    2.4.1 實戰1: 豆瓣電影分類排行榜(JSON數據格式)

    2.4.2 實戰2: 貓眼電影排行榜數據提取

    2.4.3 實戰3: 基於cookies爬取豆瓣短評分析

    2.5 Beautiful Soup

    2.5.1 網頁的解析

    2.5.2 網頁元素的選取

    2.5.3 實戰: 從中國天氣網獲得天氣數據;爬取豆瓣電視劇評分

    3. 爬蟲高級技術進階

    3.1 多頁面的爬取

    3.2 動態渲染頁面的爬取

    3.3 基於selenium的自動化爬取技術

    3.4 實戰: 多頁面爬取京東商品數據

    Python文本分析

    1. 文本處理常用字串方法精講

  • 字串的不變性

  • 排序行

  • 段落格式化

  • 二進制轉化為ASCII

  • 重復字詞過濾

  • 提取信件地址

  • 提取URL地址

  • 大寫轉換

  • 符號化

  • 刪除停用詞

  • 同義詞與反義詞處理

  • 文本轉譯

  • 單詞替換

  • 拼寫檢查

  • WordNet介面

  • 語料存取

  • 標記單詞

  • 塊和裂口

  • 塊分類

  • 文本分類

  • 雙字母組

  • 文字覆寫

  • 文字換行

  • 頻率分布

  • 文字摘要

  • 詞幹演算法

  • 約束搜尋

  • numpy數值計算要點串講

  • Pandas數據處理串講

  • python統計圖表展示

  • 2. 重要的庫

  • jieba庫簡介

  • 3. 關鍵詞提取

  • 關鍵詞任務概述

  • TF-IDF 演算法原理

  • 相似文章推薦原理介紹

  • 例項:紅樓夢文本分析的實作

  • 檔與詞庫的讀取

  • 完成分詞與詞雲圖的繪制

  • 4. 文本分類

  • 新聞素材介紹

  • 新聞內容的關鍵詞提取

  • 詞向量轉化與ngram模型

  • 樸素貝葉斯演算法完成新聞分類

  • 5. 文本聚類

    語料的載入,文本特征的提取,利用聚類演算法對文本進行聚類

    Python機器學習:

    第一部份:機器學習思想與學術套用介紹:

  • 機器學習基本思想

  • 機器學習分類

  • 常用機器學習常用演算法

  • 機器學習評 價標準

  • 機器學習演算法庫介紹

  • 機器學習常見學術套用

  • 第二部份:演算法原理與實戰

    1 、 KNN演算法:

    KNN演算法基本原理,常用相似度衡量方法、KNN用於分類和回歸,KNN模型的最佳化與調參

    案例套用: 鳶尾花分類與波士頓房價預測

    2 決策樹

    決策樹基本原理,決策樹分類,決策樹用於分類和回歸實作,決策樹參數最佳化

    案例套用: 保險行業使用者畫像

    3 、 線性回歸:

    線性回歸模型基本原理、嶺回歸、LASSO回歸和彈性網

    案例套用: 基於不同場景之下共享單車投放量的精準預測

    4 、 邏輯回歸:

    邏輯回歸基本原理,從線性回歸到邏輯回歸,邏輯回歸實作和參數最佳化

    案例套用: 數位化人力資源之員工流失風險預警

    5 、 神經網路與深度學習簡介:

    神經網路基礎,神經網路中的啟用函式,神經網路Python實作與參數調優,深度學習簡介

    案例套用: 數位辨識與圖片分類

    6 、 貝葉斯網路:

    貝葉斯分類原理,樸素貝葉斯, 貝葉斯模型 分類

    案例套用: 入口網站新聞分類

    7 、 支持向量機:

    支持向量機分類原理,線性SVM和非線性SVM

    案例套用: 人臉辨識

    8 、 隨機森林:

    決策樹與隨機森林,隨機森林原理,隨機森林Python實作與參數調優

    案例套用: 泰坦尼克沈船預測

    9 、 聚類:

    聚類原理,聚類和分類區別,kmeans聚類原理,kmeanspython實作,模型評估指標及穩定性討論

    案例套用: 航空客戶價值分析

    10 、時間序列分析:

    時間序列特征,時間序列模型介紹,時間序列建模

    案例套用: 電商線上零售商品銷量預測

    第三部份:Python機器學習學術套用與基金申請

    1 、機器學習學術套用:數據發現與變量創造,預測,因果推斷

    2 、機器學習學術論文解讀與寫作指導

    · 機器學習方法辨識車險欺詐效果的比較研究

    · 大數據思維下的利率定價研究

    · 基於機器學習預測的投資組合量化研究

    · 通貨膨脹影響因素辨識:基於機器學習方法的再檢驗

    3 、機器學習與基金申請(國自然)

    基金申請流程與常見思路

    成功案例分享:基於機器學習的損傷感知與補償機制研究

    Python機器學習進階:

    一、 整合學習介紹與套用

    1. 整合學習的優勢

    2. 整合學習常用演算法介紹:原理與實作

    隨機森林

    adaboost

    GBDT

    Xgboost

    Stacking

    整合學習演算法的學術套用

    二、 高級特征工程處理技術

    1 、 特征工程的重要性

    2 、 常用特征工程處理技術:

    特征選擇

    特征構造

    特征轉換

    特征學習

    3 、 特征工程的在學術研究中的套用

    三、 神經網路與深度學習

    1 、 神經網路的引入,為什麽需要深度學習?

    2 、 深度學習常用模型介紹與套用:

  • 摺積神經網路與影像處理

  • 迴圈神經網路與文本分析

  • 多模態網路與套用

  • 3 、 深度學習在學術研究中的套用:

  • 股票市場預測

  • 信用風險評估

  • 資產定價

  • 試聽及課程咨詢

    尹老師

    電話:13321178792

    WeChat:JGxueshu
    QQ:42884447

    本文包含廣告內容
    課程為經管之家計量與統計官方產品