當前位置: 妍妍網 > 資訊

Kaldi之父,IEEE Fellow,小米首席語音科學家Daniel Povey將出席2024全球機器學習技術大會並行表演講!

2024-02-29資訊

2024 全球機器學習技術大會 將於 4 月 25、26 日在上海環球港凱悅大酒店隆重舉行!著名語音辨識開源工具 Kaldi 之父,IEEE Fellow,小米集團首席語音科學家 Daniel Povey 將參加本次盛會,並行表精彩演講!

Kaldi之父,IEEE Fellow, 小米集團首席語音科學家 Daniel Povey

Daniel Povey 博士是國際知名的語音辨識專家。 先後就職於 IBM 和微軟。2012年加入美國約翰霍普金斯大學,任語言和語音處理中心副教授。2019年10月加入小米,擔任集團語音首席科學家。2022年12月, Daniel Povey 憑借在語音辨識和聲學建模方面的傑出貢獻入選 IEEE Fellow。

Daniel Povey 博士是著名開源語音辨識工具 Kaldi 的提出者和主要維護者,被業界稱為 「Kaldi 之父」。

Daniel Povey 在智慧語音處理的技術上做出了非常多的貢獻。他首次將序列區分性訓練方法套用於語音辨識,他提出的 LF-MMI 建模方法至今仍為商用語音辨識系統普遍使用的標準技術。他也是將深度學習用於語音辨識領域的重要引領者,在語音辨識中推廣了時延神經網路,配合 LF-MMI 訓練,是 2015-2020 年學術界和工業界普遍使用的最佳組合。他還是深度學習在聲紋辨識領域的重要引領者,提出的 X-vectors 方法是第一個取得成功並被普遍套用的深度學習說話人辨識方法,廣泛套用於工業界。他在國際頂級會議和期刊發表論文 200 多篇,谷歌學術參照近 46000 次,h-index 66,擔任 Signal Processing Letters 的終身副主編。

Kaldi 計畫在學術界和工業界都極具影響力,廣泛套用於各研究機構和國內外知名公司,有力地推動了智慧語音處理的產業化。Kaldi 自動語音辨識技術是人與機器以自然語言順暢交流的關鍵技術,Kaldi 整合了多種語音辨識模型,包括隱馬可夫和最新的深度學習神經網路,公認是業界語音辨識框架的基石。

在大模型風馳電掣的當下,大模型 GPT 是否對新一代 Kaldi 提出新的挑戰?新一代 Kaldi 成果的產品化如何?

Daniel 博士透露,新一代 Kaldi 計畫的技術路線與大模型有同有異,相同的方面都采用了 Transformer 架構(這也 是當前大多數 人工智慧模型都在采用的架構),異的方面大模型 GPT 是單一的大系統,而新一代 Kaldi 是由很多小系統協作組成的大系統,這才是未來智慧體的發展方向。

他還提到,大模型在一些任務中取得了很好的效果,但訓練過程需要海量的數據和算力,因此,很多中小企業無法開展類似的實驗。此外,大模型訓練策略也較難遷移到小規模的數據任務上。 新一代 Kaldi 團隊研發了一系列技術,包括神經網路結構最佳化方案和訓練策略、神經網路梯度值矯正最佳化技術等。基於這些技術,新一代 Kaldi 在不同數據規模的語音辨識任務上都取得了業界領先的效果。同時,部份技術也被用於小米大模型的訓練過程中,在達到同等模型效果的前提下,可以有效節省訓練成本。

新一代 Kaldi 與大模型在語音套用領域的更多分享與討論,大家可以報名 「 2024 全 球機器學習技術大會 」,現場聆聽 Daniel Povey 博士精彩分享。

在本次全球機器學習技術大會上,Daniel Povey 博士將與來自國內外的 50+ AI 專家、學者和業界精英們匯聚一堂,共同分享在大模型和 AI 領域的最新研究成果和實踐經驗。他們包括:

  • 復旦大學教授,博士生導師,MOSS大模型核心人員,前搜狗首席研究員 張奇

  • 零一萬物聯合創始人,前字節跳動 AIGC 和視覺大模型 AI 平台負責人 潘欣

  • 北京智源人工智慧研究院基礎語言與軟體組負責人 劉廣

  • 新浪微博新技術研發負責人,中國中文資訊學會理事 張俊林

  • 北京聆心智慧科技有限公司聯合創始人 CEO 鄭叔亮

  • 面壁智慧 CTO,OpenBMB 開源社群聯合發起人 曾國洋

  • 度小滿金融技術委員會執行主席,數據智慧套用部總經理 楊青

  • 白海科技創始人兼 CEO,CCF 大數據專委常務委員和高效能專委委員 盧億雷

  • 文因互聯工程 VP 兼首席科學家,中國人工智慧學會會員工委會副秘書長 宋

  • 原騰訊音樂機器學習平台 CubeStudio 負責人,楷喬科技聯合創始人 欒鵬

  • DeepWisdom 創始人兼 CEO,MetaGPT 計畫作者 吳承霖

  • WPS AI 技術總監,中國圖像圖形學學會【文件圖像分析與辨識專委會】專業委員 熊龍飛

    更多嘉賓與主題,請登陸大會官網: www.ml-summit.org ,或點選「 閱讀原文 」檢視!