當前位置: 妍妍網 > 資訊

Linus:我討厭這些 AI 炒作,再等十年看看;阿裏雲接入 Llama 3,清華微調中文版初現 | AI頭條

2024-04-22資訊

整理 | 王啟隆

出品 | AI 科技大本營(ID:rgznai100)

一分鐘速覽新聞點!

  • 阿裏雲百煉大模型服務平台全面支持 Llama 3

  • 清華系團隊推出基於 ORPO 最佳化的中英文雙語聊天模型 Llama3-8B-Chinese-Chat

  • Linus Torvalds 談 AI:謹慎看待炒作,期待智慧工具提升編碼效率

  • 祖克柏談 AI:我們可能面臨著「AI 寒冬」

  • Groq 推出 iOS 套用,支持主流開源模型

  • Groq AI 芯片突破性成果:在 Llama 3 上實作每秒 800 tokens 處理速度

  • Groq 六周聚集 100k 開發者

  • 巴西外科醫生首次采用 Apple Vision Pro 最佳化手術流程

  • 微軟展示高精度深度偽造 AI 技術 VASA-1,因潛在濫用風險而不予公開

  • 全球 AI 要聞

    阿裏雲百煉大模型服務平台全面支持 Llama 3

    今日,阿裏雲百煉大模型服務平台積極響應 Meta 公司開源 Llama 3 系列大語言模型的舉措,為國內企業和開發者提供了極大的便利和成本優勢。透過限時免費的訓練、部署和推理服務,使用者可以即刻在阿裏雲平台上利用 Llama 3 的基礎架構開發客製化的大型語言模型,無需承擔直接的計算資源成本。

    平台連結: https://bailian.console.aliyun.com/#/model-market

    首款基於 ORPO 最佳化的中英文雙語聊天模型 Llama3-8B-Chinese-Chat 釋出

    近日,一支清華系科研團隊成功推出了首款透過 ORPO 技術對 Meta-Llama-3-8B-Instruct 模型進行針對性中文微調的智慧聊天模型——Llama3-8B-Chinese-Chat。相較於原始的 Meta-Llama-3-8B-Instruct 模型,Llama3-8B-Chinese-Chat 模型針對中文場景進行了深度最佳化,有效地解決了「中文問題英文作答」以及中英文混雜回復的問題,顯著提升了對於中文提示的理解和回應能力。

    開源連結: https://huggingface.co/shenzhi-wang/Llama3-8B-Chinese-Chat

    Linus Torvalds 談 AI:謹慎看待炒作,期待智慧工具提升編碼效率

    在近日的一次采訪中,Linux 之父 Linus Torvalds 與其好友 Dirk Hohndel 就人工智慧(AI)對未來工作的影響表達了個人觀點。面對 AI 可能取代程式設計師等職位的預測,Torvalds 表示反對過度炒作,並建議等待至少十年,實際觀察 AI 技術發展後再做出相關結論。

    「我討厭這種炒作......我個人的觀點是,讓我們再等 10 年,看看它的實際發展情況,然後再瘋狂地宣布'你的工作將在 5 年後消失'。」

    Linus 也承認他對 AI 在編程工具中的套用持樂觀態度,認為智慧化工具能夠幫助發現程式碼錯誤——但這只是技術發展的必然階段,並非某些人所言的末日景象或烏托邦。

    祖克柏談 AI:我們可能面臨著「AI 寒冬」

    Meta 創始人馬克·祖克柏近日在與 Dwarkesh 的對話中表達了他對人工智慧發展前景的看法,預示著 AI 領域可能面臨所謂的「AI 寒冬」。他認為,未來的人工智慧進步將受到現實世界條件的制約,尤其是在能源領域的瓶頸問題,解決這些問題可能需要數十年的時間,因此 AI 的發展速度將受此限制。 他表示,我們會有時間逐漸適應這種由物理約束決定的發展節奏,而非短時間內見證 AGI(通用人工智慧)的誕生。

    在談到開源策略時,祖克柏表示,如果模型本身成為產品核心,那麽是否繼續開源則需重新考量經濟計算。也就是說,當模型具有更高的商業價值時,開放原始碼的做法可能會有所調整。

    Groq 推出 iOS 套用,支持主流開源模型

    初創芯片公司 Groq 近期在 iOS 平台上釋出了其全新的應用程式,該套用現已上線並支持多種大規模語言模型的即時互動,其中包括但不限於 Llama 3 系列的 8B 與 70B 版本、Llama 2 的 70B 模型、以及 Mixtral 8X7B 和 Gemma 7B 等先進的 AI 模型。

    Groq AI 芯片突破性成果:在 Llama 3 上實作每秒 800 tokens 處理速度

    Groq 公司在其系統上執行 Meta 最新釋出的 Llama 3 大語言模型時,實作了超過每秒 800 個 tokens 的驚人推斷速度。多位知名使用者及 OthersideAI 聯合創始人兼 CEO 馬特·舒默在 X 上確認了這一結果。這將標誌著相較於現有雲端 AI 服務,Groq 芯片在 AI 推理速度上取得了重大飛躍。

    Groq 六周聚集 100k 開發者

    Groq 執行長(或相關負責人)Jonathan Ross 在其社交媒體帳號上發表了一則激動人心的更新,他指出輝達(Nvidia)歷經七年才累計吸引了 100,000 名開發者使用其平台和技術。而 Groq 則大膽設定了一個更短期限的目標,即在七周內集聚 100,000 名開發者。令人振奮的是,僅僅六周後,Groq 便已提前達成這一裏程碑式的壯舉,以驚人的速度實作了社群使用者的爆發式增長。

    巴西外科醫生首次采用 Apple Vision Pro 最佳化手術流程

    巴西外科醫生布魯諾·戈巴托成功運用 Apple Vision Pro 頭戴裝置最佳化肩關節鏡手術,成為巴西首例。戈巴托醫生表示:「肩關節鏡手術通常依賴關節內網路攝影機並在螢幕上直視操作,而使用這款裝置,我能夠在如同電影螢幕般大小且高分辨率的空間中看到影像,同時即時檢視患者的檢查結果和三維模型。」醫療專家預期,這款先進裝置將在不久後在巴西醫療體系中得到常規套用。

    微軟展示高精度深度偽造 AI 技術 VASA-1,因潛在濫用風險而不予公開

    微軟本周演示了先進的深度偽造框架 VASA-1,能基於靜止影像、音訊樣本和文本生成高度真實的說話視訊,但由於存在被惡意利用進行欺詐等風險,決定暫不對外釋出。該技術雖有可能帶來積極套用,如提升數位溝通、輔助教育及醫療等領域,但鑒於其潛在危害,微軟選擇僅將其作為研究計畫,強調反對利用該技術制作誤導或欺騙性內容,並有意開發相應的偽造檢測技術。同時,業界人士指出,雖然部份先進 AI 技術已被暫時保留,但開源模型的廣泛傳播使得相關技術的全面監管難以實作。

    4 月 25 ~ 26 日,由 CSDN 和高端 IT 咨詢和教育平台 Boolan 聯合主辦的「 全球機器學習技術大會 」將在上海環球港凱悅酒店舉行,特邀近 50 位技術領袖和行業套用專家,與 1000+ 來自電商、金融、汽車、智慧制造、通訊、工業互聯網、醫療、教育等眾多行業的精英參會聽眾,共同探討人工智慧領域的前沿發展和行業最佳實踐。 歡迎所有開發者朋友存取官網 http://ml-summit.org、點選「閱讀原文」或掃碼進一步了解詳情。