當前位置: 妍妍網 > 資訊

ChatGPT 去年至今 0 增長;Sora 風暴仍未停歇,大量 AIGC 視訊套用湧現 | AI 頭條

2024-03-26資訊

整理 | 王啟隆

出品 | AI 科技大本營(ID:rgznai100)

一分鐘速覽新聞點!

  • ChatGPT 使用者一年 0 增長,AI 創業公司湧現

  • UT 奧斯丁推出 StreamingT2V 視訊生成技術

  • DeepDataSpace 釋出 T-Rex2,無需訓練即可精準辨識視訊中的各種物件

  • DALL-E 3 即將支持影像編輯功能,生成完圖片還能改細節

  • AI 電影工具 LTX Studio 定期 3 月 27 日釋出

  • 初創公司 Suno 釋出 AI 作曲編曲工具 Suno V3

  • 初創公司 Eliyan 獲 6000 萬美元融資加速 AI 芯片互連技術

  • AI 數據整理公司 Foundational 完成 800 萬美元種子輪融資

  • 胡潤全球富豪榜:馬斯克重回榜首,AI 貢獻過半財富

  • 全球 AI 要聞

    ChatGPT 使用者一年 0 增長,AI 創業公司湧現

    從 2023 年 3 月到現在,ChatGPT 使用者增長停滯,而開源大語言模型(LLM)如 LLaMA 的釋出引領了 AI 領域的新浪潮。與此同時,專註於特定用例的 AI 創業公司在這一年間崛起,它們能夠提供更好的使用者介面、整合和私密保護。OpenAI 透過其 API 在捆綁和非捆綁 AI 能力方面均取得成功,但同時也面臨著來自開源模型的競爭。如今新的 AI 模型和工具不斷湧現,AI 行業的融資活動也在持續增長,顯示出該領域的活躍和潛力。(Latent Space)

    Sora 開始催生 AIGC 文生視訊套用

    德克薩斯大學奧斯丁分校(UT 奧斯丁)團 隊在 3 月 21 日釋出論文,其研發的 StreamingT2V 技術引領 AI 視訊生成領域創新,成功實作基於文本生成長達 2 分鐘、高達 1200 幀的高品質連續視訊。該技術借助條件註意力模組(CAM)與外觀保持模組(APM)雙核結構,保障視訊連續性和視覺一致性。實施流程分三步:初始化構建前 16 幀,Streaming T2V 階段采用自回歸技術延續視訊內容,最後透過 Streaming Refinement 最佳化畫面品質和動作流暢度。

    論文: https://arxiv.org/abs/2403.14773

    GitHub: https://github.com/Picsart-AI-Research/StreamingT2V

    DeepDataSpace 推出 T-Rex2:革新目標檢測技術

    3 月 22 日, DeepDataSpace 釋出了 T-Rex2,能在無需訓練的情況下精準辨識一段視訊中從日常到生僻的各種物件 。T-Rex2 利用文本提示的開放詞匯檢測和視覺提示的直觀表示,克服了傳統方法的局限性。該模型在四個學術基準測試(COCO、LVIS、ODinW 和 Roboflow100)上實作了最先進的效能,並且適用於多種實際套用場景,如農業、工業、生物醫學、零售等。DeepDataSpace 現開放 T-Rex2 的免費API存取,以支持教育和研究工作,並邀請跨領域的創新和合作。

    GitHub: https://github.com/IDEA-Research/T-Rex

    DALL-E 3 即將支持影像編輯功能,生成完圖片還能改細節

    人工智慧影像生成工具 DALL-E 即將迎來重大更新,新增局部重繪編輯功能。這一突破性改進將賦予使用者前所未有的靈活性,使他們能夠在現有影像上直接進行精準局部修改與創新設計。使用者只需選擇並塗抹目標區域,即可啟動 DALL-E 的智慧重繪引擎,實作對影像內容的修正、增添或風格變換。此功能不僅擴充套件了工具實用性,更降低了影像創作門檻 ,讓非專業人士也能借助 AI 技術輕松實作高品質影像編輯與合成。

    AI 電影工具 LTX Studio 定期 3 月 27 日釋出

    除了一系列模仿者,AIGC 界還 出現了直接踢館 Sora 的「電影生成工具」 LTX Studio,該平台聲稱能讓使用者掌控視訊創作過程中從創意構思到實際制作的每一個環節,確保最終作品精準實作個人藝術構想。使用者能夠體驗到敘事方式的革新,得益於專門的人工智慧技術,可以精細指導每個場景直至特定的攝影機角度;還能自動生成角色並確保跨幀時身份與風格的一致性;只需一鍵操作,即可完成帶有特效(SFX)、音樂配樂以及配音的視訊計畫最終剪輯工作。目前,LTX Studio 預告在 3 月 27 日正式釋出。

    初創公司 Suno 釋出 AI 作曲編曲工具 Suno V3

    AI 初創企業 Suno 最近上線了一款革命性的音樂創作工具——Suno V 3。該平台免費開放,其中包括不少華語音樂人。該工具僅需數秒即可譜寫出長達兩分鐘的高品質原創歌曲,並支持多樣化的音樂風格和流派客製,包括為指定歌詞生成專屬旋律。更令人驚艷的是,Suno V3 還能模擬不同歌手的聲音特點進行演繹。該公司透露,目前正全力研發下一代產品 V4,致力於引入更多顛覆性功能。

    Eliyan 獲 6000 萬美元融資加速 AI 芯片互連技術

    美國的初創公司 Eliyan 宣布獲得 6000 萬美元的融資,用於發展其芯片互連技術,該技術旨在加速 AI 芯片的效能。這輪融資由三星催化劑基金(Samsung Catalyst Fund)和老虎環球管理公司(Tiger Global Management)共同領投,投資者還包括知名的英特爾資本(Intel Capital)。此前,該公司曾推出高效能符合 UCIe 標準的 5 奈米小芯片互連技術。隨著 AI 和機器學習套用對計算力的需求不斷增長,Eliyan 的技術有望為 AI 芯片帶來更高效的數據傳輸和更低的延遲,從而推動 AI 硬體的進步。這輪融資將支持 Eliyan 繼續其研發工作,並可能加速其創新解決方案的市場推廣。

    Foundational 完成 800 萬美元種子輪融資,專註數據品質和 AI 準備度挑戰

    Foundational,一家專註於整理現代數據基礎設施的初創公司,宣布已在種子輪融資中籌集到 800 萬美元。該輪融資由 Viola Ventures 和谷歌的 AI 投資基金 Gradient Ventures 領投,並獲得天使投資者和其他風險投資公司的參與。

    Foundational 的平台能夠自動對映和分析數據團隊的程式碼,辨識潛在問題,提出修復建議,並幫助準備用於 AI 套用的數據。該計畫旨在透過自動分析數據團隊的原始碼來解決組織在擴大數據能力時面臨的挑戰,對映數據血統並辨識潛在問題。該平台與 GitHub 整合,直接在開發者現有的工作流程中提供可操作的建議和修復。

    GitHub: https://github.com/apps/foundational-io

    胡潤全球富豪榜:馬斯克重回榜首,AI 貢獻過半財富

    胡潤研究院最新釋出的【2024 胡潤全球富豪榜】顯示,十億美元企業家人數同比增長 5%,財富總量上升 9%,其中過半新增財富源自 AI 行業。全球共 3279 位十億美元企業家上榜,集中於金融、消費品、食品飲料和房地產等行業。52 歲馬斯克以特斯拉和 SpaceX 的成功躍居首富,中美兩國占據了近半數十億富豪。AI 領域的快速發展帶動了眾多企業家財富增長,包括輝達 CEO 黃仁勛等。中國穩居全球十億美元企業家數量首位,北京成 AI 創業高地。

    4 月 25 ~ 26 日,由 CSDN 和高端 IT 咨詢和教育平台 Boolan 聯合主辦的「 全球機器學習技術大會 」將在上海環球港凱悅酒店舉行,特邀近 50 位技術領袖和行業套用專家,與 1000+ 來自電商、金融、汽車、智慧制造、通訊、工業互聯網、醫療、教育等眾多行業的精英參會聽眾,共同探討人工智慧領域的前沿發展和行業最佳實踐。 歡迎所有開發者朋友存取官網 http://ml-summit.org、點選「閱讀原文」或掃碼進一步了解詳情。