当前位置: 欣欣网 > 资讯

Meta 研发 Megalodon 架构突破上下文长度限制;中国首个音乐SOTA模型公测 | AI头条

2024-04-17资讯

整理 | 王轶群

出品丨AI 科技大本营(ID: rgznai100)

一分钟速览新闻点!

  • PyTorch 发布 torchtune alpha版本,易于LLM微调

  • Meta 研究团队提出上下文长度不受限的 Megalodon 架构

  • Adobe正处于开发可在 Premiere Pro 利用 Sora等工具生成视频的早期阶段

  • Linux 基金会宣布推出企业 AI 开放平台 OPEA

  • AMD 推出 Ryzen Pro 8000 系列处理器,为 PC 增加用于 AI 处理的 NPU

  • 谷歌DeepMind推出Aloha,利用低成本机器人和人工智能突破灵活性界限

  • Rivos 与苹果公司就商业机密盗窃问题达成和解,已筹集2.5亿美元参与芯片竞争

  • Mistral AI 最新融资后估值或达50亿美元

  • MiniMax 发布万亿 MoE 模型abab 6.5

  • 中国首个音乐SOTA模型「天工SkyMusic」开启公测

  • 全球 AI 要闻

    PyTorch 发布 torchtune alpha版本,易于LLM微调

    4月16日,PyTorch 团队发布 torchtune 的 alpha 版本。PyTorch 官方表示,这是一个 PyTorch 原生库,用于轻松微调大型语言模型。秉承 PyTorch 的设计原则,torchtune 提供可组合和模块化的构建块以及易于扩展的训练配方,以在各种消费级和专业 GPU 上微调当下的 LLM。torchtune 支持从开始到结束的完整微调工作流程,包括:

  • 下载并准备数据集和模型检查提示;

  • 使用支持不同模型架构、参数高效微调 (PEFT) 技术等的可组合构建块自定义训练;

  • 记录进度和指标以深入了解训练过程;

  • 量化模型后续调整;

  • 根据当下基准评估微调模型;

  • 运行本地推理结果来测试微调模型;

  • 检查提示与当下的生产推理系统的兼容。

  • Meta 研究团队提出上下文长度不受限的 Megalodon 架构

    Transformer 的二次复杂度和弱长度外推限制了它们扩展到长序列的能力。Meta 研究团队的最新论文,介绍了一个具有无限上下文长度的高效 LLM 预训练和推理的Megalodon 架构。该论文介绍了 Megalodon 一种神经架构,用于具有无限上下文长度的高效序列建模。Megalodon继承了 Mega(带门控注意力的指数移动平均线)的架构。研究表明,在与Llama 2 的对照头对头比较中,Megalodon 在 70 亿个参数和 2 万亿个训练tokens的规模上实现了比 Transformer 更好的效率。(arXiv)

    论文链接:

    https://arxivtools.blob.core.windows.net/xueshuxiangzipaperhtml/2024_4_16/2404.08801.pdf

    GitHub:

    https://github.com/XuezheMax/megalodon

    Adobe正处于开发可在 Premiere Pro 利用 Sora等工具生成视频的早期阶段

    4月15日,Adobe 表示,目前正处于允许在其广泛使用的视频编辑软件 Premiere Pro 中使用 OpenAI 的 Sora、Runway 和 Pika Labs 的 AI 模型等第三方生成人工智能工具的早期阶段。Adobe 的 Premiere Pro 应用程序广泛应用于电视和电影行业。这家位于加利福尼亚州圣何塞的公司计划今年在该软件中添加基于人工智能的功能,例如能够用人工智能生成的对象填充场景的部分内容,或者消除场景中的干扰,而无需人工进行任何繁琐的手动视频编辑工作。(路透社)

    Linux 基金会宣布推出企业 AI 开放平台 OPEA

    4月16日,Linux 基金会宣布推出企业人工智能开放平台 (OPEA),即Linux 基金会的沙盒项目之一,一种孵化器计划。该项目旨在促进开放、多提供商和可组合(即模块化)生成人工智能系统的开发。在 Linux 基金会的 LF AI 和数据组织(专注于人工智能和数据相关平台计划)的职权范围内,OPEA 的目标是为发布「强化的」、「可扩展的」生成式人工智能系统铺平道路,这些系统「利用整个生态系统中最好的开源创新,」LF AI 和 Data 执行董事 Ibrahim Haddad 在一份新闻稿中表示。他表示:「OPEA 将通过创建一个位于技术堆栈最前沿的详细的、可组合的框架来释放人工智能的新可能性。」 「这一举措证明了我们的使命,即在中立和开放的治理模式下推动人工智能和数据社区内的开源创新和协作。」

    除了 Cloudera 和英特尔之外,OPEA的成员还包括IBM 旗下的 Red Hat、Hugging Face、Domino Data Lab、MariaDB 和 VMware 等重量级企业。(TechCrunch)

    AMD 推出 Ryzen Pro 8000 系列处理器,为 PC 增加用于 AI 处理的 NPU

    4月16日,AMD 发布了 Ryzen Pro 产品组合,将「Hawk Point」8040 系列扩展到商用笔记本电脑和工作站用户,同时为商用台式电脑提供Ryzen 8000「Phoenix」APU 型号。Pro 系列基于 AMD 现有的面向消费者的处理器型号,但配备了针对商业市场量身定制的附加功能。这些相同的 AI 加速功能现在正面向商业用户推出,这让 AMD 成为第一家为笔记本电脑和工作站配备配备 NPU 的专业 CPU 的公司。(Tom's Hardware)

    谷歌DeepMind推出Aloha,利用低成本机器人和人工智能突破灵活性界限

    4月16日,谷歌 DeepMind 团队成员 Tony Z. Zhao 在其X账号上发贴表示,隆重推出Aloha, 这款机器人凭借低成本机器人和人工智能技术突破灵活性的界限。他表示,几个月后终于可以分享一些视频,附带的视频演示为机器人完全自主连续拍摄。

    Rivos 与苹果公司就商业机密盗窃问题达成和解,已筹集2.5亿美元参与芯片竞争

    4月16日,硅谷芯片开发商 Rivos 表示,已筹集经超过 2.5 亿美元,致力于推出其首款产品,强调了对新硬件的推动,以满足人工智能的需求,纬资本管理公司 (Matrix Capital Management) 是最新一轮融资的最大投资者,新投资者包括英特尔投资公司 (Intel Capital) 和联发科等。该公司瞄准数据分析和生成人工智能市场。据悉,Rivos 最近已与苹果公司就商业机密盗窃问题达成和解。(彭博社)

    Mistral AI 最新融资后估值或达50亿美元

    据一位直接知情人士透露, Mistral AI 正在与投资者就以50亿美元估值筹集数亿美元进行谈判。Mistral 是一家总部位于巴黎的开源人工智能初创公司,最近才开始产生收入,该公司于 2023 年 12 月以 20 亿美元估值筹集了 4.15 亿美元资金。(The Information)

    MiniMax 发布万亿 MoE 模型abab 6.5

    4月17日,MiniMax 正式推出abab 6.5 系列模型。万亿 MoE 模型 abab 6.5, 在各类核心能力测试中,abab 6.5 开始接近 GPT-4, Claude 3 Opus, Gemini 1.5 Pro 等世界上最领先的大语言模型。


    中国首个音乐SOTA模型「天工SkyMusic」开启公测

    4月17日,据昆仑万维官微消息,在「天工」大模型一周年之际,昆仑万维宣布「天工3.0」基座大模型与「天工SkyMusic」音乐大模型正式开启公测。据悉,「天工3.0」拥有4000亿参数,超越了3140亿参数的Grok-1,是全球最大的开源MoE大模型;「天工3.0」旗下的「天工SkyMusic」音乐大模型是中国首个音乐SOTA模型。

    天工3.0模型参数超越Grok-1,问鼎全球最大开源MoE专家混合大模型

    与行业主流路径不同,「天工SkyMusic」采用自研大模型音乐音频生成技术路线。这一路线直接通过大模型技术实现乐器、人声、旋律、音量、音符的一体化端到端音乐生成。

    「天工SkyMusic」自研AI音乐大模型技术架构

    在与海外顶尖的AI音乐大模型Suno V3的横向测评中,「天工SkyMusic」在人声&BGM音质、人声自然度、发音可懂度等领域领先对手,并以6.65分的综合得分超越Suno V3,成为全球AI音乐SOTA模型。

    「天工SkyMusic」还拥有独创的参考音乐生成与方言歌曲生成能力。

  • 参考音乐生成:用户可上传自有参考音乐,或选择「天工SkyMusic」资料库中现有的参考音乐,从而生成风格、唱腔类似的歌曲,进一步降低音乐大模型的使用门槛,让不熟悉乐理知识的用户也能轻松玩转。

  • 方言歌曲生成:「天工SkyMusic」生成的音乐不仅在人声自然度、发声可懂度等领域表现优秀,更能够支持粤语、成都话、北京话等众多方言,让用户能够更自由地实现音乐表达,传播方言文化。

  • 4 月 25 ~ 26 日,由 CSDN 和高端 IT 咨询和教育平台 Boolan 联合主办的「 全球机器学习技术大会 」将在上海环球港凯悦酒店举行,特邀近 50 位技术领袖和行业应用专家,与 1000+ 来自电商、金融、汽车、智能制造、通信、工业互联网、医疗、教育等众多行业的精英参会听众,共同探讨人工智能领域的前沿发展和行业最佳实践。 欢迎所有开发者朋友访问官网 http://ml-summit.org、点击「阅读原文」或扫码进一步了解详情。