整理 | 王轶群
出品 | AI 科技大本营(ID:rgznai100)
一分钟速览新闻点!
台积电因地震影响暂停部分芯片制造,将连夜恢复生产
Stability AI发布音频生成工具Stable Audio 2.0
雅虎将收购Ins联创成立的AI新闻平台Artifact
Replit推出新人工智能编码助手Replit Teams
微软正在开发Xbox AI聊天机器人
谷歌最新研究:潜在扩散模型并非越大越好
以色列芯片制造商Hailo融资1.2亿美元,发布边缘侧生成式AI芯片Hailo-10
以色列在加沙的轰炸行动使用Lavender人工智能系统
元象首个MoE大模型XVERSE-MoE-A4.2B开源
2024年Top100 AI公司报告发布:OpenAI、Anthropic居融资前二
腾讯开源视频生成工具MuseV
数百名顶级音乐家警告不要用人工智能取代人类艺术家
全球 AI 要闻
台积电因地震影响暂停部分芯片制造,将连夜恢复生产
4月3日,东海岸发生里氏7.4级地震后,苹果公司和英伟达公司的主要芯片代工商台积电将员工撤离了某些地区。台湾发生25年来最大震级地震发生后,台积电预计将在一夜之间恢复生产,并表示「我们的关键工具没有受到损坏」。(彭博社)
Stability AI发布音频生成工具Stable Audio 2.0
Stability AI发布音频生成模型Stable Audio 2.0,现在允许用户上传自己的音频样本,然后通过提示转换音频样本并免费创造AI生成的歌曲。Stability AI表示,Stable Audio 2.0与其早期版本的一个主要区别在于,它能够创建与真实歌曲相似的歌曲结构,包括有序幕、进展和尾声。用户只需输入一句提示语,即可生成长达三分钟的44.1 kHz立体声立体声音乐。同时,Stable Audio 2.0还支持音频到音频转换能力,以及上传任意音乐对其进行风格转换。
据已经试玩Stable Audio 2.0的媒体表示,这个水平的AI歌曲距离帮助用户用音乐表达想法,差距依然比较大。例如,有用户用「带有美国风格的民谣流行歌曲」(美国乡村音乐)作为提示,Stable Audio生成的歌曲在某些部分听起来有山谷清晨的氛围,并且疑似加入了人声。
官网: https://stableaudio.com/
雅虎将收购Ins联创成立的AI新闻平台Artifact
4月2日,雅虎公司宣布将收购Artifact。Artifact由Instagram的联合创始人开发,用于向读者推荐新闻,但始终无法使其规模化。拥有数亿读者的雅虎,可以利用技术将其与互联网上的其他新闻聚合平台区分开。为此,两家公司正在联手。
双方拒绝分享收购金额,而明确表示雅虎正在收购 Artifact的技术并非其团队。Artifact 的联合创始人 Mike Krieger 和 Kevin Systrom 将担任雅虎的「特别顾问」,但不会加入该公司。Artifact 的其余五名员工要么已经找到了其他工作,要么正计划休假一段时间。(The Verge)
Replit 推出新人工智能编码助手Replit Teams
4月2日,硅谷人工智能编码初创公司Replit在旧金山举行的年度开发者日上,宣布正在推出一款新工具,以改变公司开发软件的方式。该公司表示,其名为 Replit Teams 的新产品将允许开发人员在 软件项目上进行实时协作,同时人工智能Agent会自动修复编码错误。它与 Google Docs 类似,但用于编码。它的工作方式就好像其中一个工作人员是一名编辑,在创建文档时修复拼写错误并提出新的措辞表达建议。Replit 表示,Replit Teams是基于专有的 AI 模型构建的,该模型专门从事软件开发,在编码基准方面优于 GPT-4。(Semafor)
微软正在开发 Xbox AI 聊天机器人
微软目前正在测试一种新的人工智能驱动的Xbox聊天机器人。连接到微软针对Xbox网络和生态系统的支持文档后,该机器人可以回答问题,甚至可以处理来自微软支持网站的游戏退款。消息人士透露,微软一直在测试一种「具体的 AI 角色」,该角色在响应 Xbox支持查询时会产生动画。
据报道,这个 Xbox AI 聊天机器人是Microsoft内部将AI应用到其Xbox平台服务计划的一步。最近几天,微软更广泛地扩大了Xbox聊天机器人的测试池,这表明「Xbox 支持虚拟智能体」原型,有一天可能会支持处理所有Xbox客户的查询。(The Verge)
谷歌最新研究:潜在扩散模型并非越大越好
4月2日,来自谷歌、霍普金斯大学的团队在arXiv上发表论文【Bigger is not Always Better: Scaling Properties of Latent Diffusion Models】,研究了潜在扩散模型(LDM)的扩展特性,重点是其采样效率。通过对已建立的文本到图像扩散模型进行实证分析,作者对模型大小如何影响不同采样步骤的采样效率进行了深入研究。研究结果显示,在给定推理预算的情况下,较小的模型在生成高质量结果方面经常优于较大的模型。(Arxiv)
论文: https://arxiv.org/pdf/2404.01367.pdf
以色列芯片制造商Hailo融资1.2亿美元,发布边缘侧生成式AI芯片Hailo-10
4月2日,以色列芯片制造商Hailo宣布扩大C轮融资,获得1.2亿美元的追加资金。该公司迄今为止的融资总额达到了3.4亿美元,其估值为12亿美元。
同日,Hailo宣布推出高性能边缘侧生成式AI芯片Hailo-10,使用户可以在本地拥有和运行生成式AI应用程序,而无需采用云服务。据介绍,在主流生成式AI平台上,Hailo-10可以在低于5W的功率下以每秒高10个Token的速度运行Llama2-7B;在运行文生图模型Stable Diffusion 2.1时,Hailo-10在相同的低功耗范围内每张图像的额定生成速度不到5秒。(彭博社)
以色列在加沙的轰炸行动使用Lavender人工智能系统
据参与战争的情报来源称,以色列军方在加沙的轰炸行动使用了一个先前未公开的人工智能数据库,名为「Lavender」的人工智能系统在一个阶段根据与哈马斯的明显联系中识别了 3.7万个潜在的人类目标。 据透露,以色列军方官员这些官员在六个月的战争中一直使用机器学习系统来帮助识别目标。 (The Guardian)
元象首个MoE大模型XVERSE-MoE-A4.2B开源
4月2日,据官微发文,元象发布XVERSE-MoE-A4.2B大模型 ,采用业界最前沿的混合专家模型架构,激活参数4.2B,效果即可达到13B模型水准。据介绍,XVERSE-MoE-A4.2B实现了极致压缩,相比XVERSE-13B-2仅用30%计算量,并减少50%训练时间。在多个权威评测中,元象MoE效果大幅超越Gemma-7B、Mistral-7B、Llama2-13B等开源模型,并接近超大模型Llama1-65B。据官方介绍,该模型全开源,并无条件免费商用。
ModelScope: https://modelscope.cn/models/xverse/XVERSE-MoE-A4.2B
2024年Top100 AI公司报告发布:OpenAI、Anthropic居融资前二
4月1日,技术市场情报平台CB Insights发布了2024年Top100的AI公司报告,关注来自16个国家/地区从事大模型、AI基础设施等最有前途的100家公司。据介绍,评选标准包括交易活动、行业合作伙伴关系、团队实力、投资者实力、专利活动等,还分析了CB Insights对软件买家的采访,并深入研究了初创公司提交的分析师简报。根据融资金额来看,OpenAI、Anthropic、Databricks占据前三;根据估值与员工人数的比值来看,Sakana AI、Mistral AI、Anthropic和OpenAI位列前四。
报告: https://www.cbinsights.com/learn/ai-100-2024
腾讯开源视频生成工具MuseV
3月27日,来自腾讯的团队在GitHub上开源了一个基于扩散的虚拟人视频生成框架MuseV,能够生成基于视觉条件并行去噪的无限长度和高保真虚拟人类视频。该方法技术论文暂未发布,直接开源了训练好的模型和部署运行的代码,主页显示训练代码也即将推出。(GitHub)
GitHub: https://github.com/TMElyralab/MuseV
数百名顶级音乐家警告不要用人工智能取代人类艺术家
超过 200 名音乐艺术家——包括Billie Eilish、Katy Perry和 Smokey Robinson 等重量级人物——向人工智能开发者、科技公司和数字平台写了一封公开信,要求「停止使用人工智能来侵犯人类艺术家的权利并贬低音乐的价值」。(Axios)
4 月 25 ~ 26 日,由 CSDN 和高端 IT 咨询和教育平台 Boolan 联合主办的「 全球机器学习技术大会 」将在上海环球港凯悦酒店举行,特邀近 50 位技术领袖和行业应用专家,与 1000+ 来自电商、金融、汽车、智能制造、通信、工业互联网、医疗、教育等众多行业的精英参会听众,共同探讨人工智能领域的前沿发展和行业最佳实践。 欢迎所有开发者朋友访问官网 http://ml-summit.org、点击「阅读原文」或扫码进一步了解详情。