当前位置: 欣欣网 > 资讯

Linus:我讨厌这些 AI 炒作,再等十年看看;阿里云接入 Llama 3,清华微调中文版初现 | AI头条

2024-04-22资讯

整理 | 王启隆

出品 | AI 科技大本营(ID:rgznai100)

一分钟速览新闻点!

  • 阿里云百炼大模型服务平台全面支持 Llama 3

  • 清华系团队推出基于 ORPO 优化的中英文双语聊天模型 Llama3-8B-Chinese-Chat

  • Linus Torvalds 谈 AI:谨慎看待炒作,期待智能工具提升编码效率

  • 扎克伯格谈 AI:我们可能面临着「AI 寒冬」

  • Groq 推出 iOS 应用,支持主流开源模型

  • Groq AI 芯片突破性成果:在 Llama 3 上实现每秒 800 tokens 处理速度

  • Groq 六周聚集 100k 开发者

  • 巴西外科医生首次采用 Apple Vision Pro 优化手术流程

  • 微软展示高精度深度伪造 AI 技术 VASA-1,因潜在滥用风险而不予公开

  • 全球 AI 要闻

    阿里云百炼大模型服务平台全面支持 Llama 3

    今日,阿里云百炼大模型服务平台积极响应 Meta 公司开源 Llama 3 系列大语言模型的举措,为国内企业和开发者提供了极大的便利和成本优势。通过限时免费的训练、部署和推理服务,用户可以即刻在阿里云平台上利用 Llama 3 的基础架构开发定制化的大型语言模型,无需承担直接的计算资源成本。

    平台链接: https://bailian.console.aliyun.com/#/model-market

    首款基于 ORPO 优化的中英文双语聊天模型 Llama3-8B-Chinese-Chat 发布

    近日,一支清华系科研团队成功推出了首款通过 ORPO 技术对 Meta-Llama-3-8B-Instruct 模型进行针对性中文微调的智能聊天模型——Llama3-8B-Chinese-Chat。相较于原始的 Meta-Llama-3-8B-Instruct 模型,Llama3-8B-Chinese-Chat 模型针对中文场景进行了深度优化,有效地解决了「中文问题英文作答」以及中英文混杂回复的问题,显著提升了对于中文提示的理解和回应能力。

    开源链接: https://huggingface.co/shenzhi-wang/Llama3-8B-Chinese-Chat

    Linus Torvalds 谈 AI:谨慎看待炒作,期待智能工具提升编码效率

    在近日的一次采访中,Linux 之父 Linus Torvalds 与其好友 Dirk Hohndel 就人工智能(AI)对未来工作的影响表达了个人观点。面对 AI 可能取代程序员等职位的预测,Torvalds 表示反对过度炒作,并建议等待至少十年,实际观察 AI 技术发展后再做出相关结论。

    「我讨厌这种炒作......我个人的观点是,让我们再等 10 年,看看它的实际发展情况,然后再疯狂地宣布'你的工作将在 5 年后消失'。」

    Linus 也承认他对 AI 在编程工具中的应用持乐观态度,认为智能化工具能够帮助发现代码错误——但这只是技术发展的必然阶段,并非某些人所言的末日景象或乌托邦。

    扎克伯格谈 AI:我们可能面临着「AI 寒冬」

    Meta 创始人马克·扎克伯格近日在与 Dwarkesh 的对话中表达了他对人工智能发展前景的看法,预示着 AI 领域可能面临所谓的「AI 寒冬」。他认为,未来的人工智能进步将受到现实世界条件的制约,尤其是在能源领域的瓶颈问题,解决这些问题可能需要数十年的时间,因此 AI 的发展速度将受此限制。 他表示,我们会有时间逐渐适应这种由物理约束决定的发展节奏,而非短时间内见证 AGI(通用人工智能)的诞生。

    在谈到开源策略时,扎克伯格表示,如果模型本身成为产品核心,那么是否继续开源则需重新考量经济计算。也就是说,当模型具有更高的商业价值时,开放源码的做法可能会有所调整。

    Groq 推出 iOS 应用,支持主流开源模型

    初创芯片公司 Groq 近期在 iOS 平台上发布了其全新的应用程序,该应用现已上线并支持多种大规模语言模型的实时交互,其中包括但不限于 Llama 3 系列的 8B 与 70B 版本、Llama 2 的 70B 模型、以及 Mixtral 8X7B 和 Gemma 7B 等先进的 AI 模型。

    Groq AI 芯片突破性成果:在 Llama 3 上实现每秒 800 tokens 处理速度

    Groq 公司在其系统上运行 Meta 最新发布的 Llama 3 大语言模型时,实现了超过每秒 800 个 tokens 的惊人推断速度。多位知名用户及 OthersideAI 联合创始人兼 CEO 马特·舒默在 X 上确认了这一结果。这将标志着相较于现有云端 AI 服务,Groq 芯片在 AI 推理速度上取得了重大飞跃。

    Groq 六周聚集 100k 开发者

    Groq 首席执行官(或相关负责人)Jonathan Ross 在其社交媒体账号上发表了一则激动人心的更新,他指出英伟达(Nvidia)历经七年才累计吸引了 100,000 名开发者使用其平台和技术。而 Groq 则大胆设定了一个更短期限的目标,即在七周内集聚 100,000 名开发者。令人振奋的是,仅仅六周后,Groq 便已提前达成这一里程碑式的壮举,以惊人的速度实现了社区用户的爆发式增长。

    巴西外科医生首次采用 Apple Vision Pro 优化手术流程

    巴西外科医生布鲁诺·戈巴托成功运用 Apple Vision Pro 头戴设备优化肩关节镜手术,成为巴西首例。戈巴托医生表示:「肩关节镜手术通常依赖关节内摄像头并在屏幕上直视操作,而使用这款设备,我能够在如同电影屏幕般大小且高分辨率的空间中看到图像,同时实时查看患者的检查结果和三维模型。」医疗专家预期,这款先进设备将在不久后在巴西医疗体系中得到常规应用。

    微软展示高精度深度伪造 AI 技术 VASA-1,因潜在滥用风险而不予公开

    微软本周演示了先进的深度伪造框架 VASA-1,能基于静止图像、音频样本和文本生成高度真实的说话视频,但由于存在被恶意利用进行欺诈等风险,决定暂不对外发布。该技术虽有可能带来积极应用,如提升数字沟通、辅助教育及医疗等领域,但鉴于其潜在危害,微软选择仅将其作为研究项目,强调反对利用该技术制作误导或欺骗性内容,并有意开发相应的伪造检测技术。同时,业界人士指出,虽然部分先进 AI 技术已被暂时保留,但开源模型的广泛传播使得相关技术的全面监管难以实现。

    4 月 25 ~ 26 日,由 CSDN 和高端 IT 咨询和教育平台 Boolan 联合主办的「 全球机器学习技术大会 」将在上海环球港凯悦酒店举行,特邀近 50 位技术领袖和行业应用专家,与 1000+ 来自电商、金融、汽车、智能制造、通信、工业互联网、医疗、教育等众多行业的精英参会听众,共同探讨人工智能领域的前沿发展和行业最佳实践。 欢迎所有开发者朋友访问官网 http://ml-summit.org、点击「阅读原文」或扫码进一步了解详情。