当前位置: 欣欣网 > 资讯

腾讯大模型 App 正式上线,微信 QQ 等全面接入!

2024-05-30资讯

移动互联网有 12 亿 用户,AI 头部产品却只有 百万 量级的日活。

作者 | 王启隆

责编 | 唐小引

出品丨AI 科技大本营(ID:rgznai100)

北京时间 5 月 30 日,基于混元大模型的 C 端 App「 腾讯元宝 」正式上线,各大应用商店一早就开放了下载,这款应用瞄准了大家在 工作效率场景中的核心需求: 信息获取 — 处理 — 生产 ,对应了其主打的 AI 搜索 + AI 总结 + AI 写作 三大功能,深度贴合每个人的 实际生活

CSDN 现场参加了 元宝 」的媒体沟通会, 腾讯云副总裁、腾讯混元大模型负责人刘煜宏 发表演讲,同时做了不少的演示。

这次真正主打的核心功能是 AI 搜 ,腾讯其实在搜索上有着相当久远的历史。除了大家现在熟悉的 微信搜一搜,腾讯还有搜狗搜索,其前身是「门户时代」的 Soso,至今已经有了 18 年的历史,可谓时代的眼泪。现在结合了 AI 技术增强,既有传统的稳定性,又有更智能的生成答案,问它电视剧都能答上来:

元宝的最大特色是深度整合了腾讯自家的微信生态资源,特别是微信公众号这一内容丰富的平台 —— 基于公众号的搜索,全网只有这一家。 前阵子谷歌 CEO 才说 AI 搜索「幻觉」问题无法解决,所以腾讯规避问题的方式也很简单粗暴,因为它很多时候做的不完全是搜索,而是对自己搜索到的公众号进行了总结。

我们这就考考元宝,看它认不认识 CSDN 最新上市的【 】:

这题不难,只要读了标题就能解出来。

接下来再考考元宝,看它读没读文章内容:

看来,只要是公众号上面的知识,都难不倒它了。

在 AI 总结方面,元宝可上传最多 10 个 PDF、word、txt 等多种格式的文档,并能够一次性解析多个微信公众号链接、网址。 刘煜宏介绍元宝拥有 256K 的原生窗口上下文 ,这相当于一本【三国演义】,或是英文原版的【哈利波特】全集。

这段时间「AI 教母」李飞飞创业的事特别火,而她创业前其实还在斯坦福以人为中心的人工智能研究所(HAI)发布了一篇年度报告,我们先前做过 ,看看元宝能否总结这份 图文并茂的报告

到了 AI 写作这块儿, 刘煜宏强调了元宝的 多轮问答能力,甚至表示元宝能够将对话的内容整理成报告,按照要求进行结构化输出,大大提升信息从获取到处理再到生产的效率。

创意写作现在似乎已经成为了各大通用模型的「基本功」了,所以我更想测试它有趣的文生图能力。点开 App 上方的「发现」一栏,我发现元宝预设了一堆琳琅满目的智能体。现在我想绘画,所以选择了「创意绘画」:

先来一张像素风的城市落日图:

在这个预设的智能体里面,我还可以进行风格切换和比例设置,值得点个赞。

切换成「油画」风格和 16:9 比例之后,我又让元宝生成了一张城市落日图:

智能体的效果还是相当不错的。刘煜宏在沟通会上表示,腾讯之前已经推出过了「元器」这样的 创作者工具平台 ,鼓励开发者、企业乃至普通用户自行创建个性化的智能体。 目前,腾讯的产品策略着重于早期阶段的内部需求满足和用户体验的提升 所以,未来元宝不会再推出太多的预设智能体,而是 通过智能体创作平台的开放和腾讯插件的支持,鼓励开发者自主构建智能体,实现技术的广泛应用。

下面,让我们进一步了解元宝还有哪些秘密。

脱胎换骨

元宝背后的混元目前有多强?刘煜宏给出了一个数字:自发布以来,混元模型的 性能提升了 50%

参数方面,千亿升级到了万亿。

训练和推理框架上,腾讯自研的机器学习平台训练速度是主流框架的 2.6 倍,大模型推理成本相比业界主流框架下降 70%。此外,预训练语料还从万亿升级至了 7 万亿 tokens。

算法上,稠密模型已经演变为时流行的 MoE (专家混合网络),参数量和处理的 tokens 数量分别增加了十倍和七倍,显示了技术上的重大突破和优化。这些优化不仅提升了系统的吞吐量,也降低了能耗。

在多模态方面,五月份开源的腾讯混元文生图大模型是 全球首个中文原生 DiT 架构模型 ,也就是 Sora 带火的同款架构,生成效果相比上代提升超 20%。 刘煜宏透露,在 Sora 出现之前,腾讯自研的视频生成能力在业内「遥遥领先」,但随着二月份那个惊奇演示之后,混元也随之更换了架构。如今,混元文生图大 模型在 GitHub 累积了 2000+ star ,前文也演示了元宝在这个文生图模型的加持下展示的 创作能力。

GitHub: https://github.com/Tencent/HunyuanDiT

Hugging Face: https://huggingface.co/Tencent-Hunyuan/HunyuanDiT

此外,腾讯混元大模型在视频、3D 生成等方面也持续探索,目前已经支持 16s 视频生成 ,单图仅需 30 秒即可生成 3D 模型 ,相关能力也将于后续在元宝中上线,这点十分值得期待。

应用场景从哪找?

「腾讯做大模型不争一时之先。」

刘煜宏在沟通会上一直强调腾讯的「慢战略」,而这段时间,他们真正的工作是「看」,也就是 洞察用户的真实需求

自 2022 年 ChatGPT 发布以来,大模型领域异常火爆,频繁传出各种产品突破性进展的新闻。我们最经常看到的标题可能就是「超越 GPT-4」,「xx 评测榜单再度刷新」 …… 但是,这股热潮被局限于一个「圈」内,并没有被普罗大众所感知到。

按照刘煜宏的说法,现在中国移动互联网有超过 12 亿的用户 ,其中不乏大量对互联网十分熟悉的群体,如大学生、互联网从业者和职场人士,这部分核心用户群体估计有 数千万之众 ,然而大模型 AI 应用的实际日活跃用户(DAU)总量去除重复后,即使各家公司声称有数十万至数百万不等,综合起来也不过 百万量级 ,这意味着在整个互联网用户群中的渗透率低至不足 1%

通常的说法是「蓝海市场很大」,但我们也可以用两个字形容这种现象:「自嗨」。

对于广大普通用户而言,这些 AI 资讯显得相对遥远且缺乏实际感知。大模型仍在发展期,产品解决方案不成熟,且大家对 IA 应用的认知仍集中在搜索/效率(文本提炼、总结、创意文案)等比较窄的探索 —— 没人知道怎么用 AI

刘煜宏透露,有很多企业高管对 AI 应用的第一想法还是「智能客服」。

沉寂了一年之久的混元,既不刷榜也不主动参加评测,而是慢慢的寻找却在 15 号突然全面开源了文生图大模型,后续参加了激烈的「国产大模型价格战」。

为什么腾讯会这么晚「参战」?其实,我们不需要考虑这个问题,答案事实上很简单:因为他是腾讯。

这家社交帝国除了火急火燎地追赶 OpenAI 以外,还有第二条路可走。依靠它在移动互联网时代打下的「江山」:微信、QQ 积累的 庞大用户规模 ,从「跳一跳」开始火遍全国的 小程序生态 ,无数公众号交织起来的 优质内容宝库 ,甚至是腾讯视频正在热播、被用于元宝 App 演示的【庆余年 2】,都映现了这道江山的风貌。

现在,让混元大模型赋能这一切,就能立刻实现 Sam Altman 口中的那种「魔法」(Magic)。 腾讯并不需要做出一个 SOTA,他们现在就可以端出一套完整的、基于移动互联网时代应用的「AI 生态」。

目前 ,腾讯内部有超 600 个业务 正式采用了 混元大模型 技术, 日调用量已超过 2 亿次 ,这一数据早前就已经达到,并持续保持高位; 相较于最初仅有少数产品尝试,实现了快速扩张。 通过大模型的应用,腾讯内部提升了约 20% 的整体工作效率 ,特别是在代码生成方面,约有 23% 的代码是由 AI 自动生成的 ,省下了四分之一的人力。

腾讯的兵法,是「 徐徐图之 」。

开发者正在迎接新一轮的技术浪潮变革。由 CSDN 和高端 IT 咨询和教育平台 Boolan 联合主办的 2024 年度「全球软件研发技术大会」秉承干货实料(案例)的内容原则,将于 7 月 4 日-5 日在北京正式举办。大会共设置了 12 个大会主题:大模型智能应用开发、软件开发智能化、AI 与 ML 智能运维、云原生架构……详情👉: http://sdcon.com.cn/