转自:https://juejin.cn/post/7369481217030438921
作者: brzhang
OpenAI最近推出了GPT-4系列的新成员——GPT-4o。这一革新专注于多模态和端侧应用,带来了前所未有的用户交互体验。
GPT-4o具备以下三大显著特点:
多模态交互 :GPT-4o不仅能同时处理文本、音频和图像输入,还能生成任意组合的输出。这种多模态能力让GPT-4o在处理复杂任务时表现出色,特别是在情感识别和生成「 情感回应 」方面。
超低延迟 :GPT-4o的音频输入响应时间最短为232毫秒,平均仅为320毫秒,与人类对话的响应时间相当。如此快速的响应速度使得GPT-4o能够实时互动,提供无缝的用户体验。
桌面端无缝运行 :OpenAI与苹果合作,推出了适用于macOS的ChatGPT桌面应用。用户无需联网即可使用ChatGPT,并且可以在本地处理敏感信息,确保隐私安全。
这一系列的改进使得GPT-4o不仅在技术上更为先进,也在实际应用中更加贴近用户需求。
一些逆天的视频展示
1、作业辅导
在视频中展示了一位技术大咖如何使用GPT-4o辅导他儿子的作业。
大咖一开始就告诉GPT-4o不要直接给出答案,而是引导他儿子一步步解决几何题。
在视频中,我们看到GPT-4o的确如此,它细致地一步步帮助孩子解决问题,并且解释得非常详细和有情感。
每当孩子完成一个步骤时,GPT-4o的语气中都能传达出一种鼓励的感觉,这种情感化的互动方式让人感到非常温暖和亲切。
整个过程都是孩子自己拿着笔一步步解题,而GPT-4o在一旁观察孩子的解题步骤,判断是否正确。这种互动简直太棒了!显然,这得益于GPT-4o增强的图像理解能力。
老实说,按照这个趋势,教培行业似乎有可能被颠覆。那些不会做奥数题的家长有福了,因为据安特曼所说,GPT-4o 将会免费提供服务。
这意味着你无需花费一分钱,就能请到一个专业的教培老师,帮助你的孩子解决学习中的问题。
2、两个 gpt-4o 互动
之前,我们只能与GPT进行一对一的实时语音对话。现在,颠覆认知的时刻来了!在一个对话窗口中,你可以同时与两个GPT-4o进行对话,甚至它们还能互相对话。
在视频中,这两个GPT-4o竟然相互唱起了小曲,真是让人惊叹不已。
3、外语学习
在这个例子中,研究人员展示了一个非常有趣的场景。他告诉GPT-4o他想学习西班牙语,当然,他是用英语说的。
然后,他使用摄像头对着苹果和香蕉,问GPT-4o这是什么。GPT-4o利用其图像识别能力,识别出了香蕉和苹果,并告诉研究人员。
但是它的回答竟然是英语和西班牙语的混合,也就是说,GPT-4o回答道:"this is
manzana
and
plátano
"。
这几乎让我目瞪口呆,一句话中包含了多种语言。这种组合输出的能力,简直太强了。
国内直接使用 ChatGPT4o :
无需魔法, 同时支持 PC、手机、平板,浏览器直接使用 。
长按下方二维码,备注AI,获取ChatGPT4o使用地址!!!
4、参与多人对话
在这个视频中,GPT-4o加入了一场在线会议。它可以看到共享的屏幕,因此知道会议中有多少人。
会议开始时,每个人依次分享了自己喜欢的人和事。然后,主持人问每个人的爱好,GPT-4o逐一准确回答了每个人的爱好。
最后,GPT-4o还对会议进行了总结。这种能力实在是太强大了。
未来,腾讯会议和Zoom的互动体验可能会大大提升,不加入一个智能记录员的话,体验就要被甩开好几条街了。
5、同声传译
在这个视频中,GPT-4o扮演了一个翻译者的角色。
画面中有两个人,一个说英语,一个说西班牙语,GPT-4o负责将听到的英语转换为西班牙语,并将西班牙语转换为英语。
于是,这两个人愉快地对话了。一个说西班牙语,一个说英语,但彼此都能听得懂。
因此,同声传译这个行业,是不是也要面临巨大挑战了。
6、外婆的澎湖湾
富有情感的对话已经很令人惊叹了,但与这相比简直小巫见大巫。
在这个视频中,GPT-4o不仅哼起了小曲,还会在聊天时爽朗地笑。
这种情感化的互动方式让人感到非常亲切。
当一个外国人说他想睡觉,并要求哼一首小曲时,GPT-4o便开始哼起了【外婆的澎湖湾】,听得我差点就睡着了。
这种情感化的交互方式,实在是太贴心了。
7、语速控制
在这个视频中,外国人让GPT-4o数数,从1到10。GPT-4o一口气数完了。
然后,外国人说:「你能不能慢一点?」GPT-4o便慢慢地数了一遍。
接着,外国人又说:「你能不能快一点?」GPT-4o就快速地数了一遍。
这种语速控制完全可以用来训练听力,非常赞。不过,这次我的下巴还没掉下来。
8、开玩笑
在这个视频中,外国人告诉GPT-4o他想给爸爸讲个笑话,并且想先让GPT-4o听听这个笑话是否好笑。
结果,GPT-4o真的爽朗地笑了起来,笑声听起来一点都不像机器人。
当我听到它这个笑声时,我的下巴差点掉下来。
9、你是我的眼
这个视频的效果相当炸裂。视频中有一位盲人,由于他看不见,便让GPT-4o告诉他周围的风景。
GPT-4o一一描述给他听。从这个视频中,我得到了一些启发!
GPT-4o可能更好的交互形式是类似于Google Glass 。
如果这样的产品问世,估计全世界的盲人都会为之震撼,他们将能够「重见光明」。
这种产品的价值,简直不可估量。
10、两个 gpt-4o 互相对话
在这个视频中,展示了两个GPT-4o之间的对话。什么,永动机??
实际上不是。视频中,OpenAI的大佬先告诉一个GPT-4o说,等会儿有一个可以看见世界的AI会和它对话,它可以和对方交流。
随后,他启动了另一个GPT-4o,然后两个GPT-4o便开始对话了。而且,大佬还可以随时打断并加入他们的对话。
我的脑袋已经开始疼了,这个视频太炸裂了。
这意味着,我是不是可以搞 3 个手机,搞一桌四川麻将了???
11、着装建议
在这个视频中,大佬要准备面试,问GPT-4o该怎么穿着得体。
GPT-4o建议他戴一顶帽子试试。结果,他戴上帽子后,GPT-4o竟然爽朗地笑了起来……
看来以后出门穿什么,可以让GPT-4o来建议一下合不合适了。
12、桌游助手
在这个场景中,两个人想玩石头剪刀布的游戏,并让GPT-4o做裁判。
于是游戏开始了,GPT-4o数到「1, 2, 3」,然后说「亮出你们的爪子」,接着判断谁输谁赢。
看来,我又找到了一个新的乐趣。
- EOF -
最后给大家推荐一个ChatGPT 4o国内网站,是我们团队一直在使用的,我们对接的是OpenAI官网的账号,给大家打造了一个一模一样的ChatGPT,很多粉丝朋友现在也都通过我拿这种号,价格不贵,关键还有售后 。
一句话说明 : 用官方一半价格的钱,用跟官方 ChatGPT4.0 一模一样功能的工具,而且不需要魔法,直接使用,不用担心网络问题。
功能简介:O penAI最新大模型GPT-4o、ChatGPT4.0知识问答、最强代码大模型Code Copilot、DALL-E AI绘画、写论文大模型Consensus、论文降重大模型(中文论文降重)、图片自动识别、联网查询、BUG解决、代码优化、上传文件、数据分析等。
国内直接使用 ChatGPT4o :
支持OpenAI最新的ChatGPT4o。
无需魔法, 同时支持 PC、手机、平板,浏览器直接使用 。
一个账号一个专属授权码,保护个人隐私,使用记录长期保存。
ChatGPT3.5永久免费, 提供免费共享GPT3.5授权码 。
官方独立账户规定每3小时40次 4.0提问,我们这个不限制4.0提问次数。
我们这个不会出现封号的情况,避免你因为封号多花冤枉钱。
联系站长 18640839506 ,备注AI,直接使用ChatGPT4o,拉你进ChatGPT售后群,群公告有使用说明和注意事项,有任何问题群里交流,群里有专业的技术支持
ChatGPT4o
NOW 6 .6
回复gpt,获取ChatGPT4o直接使用地址
点击阅读原文,国内直接使用ChatGpt4o