会员登录 - 用户注册 - 设为首页 - 加入收藏 - 网站地图 极品飞车21下载手机版-“有眼睛、有耳朵、有嘴巴”的AI?OpenAI最新发布!!

极品飞车21下载手机版-“有眼睛、有耳朵、有嘴巴”的AI?OpenAI最新发布!

时间:2024-09-20 15:20:11 来源:直情径行网 作者:知识 阅读:554次

中新网5月14日电(中新财经 吴家驹)不是有眼有嘴GPT-5,而是耳朵GPT-4o。

北京时间5月14日,最新极品飞车21下载手机版研发ChatGPT的发布OpenAI公司,推出了具备“听、有眼有嘴看、耳朵说”能力的最新GPT-4o。

OpenAI网站称,发布GPT-4o的有眼有嘴“o”代表“omni”。在英语中“omni”常被用作词根,耳朵用来暗示“全部”或“所有”的最新概念。

该公司首席执行官山姆·奥特曼(Sam Altman)此前已预告,发布极品飞车21下载手机版最新发布的有眼有嘴产品“不是GPT-5,不是耳朵搜索引擎,但我们一直在努力开发一些我们认为人们会爱好的最新新东西”。

据介绍,GPT-4o可以实时对音频、视觉和文本进行推理,接受文本、音频和图像的任意组合输入,并生成文本、音频和图像的任意组合输出。

OpenAI称,GPT-4o可以在短至232毫秒的时间内对音频输入做出反应,平均反应时间为320毫秒,这与人类在对话中的反应时间相近。此外,它在英语和代码文本方面的性能与GPT-4 Turbo相当,在非英语语言文本方面也有显著提高。同时在API(应用程序接口)方面,速度更快,成本也降低了50%。

现场,OpenAI展示了GPT-4o的多个应用场景。

例如,在一个演示中,OpenAI前沿研究负责人马克·陈(Mark Chen)通过手机与ChatGPT进行对话。Chen和ChatGPT说,他正在进行演示有些紧张,于是ChatGPT就“像伴侣一样”,对他进行了安慰。同时,ChatGPT还能从Chen急促的喘气声中,听出他的紧张,然后对他说“慢一点。Mark,你不是吸尘器。吸气,然后数到四。”

GPT-4o检测人的表情。图自X平台

在另一个演示中,OpenAI后训练团队负责人巴雷特·佐夫(Barret Zoph)把自己的脸对着镜头,让GPT-4o看看自己的情绪如何。在演示的过程中,Zoph先打开了手机的后置摄像头,拍到了木质桌面,于是ChatGPT说,“我看到的好像是木质表面。”而让ChatGPT再试一次后,ChatGPT对Zoph说,“你看起来很开心,笑容灿烂,也许还有一丝兴奋。”

同时,OpenAI还在官网发布了一系列演示视频:GPT-4o可以帮手学习数学、学习西班牙语、准备面试,可以通过画面判断出你正在过生日,然后给你唱生日快乐歌,可以按照要求唱不同风格的催眠曲,甚至还可以当“石头剪刀布”的裁判。而在这些视频中,GPT-4o与演示者的对话流畅,说话语气就“像真人一样”。

有网友暗示,按照目前展示的视频来看,GPT-4o在语音交互体验上提升了不少。有网友认为,GPT-4o对算力的需求更大了。也有网友提出,既然GPT-4o具备了“视觉”,它是否可以代替盲人看世界。

OpenAI称,通过GPT-4o,公司跨文本、视觉和音频端到端地训练了一个新模型,这意味着所有的输入和输出都由同一个神经网络处理。由于GPT-4o是OpenAI第一个结合了所有这些模式的模型,因此公司在探索该模型的功能及其局限性方面仍处于起步阶段。

对此,山姆·奥特曼在社交媒体暗示,最初的ChatGPT展示了语言界面的雏形,而新的ChatGPT则给人截然不同的感觉。它快速、智能、有趣、自然,而且“乐于助人”。“随着我们增加(可选的)个性化功能、拜访信息的功能、代表你采取行动的功能等,我真的看到了一个令人兴奋的未来,我们可以用电脑做比以往更多的事情。”(完)

【编辑:张燕玲】

(责任编辑:科技)

相关内容
  • 我国绿氢规模化工业应用实现零的突破
  • 前2个月进出口规模创历史同期新高
  • 新一轮存款利率今日降息
  • 中国旅游研究院:预计2024年国内旅游人数或超60亿人次
  • 怪兽训练《Dokimon》已上线Steam预计第四季度发行
  • 国内多个景点初五前门票已售罄
  • 多组“高频指标”映射开年经济向上之势
  • 跨好第一道门槛——入境游问题调查
推荐内容
  • 再次勇攀高峰《奇迹MU》新顶点 1200级你还有多远
  • 拒绝假唱是商演最后的“倔强”
  • 多地调整公积金贷款政策 未来优化幅度有望继续扩大
  • “维修刺客”坐地起价,消费者如何避免“踩坑”?
  • 怪物猎人世界狩猎笛做哪个
  • 小心!美股年终行情前热后冷,三大考验即将来临