当前位置:首页 > 知识 > 财经观察:提升人机交互效率 多模态大模型易用性进一步推进

财经观察:提升人机交互效率 多模态大模型易用性进一步推进

2024-09-17 04:24:26 [焦点] 来源:松原市某某制品有限公司

人民网北京5月14日电 (焦磊、财经实习生张泊洋)陪人聊天、观察帮助分析工作中的提升态福建某某化工涂料培训中心问题并给出解决方案,甚至和人建立起情感羁绊……在科幻电影《Her》中,人机聊天机器人“Samantha”用充满智慧和幽默的交互进回答展示出高度的智能性和适应性。当下,效率性进这些来自过去的多模科幻想象正加速照入现实中。

北京时间5月14日凌晨,模型美国科技公司OpenAI在春季发布会上发布了最新GPT-4o多模态大模型。易用据OpenAI公司首席技术官米拉·穆拉蒂(Mira Murati)介绍,步推GPT-4o可以接收文本、财经福建某某化工涂料培训中心音频和图像的观察任意组合作为输入,并实时生成文本、提升态音频和图像的人机任意组合进行输出,其中“o”代表“omni全能”。交互进

一直以来,多模态人机交互便是AI领域重点研究发力方向之一。继文生视频大模型Sora之后,GPT-4o的发布迎合了业内对多模态大模型的更多期待。

模态即每一种信息的来源或形式。人们在信息获取、环境感知、知识学习与表达等方面都是采用多模态的输入、输出方式。业内分析认为,相比单模态,多模态大模型同时处理文本、图片、音频以及视频等多类信息,与现实世界融合度高,更符合人类接收、处理和表达信息的方式,与人类交互方式更加灵活,表现得更加智能,能够执行更大范围的任务。

作为面向未来人机交互范式的全新大模型,GPT-4o具有文本、语音、图像三种模态的理解力,并可以综合对话者语气和所处环境空间等因素进行回答,展现出了高度智能性。

发布会上,GPT-4o展示了多项多模态交互能力。在进行实时语音交流时,其响应极快,并且可以识别用户的语音情绪,语音有情感,还能用不同语言和多人同时交互。在语音的同时可以与视频实时交互,演示了一边聊天一边解答手写数学问题,以及实时交流阅读代码,指导编程、视频聊天等能力。

米拉·穆拉蒂表示,“这是我们第一次在易用性方面真正向前迈出了一大步。”

此前,大模型在各个领域的应用主要集中在文生文、文生图之上,今年初Sora的发布则推动文生视频领域进一步发展。业内分析表示,此次GPT-4o的发布,将促使多模态综合交互成为生成式AI的重点发展方向,进而提升人机交互效率,逐渐向AGI方向迈进。

国盛证券研报分析,GPT-4o是迈向更自然的人机交互的重大进步,新功能带来了崭新的多模态交互能力,通过新的端到端模型实现了体验上的新突破,有望在各类终端实现用户体验的最大化。

多模态大模型包含的图文、音频、视频内容数据量巨大,进而引发人们对算力供应的关注。业内分析认为,未来AI的发展对算力的需求将会是几何式增长,算力限制可能是影响生成式AI应用开放使用的重要因素,而算力的可获取性以及成本将是挑战之一。此外,多模态大模型还将带来更严峻的安全挑战。

米拉·穆拉蒂表示,在安全性问题上,GPT-4o通过过滤训练数据和通过训练后细化模型行为等技术,在跨模态设计中内置了安全性。OpenAI还创建了新的安全系统,为语音输出提供防护。

据介绍,用户可有数量限制地免费使用GPT-4o模型来进行数据分析、图像分析、互联网搜索、访问应用商店等操作。

OpenAI CEO山姆·奥特曼在发布会后表示,“我们将创造人工智能,然后其他人将使用它来创造各种令人惊奇的事物,我们所有人都会从中受益。”此外,他还表示OpenAI其他业务收入将帮助公司向数十亿人提供免费的人工智能服务。

(责任编辑:综合)

推荐文章
  • 以色列军机两度在黎巴嫩首都上空突破音障发出巨响

    以色列军机两度在黎巴嫩首都上空突破音障发出巨响 △资料图  总台记者当地时间9月10日获悉,以色列军机当天傍晚两次在黎巴嫩首都贝鲁特上空突破音障发出巨响。  当地时间当日18时44分,总台记者在贝鲁特听到两声巨响,两次巨响间隔约5秒。  今年8月以 ...[详细]
  • 万科济南总经理肖劲被带走调查

    万科济南总经理肖劲被带走调查 界面新闻记者 | 王婷婷界面新闻编辑 | 李慎4月10日,界面新闻多方核实确认,万科济南公司总经理肖劲已于48小时前,被山东警方带走调查。记者获悉的调查原因有多个版本,目前尚不能确定具体原因。记者询问 ...[详细]
  • 青岛:机场口岸迎节日返程高峰

    青岛:机场口岸迎节日返程高峰 齐鲁网·闪电新闻5月5日讯“五一”小长假临近尾声,全国多地口岸迎来返程高峰。在青岛机场口岸的出入境大厅,不少探亲访友、旅游度假的旅客,也陆续踏上了返程之旅。今年假期以短途旅游为目的的个人游是青岛机场口 ...[详细]
  • 中指研究院:1

    中指研究院:1 4月1日,中指研究院发布2024年1-3月中国房地产企业销售业绩排行榜。数据显示,2024年1-3月,TOP100房企销售总额为8978.3亿元,同比下降但降幅较上月收窄。其中TOP100房企3月单月 ...[详细]
  • 国内首个飞机拆解循环利用项目启动

    国内首个飞机拆解循环利用项目启动 工作人员正在拆解飞机8月30日,空中客车飞机全生命周期服务中心(以下简称“服务中心”)的机库里,一架空客A330-200静静地停放着,巨大的机翼下面,发动机已经拆卸完成,只留下空荡荡的机身。这架飞机是 ...[详细]
  • 北京车展上的概念车,你更pick谁?AI如何点评?

    北京车展上的概念车,你更pick谁?AI如何点评? 版权声明:本文版权为网易汽车所有,转载请注明出处。网易汽车5月3日报道概念车,作为每个汽车品牌心中激进创想的集大成者,总是以其超越时代的外形设计和内在技术革新,成为焦点所在,俘获无数目光。每一次的车展 ...[详细]
  • 北京车展上的概念车,你更pick谁?AI如何点评?

    北京车展上的概念车,你更pick谁?AI如何点评? 版权声明:本文版权为网易汽车所有,转载请注明出处。网易汽车5月3日报道概念车,作为每个汽车品牌心中激进创想的集大成者,总是以其超越时代的外形设计和内在技术革新,成为焦点所在,俘获无数目光。每一次的车展 ...[详细]
  • 上海交大这颗探月卫星随嫦娥六号飞天,师生现场观看发射

    上海交大这颗探月卫星随嫦娥六号飞天,师生现场观看发射 2024年5月3日17时27分,长征五号遥八运载火箭在文昌航天发射场点火升空,成功将嫦娥六号月球探测器送入地月转移轨道,发射任务取得圆满成功。5月4日,澎湃新闻记者从上海交通大学获悉,由上海交大航空航 ...[详细]
  • P1+P4架构/豪华插混 沃尔沃家族亮相成都车展

    P1+P4架构/豪华插混 沃尔沃家族亮相成都车展 版权声明:本文版权为网易汽车所有,转载请注明出处。网易汽车9月3日报道在2024成都车展上,沃尔沃汽车携插混家族XC90插混、S90插混、XC60插混、S60插混及纯电车型EM90、EX30集体亮相, ...[详细]
  • 常熟:执行限时住房“卖旧买新”补贴,最高100%补贴契税

    常熟:执行限时住房“卖旧买新”补贴,最高100%补贴契税 常熟市风光 IC 资料图据微信公众号“常熟发布”3月31日消息,江苏省常熟市发布促进房地产市场平稳健康发展11条工作措施。实施购房补贴文件要求,实行契税补贴。对购买首套住房实行契税补贴。补贴时间:20 ...[详细]