资讯 更多 >>
2022年朔州群众文化活动专场文艺演...
海亮股份:铜箔项目首条生产线开始...
河南4名阳性人员私自返乡并瞒报情况...
山西吕梁:发现盗采矿产资源行为可举报
受害方律师:接法院通知,乐安命案...
橙色——“柑橘院士”邓秀新心中最...
刷视频相认的双胞胎姐妹:两次创业...
四川通报2021年秋冬季首批大气污染...
首轮筛查:天津73443人全部阴性!
首席气象预报员张霞:30年坚守筑牢...
动态更多 >>
你们,温暖了2021
西安市新增27个中风险地区 目前有1...
广西新增本土确诊病例1例
哈尔滨市全域均为低风险地区
寒潮将影响我国中东部地区 四川盆...
昆明至哈尔滨一航班发现1名入境复阳...
陕西研考:封控区内考生在原报考点...
北京今日最高气温仅5℃ 明起强冷空...
那年今日 | 历史上的12月22日发生...
我要找债主
美籍酿酒师在崇礼:中国是第二故乡...
河南项城报告2名疑似新冠肺炎病例 ...
浙江绍兴确诊病例首次零新增 上虞...
广西东兴实行全员居家隔离 启动口...
新疆全方位推进乡村振兴 “富春山...
云南瑞丽市主城区全员核酸检测结果...
内蒙古满洲里累计治愈出院本土确诊...
孙海洋夫妻驱车山东阳谷:还在为孙...
大国工匠追梦“玉米强国”40载:用...
让南海“海洋热带雨林”斑斓多彩
专题报道 
当前位置: 关注 > >> 正文
 
环球观察:微软:多模态大模型GPT
来源:机器之心     时间:2023-03-10 13:54:13

大家都在猜 GPT-4 发布时间,现在有人提前公布答案了,还是微软自己的 CTO。

我们知道,引爆如今科技界军备竞赛的 ChatGPT 是在 GPT-3.5 上改进得来的,OpenAI 很早就预告 GPT-4 将会在今年发布。最近各家大厂争相入局的行动似乎加快了这个进程。


(资料图片仅供参考)

最新消息是,万众期待的 GPT-4 下周就要推出了:在 3 月 9 日举行的一场名为「AI in Focus - Digital Kickoff」的线下活动中,四名微软德国员工展示了 GPT 系列等大型语言模型(LLM)的颠覆性力量,以及 OpenAI 技术应用于 Azure 产品的详细信息。

在活动中,微软德国首席技术官 Andreas Braun 表示 GPT-4 即将发布,自从 3 月初多模态模型 Kosmos-1 发布以来,微软一直在测试和调整来自 OpenAI 的多模态模型。

GPT-4,下周就出

「我们将在下周推出 GPT-4,它是一个多模态的模型,将提供完全不同的可能性 —— 例如视频(生成能力),」Braun 说道,他将语言大模型形容为游戏规则改变者,因为人们在这种方法之上让机器理解自然语言,机器就能以统计方式理解以前只能由人类阅读和理解的内容。

与此同时,这项技术已经发展到基本上「适用于所有语言」:你可以用德语提问,然后用意大利语得到答案。借助多模态,微软和 OpenAI 将使「模型变得全面」。

微软德国 CTO Andreas Braun。

改变业界

微软德国公司首席执行官 Marianne Janik 全面谈到了人工智能对业界的颠覆性影响。Janik 强调了人工智能的价值创造潜力,并表示,当前的人工智能发展和 ChatGPT 是「iPhone 发布一样的时刻」。她表示,这不是要代替人类工作,而是帮助人们以不同于以往的方式完成重复性任务。

改变并不一定意味着失业。Janik 强调说,这意味着「许多专家会开始利用 AI 实现价值增长」。传统的工作行为正在发生变化,由于新的可能性出现,也会产生全新的职业。她建议公司成立内部「能力中心」,培训员工使用人工智能并将想法整合到项目中。

此外,Janik 还强调,微软不会使用客户的数据来训练模型(但值得注意是,根据 ChatGPT 的政策,这不会或至少不会适用于他们的研究合作伙伴 OpenAI)。

微软德国 CEO Marianne Janik。

实际用例

微软的两位 AI 技术专家 Clemens Sieber 和 Holger Kenn 提供了关于 AI 实际使用的一些信息。他们的团队目前正在处理具体的用例,他们讲解了用例涉及的技术。

Kenn 解释了什么是多模态人工智能,它不仅可以将文本相应地翻译成图像,还可以翻译成音乐和视频。除了 GPT-3.5 模型之外,他还谈到了嵌入,用于模型中文本的内部表征。根据 Kenn 的说法,「负责任」的 AI 已经内置到微软的产品中,并且可以通过云将数百万个查询映射到 API 中。

Clemens Siebler 则用用例说明了今天已经成为可能的事情,例如可以把电话呼叫的语音直接记录成文本。根据 Siebler 的说法,这可以为微软在荷兰的一家大型客户每天节省 500 个工作小时。该项目的原型是在两个小时内创建的,一个开发人员在两周内完成了该项目。据他介绍,三个最常见的用例是回答只有员工才能访问的公司信息、AI 辅助文档处理和在呼叫中心处理口语的半自动化。

微软表示人们很快就会与其全新的 AI 工具见面。特别是在编程领域,Codex 和 Copilot 等模型可以更轻松地创建代码,令人期待。

当被问及操作可靠性和事实保真度时,Siebler 表示 AI 不会总是正确回答,因此有必要进行验证。微软目前正在创建置信度指标来解决此问题。通常,客户仅在自己的数据集上使用 AI 工具,主要用于阅读理解和查询库存数据,在这些情况下,模型已经相当准确。然而,模型生成的文本仍然是生成性的,因此不容易验证。Siebler 表示微软围绕生成型 AI 建立了一个反馈循环,包括赞成和反对,这是一个迭代的过程。

看来在 AI 大模型的竞争中,领先的一方也加快了脚步。微软在过去一周左右接连发布了展示多模态的语言大模型论文 Kosmos-1 和 Visual ChatGPT,这家公司显然非常支持多模态,希望能够做到使感知与 LLM 保持一致,如此一来就能让单个 AI 模型看文字图片,也能「说话」。

微软的下次 AI 活动选在了 3 月 16 日,CEO 萨蒂亚・纳德拉将亲自上台演讲,不知他们是否会在这次活动上发布 GPT-4。有趣的是,微软的活动和百度推出文心一言选在了同一天。

距离 3 月 16 日百度推出类 ChatGPT 聊天机器人还有一周时间,最近有报道称,百度正在抓紧时间赶在发布最后期限前完成任务。目前看来,百度打算分阶段推出文心一言的各项功能,并首先向部分用户开放公测。知情人士称,在春节假期过后,李彦宏就要求包括自动驾驶部门在内的全公司 AI 研究团队将英伟达 A100 支援给文心一言的开发。

我们期待下周各家科技公司能带来惊喜。

关键词:

上一条: 下一条: