谷歌将人工智能代理置于Gemini更新的中心
2025-05-29 17:45

谷歌将人工智能代理置于Gemini更新的中心

  

  旧金山——周三,Alphabet的b谷歌发布了第二代人工智能模型Gemini,并展示了除聊天机器人之外的一系列使用人工智能的新方法,包括通过一副眼镜。

  首席执行官桑达尔·皮查伊在一篇博客文章中称这一时刻为“新代理时代”的开始,他指的是能够更自主地执行任务的虚拟助手。

  “他们可以更多地了解你周围的世界,提前考虑多个步骤,并在你的监督下代表你采取行动。”

  这些发布突显出b谷歌旨在重新夺回主导这项新兴技术的领先地位的方法。微软支持的OpenAI在2022年11月发布聊天机器人ChatGPT时引起了全球的关注。

  谷歌于2023年12月推出了Gemini,现在提供了四个版本。

  周三,苹果发布了其第二便宜的Flash版本的更新,改进了性能,并增加了处理图像和音频的功能。其他型号将于明年上市。

  最近几天,OpenAI宣布了一系列新产品,以多样化其前景,包括每月200美元的高级研究用途ChatGPT订阅,以及其文本到视频模型Sora的可用性。

  b谷歌的做法是将其人工智能的进步注入到已经广泛采用的应用程序中。谷歌表示,每月有超过20亿人在使用搜索、安卓和YouTube等七款产品。

  相对于搜索初创公司Perplexity(该公司正在寻求90亿美元的估值),以及OpenAI、Anthropic或埃隆?马斯克(Elon Musk)的xAI等较新的研究实验室,这样的用户基础是谷歌的一大优势。

  Gemini 2.0 Flash模型将为搜索引擎中的AI overview等应用提供支持。

  Alphabet总裁兼首席投资官Ruth Porat周二在纽约举行的路透NEXT会议上表示,Alphabet最大的赌注是人工智能搜索。

  谷歌还向记者展示了Project Astra的新功能,这是一个通用代理的原型,可以与用户谈论智能手机摄像头实时捕捉到的任何内容。

  DeepMind集团产品经理徐碧波告诉记者,该工具现在可以进行多种语言的对话,也可以处理来自地图和图像识别工具Lens的信息。

  Astra还将在原型眼镜上进行测试,这是该公司自谷歌眼镜失败后首次重返产品领域。其他公司也进入了市场,包括meta公司,该公司在9月份发布了一款增强现实眼镜的原型。

  谷歌还向记者展示了Project Mariner,这是一个Chrome网络浏览器扩展,可以自动击键和鼠标点击,与竞争对手Anthropic实验室的“计算机使用”功能一样,这是一个改进软件编码的功能,也是一个帮助消费者做出决定的工具,比如在视频游戏中做什么或购买什么道具。

本内容为作者翻译自英文材料或转自网络,不代表本站立场,未经允许不得转载
如对本稿件有异议或投诉,请联系本站
想要了解世界的人,都在 火互百读

相关推荐