OpenAI揭秘创新大招

文章编号：22075 更新时间：2024-11-15 分类：技术教程 阅读次数：次

资讯内容

智东西编译：汪越，Panken编辑报道，据彭博社消息透露，OpenAI正在研发一款名为Operator的AI Agent（人工智能代理）。该工具计划在明年一月份发布，其核心功能包括自动执行复杂任务，如编写代码和预订旅行等。作为研究预览版，它将面向开发者提供API接口。目前，OpenAI尚未对此消息进行公开评论。

据三位知情人士透露，OpenAI在Agent研究领域有多个项目正在进行，其中接近完成的是一款通用工具，该工具能够在Web浏览器中完成任务。 OpenAI揭秘创新大招
值得注意的是，随着大语言模型（LLM）发展进入瓶颈期，各大科技公司如OpenAI、美国AI大模型独角兽Anthropic、微软以及谷歌等纷纷转向AI Agent的开发，以期望通过这个新领域打破技术平台期的限制，抢先占领市场先机。

事实上，AI Agent已成为科技巨头争相布局的新焦点。
彭博社报道指出，Anthropic在10月份已经推出了一款类似的AI Agent。
不同于其他AI Agent的是，这款工具不仅可以与浏览器进行互动，还能够直接控制用户计算机上的多个应用程序。
该功能可以实时解析用户屏幕上的内容，获得授权后执行诸如浏览网页、点击按钮和输入文本等任务。
目前，Anthropic正在向开发其Claude模型的开发者提供该工具的测试版，并在部分企业客户中进行了初步测试。
这项“计算机使用”功能展现出AI的强大潜力与广泛应用前景。

微软也在加速推进其AI Agent的商业化进程。
在伦敦举办的微软AITour活动中，微软宣布将为Dynamics 365系列业务应用推出10个新的AI Agent，涵盖销售、客户支持和会计等领域。
从今年十二月开始，微软计划提供这些AI Agent的公共预览版，并持续至2025年初。
微软还计划在今年十一月发布Copilot Studio的公开预览版，这是一个帮助企业构建和使用定制化的AI Agent的平台。
作为微软Copilot的扩展平台，Copilot Studio允许用户根据需求定制AI Agent。

据TheInformation报道，谷歌也在研发一款名为Jarvis的AI Agent。
这款工具可以接管用户的网络浏览器，自动执行诸如收集研究资料、购买产品和预订航班等任务。 OpenAI揭秘创新大招
预计这款工具将在今年十二月发布预览版，并与谷歌的下一代大语言模型Gemini一同推出。
谷歌的AI Agent与Anthropic的工具类似，都能通过捕捉用户计算机屏幕的内容来响应指令，但在操作范围上有所不同：谷歌的Jarvis更专注于浏览器操作。

在这个转变的时代背景下，谁能在AI Agent市场占据制高点成为一个引人关注的话题。科技公司推出AI Agent的动作是在开发更先进AI模型时遇到回报递减之际的重要探索方向。正如OpenAI CEO萨姆·阿尔特曼在十月的一次Reddit会议上所言，AI Agent将是下一个重大突破的方向。未来的竞争将聚焦于如何平衡技术深度、商业化进程以及市场需求的精准洞察等方面。随着各大科技公司的积极布局和持续创新，我们可以预见AI Agent将在自动化任务和提升生产力方面发挥越来越重要的作用。无论是OpenAI、Anthropic、微软还是谷歌等科技巨头都将在这场竞争中展开激烈角逐，而最终谁能胜出将取决于其技术实力和市场策略的双重表现。

以上信息仅为基于当前相关报道和数据的分析与推测，具体的发展情况仍有待观察和市场验证。

标签：微软、谷歌、浏览器、应用程序、知名企业、 agent、 openai、

本文地址： https://www.gosl.cn/jsjcwz/ecbc48c8c2d5d849d1d4.html

上一篇：其背后又迎新融资...
下一篇：教育变革下的AI挑战与机遇...

OpenAI揭秘创新大招

资讯内容

发表评论

热门文章

站点推荐