据三位知情人士透露,OpenAI在Agent研究领域有多个项目正在进行,其中接近完成的是一款通用工具,该工具能够在Web浏览器中完成任务。
值得注意的是,随着大语言模型(LLM)发展进入瓶颈期,各大科技公司如OpenAI、美国AI大模型独角兽Anthropic、微软以及谷歌等纷纷转向AI Agent的开发,以期望通过这个新领域打破技术平台期的限制,抢先占领市场先机。
事实上,AI Agent已成为科技巨头争相布局的新焦点。
彭博社报道指出,Anthropic在10月份已经推出了一款类似的AI Agent。
不同于其他AI Agent的是,这款工具不仅可以与浏览器进行互动,还能够直接控制用户计算机上的多个应用程序。
该功能可以实时解析用户屏幕上的内容,获得授权后执行诸如浏览网页、点击按钮和输入文本等任务。
目前,Anthropic正在向开发其Claude模型的开发者提供该工具的测试版,并在部分企业客户中进行了初步测试。
这项“计算机使用”功能展现出AI的强大潜力与广泛应用前景。
微软也在加速推进其AI Agent的商业化进程。
在伦敦举办的微软AITour活动中,微软宣布将为Dynamics 365系列业务应用推出10个新的AI Agent,涵盖销售、客户支持和会计等领域。
从今年十二月开始,微软计划提供这些AI Agent的公共预览版,并持续至2025年初。
微软还计划在今年十一月发布Copilot Studio的公开预览版,这是一个帮助企业构建和使用定制化的AI Agent的平台。
作为微软Copilot的扩展平台,Copilot Studio允许用户根据需求定制AI Agent。
据TheInformation报道,谷歌也在研发一款名为Jarvis的AI Agent。
这款工具可以接管用户的网络浏览器,自动执行诸如收集研究资料、购买产品和预订航班等任务。
预计这款工具将在今年十二月发布预览版,并与谷歌的下一代大语言模型Gemini一同推出。
谷歌的AI Agent与Anthropic的工具类似,都能通过捕捉用户计算机屏幕的内容来响应指令,但在操作范围上有所不同:谷歌的Jarvis更专注于浏览器操作。
在这个转变的时代背景下,谁能在AI Agent市场占据制高点成为一个引人关注的话题。科技公司推出AI Agent的动作是在开发更先进AI模型时遇到回报递减之际的重要探索方向。正如OpenAI CEO萨姆·阿尔特曼在十月的一次Reddit会议上所言,AI Agent将是下一个重大突破的方向。未来的竞争将聚焦于如何平衡技术深度、商业化进程以及市场需求的精准洞察等方面。随着各大科技公司的积极布局和持续创新,我们可以预见AI Agent将在自动化任务和提升生产力方面发挥越来越重要的作用。无论是OpenAI、Anthropic、微软还是谷歌等科技巨头都将在这场竞争中展开激烈角逐,而最终谁能胜出将取决于其技术实力和市场策略的双重表现。
以上信息仅为基于当前相关报道和数据的分析与推测,具体的发展情况仍有待观察和市场验证。
本文地址: https://www.gosl.cn/jsjcwz/ecbc48c8c2d5d849d1d4.html
上一篇:其背后又迎新融资...