Anthropic如何成为OpenAI的头号心病?

   日期:2024-12-27    作者:n9htzn 移动:http://ljhr2012.riyuangf.com/mobile/quote/63818.html

作者 | Stephanie Palazzolo, Erin Woo and Amir Efrati

编译 | 未来学人

来源 | The Information


内容要点:

在OpenAI的众多竞争对手中,Anthropic最令其高管忧心忡忡。

今年初秋,OpenAI领导层对Anthropic在自动化编程领域的表现感到震惊——内部测试显示,Anthropic的模型性能超越了OpenAI。AI编码作为OpenAI的核心优势之一,是数百万用户订阅ChatGPT的主要原因。

一位OpenAI员工透露,去年当其投资的初创公司Cursor在7月将默认编码助手从OpenAI切换为Anthropic的Claude模型时,就已让OpenAI领导层紧张不安。Cursor联合创始人阿曼·桑格(Aman Sanger)在10月的一次播客中表示,Anthropic最新的Claude 3.5 Sonnet模型因其出色的需求理解能力,成为编码领域的"最佳之选"。

这种技术优势正在转化为实质性的商业成果。Anthropic增长和营收主管凯特·詹森(Kate Jensen)在采访中表示,过去三个月内,使用其模型进行软件开发和代码生成的客户贡献的年化收入增长了10倍。

为应对这一势头,据一位参与规划的人士透露,OpenAI正在加紧提升其模型的编码能力。另一位员工表示,近几周来,包括首席产品官凯文·韦尔(Kevin Weil)在内的OpenAI领导层将Cursor等案例视为Anthropic业务增长的重要信号。

OpenAI对Anthropic的担忧凸显了会话式AI市场的快速变化。尽管OpenAI仍是当代AI初创公司中的领军者,但竞争对手正在缩小技术差距,甚至吸引了部分OpenAI员工加入。Anthropic的业务增长超出预期,逐步削弱了OpenAI在会话式AI领域的主导地位。

对此,一位OpenAI发言人重申了公司在消费者和企业业务方面的优势。

除了Anthropic,OpenAI还面临着来自谷歌和埃隆·马斯克的xAI等竞争对手的挑战。其中,xAI凭借在孟菲斯快速建立大型数据中心的行动引发关注。虽然微软和亚马逊分别与OpenAI和Anthropic建立了合作关系并投入巨资,但它们同时也在开发竞争性的AI服务。

值得注意的是,成立时间比Anthropic早五年的OpenAI在营收方面仍占优势。今年其营收有望达到40亿美元,是Anthropic预期全年营收的五倍以上。在其他方面,OpenAI同样遥遥领先:总融资额达200亿美元,峰值估值达1570亿美元,而Anthropic的融资额为110亿美元,峰值估值为180亿美元。

OpenAI的财务状况优于竞争对手,主要因为其与云服务商微软共享的营收比例低于Anthropic与亚马逊的分成比例。两家公司的技术都为各自的云合作伙伴提供了核心产品支持。

OpenAI正寻求将治理结构从非营利董事会控制转向营利性业务模式。一个可能的方案是采用营利性公益公司的形式——这也是Anthropic和xAI目前采用的模式。

由于AI技术的开发和运营成本高昂,OpenAI和Anthropic今年都投入了数十亿美元。OpenAI更是计划开发自主数据中心芯片和其他硬件,以减少对外部供应商的依赖。这意味着公司在未来相当长的时期内都需要持续融资。

然而,Anthropic有一个自设的限制因素——对安全性的高度重视,这在过去确实减缓了其AI发展速度。这里的"安全性"指的是AI公司(包括OpenAI在内)为确保其技术不会造成严重错误或危及人类生命的努力,比如防止AI被用于研发生物武器或发动核打击等极端情况。

Anthropic的七位联合创始人都曾在OpenAI任职,因对AI安全性的担忧,他们于2020年底离职。联合创始人兼首席执行官达里奥·阿莫迪(Dario Amodei)透露,公司在2022年夏季开发出一款AI聊天机器人后,选择继续进行安全测试而不是立即发布。

几个月后,OpenAI发布ChatGPT,在科技界和用户群中引发轰动。Anthropic则在四个月后才推出其Claude聊天机器人。

近期,Anthropic对竞争对手采取了更为大胆的挑战姿态。在包括首席技术官米拉·穆拉蒂(Mira Murati)在内的多名OpenAI员工离职后,Anthropic于10月在旧金山国际机场投放了带有讽刺意味的Claude AI广告:"没有那么多戏剧性"。

Anthropic在发布实验性产品方面也表现得更为积极。10月,该公司推出了一款允许其会话式AI控制用户计算机的产品,可用于自动构建网站或编辑电子表格。公司在博客中坦承,这一决定可能带来网络攻击的风险。

这一举措在OpenAI内部引发了嘲讽。据一位员工透露,OpenAI领导层在近期会议上批评了Anthropic的这一决定,认为这与该公司一贯强调的AI安全性理念相悖。

创始人的愿景分歧

Anthropic和OpenAI的创始人之间的矛盾在他们因安全问题而分道扬镳之前就开始了。 

作为OpenAI研究副总裁,达里奥领导了OpenAI的GPT-2和GPT-3模型的开发,并与来自OpenAI和谷歌DeepMind的其他研究人员一起合著了一篇关于来自人类反馈的强化学习的开创性AI论文。这项技术允许人类对模型响应提供反馈,并推动了会话式AI的许多改进。 

据前员工透露,在OpenAI,达里奥曾和其他高管,特别是首席执行官萨姆·阿尔特曼和总裁格雷格·布罗克曼就谁应该领导某些项目以及安全问题发生冲突。 

2019年初,布罗克曼正在研究可以玩在线战斗游戏《Dota 2》的AI。两位前员工表示,后来,布罗克曼试图加入由达里奥部分负责的OpenAI研究工作,以开发语言生成GPT模型,这些模型最终将成为ChatGPT等畅销产品的基础。 

然而,达里奥和他的妹妹丹妮拉·阿莫迪(现任 Anthropic 总裁)阻止了布罗克曼加入该项目,部分原因是他“难以相处”,并且经常在最后一刻更改软件代码而不告诉其他人。布罗克曼在阿莫迪兄妹和其他OpenAI研究人员离开公司创立Anthropic后,才参与了GPT项目。 

在他们离职前的几个月里,阿莫迪兄妹与OpenAI其他人员之间的裂痕如此之深,以至于达里奥为研究人员创建了私人Slack频道,阿尔特曼、布罗克曼和其他人都没有被邀请加入,一位前员工说。 

达里奥在11月份的一次播客中,这显然是在影射他在OpenAI的经历。他表示,是因为对如何安全地构建AI的不同意见导致了分裂。 

他说:“如果你对如何做到这一点有自己的想法,你应该去做,实现你的想法。试图与别人的想法争论是极其无效的。” 

专注客户需要的实用功能

Anthropic的优先事项与OpenAI的优先事项之间存在细微差别,这可能部分解释了为什么Anthropic在商业客户中取得了进展。 

员工们表示,由于其Claude聊天机器人仅获得ChatGPT使用量的一小部分,因此Anthropic将其研究工作更多地集中在帮助更好地向企业和开发者销售其Claude大型语言模型。 

结果是,Anthropic在发布多模态模型和可以解决更复杂、多步骤问题的推理模型方面比OpenAI慢,而这种能力对科学研究人员非常有用。 

据相关人士称,在Anthropic领导人看来,这些工具远远超出了大多数当前AI客户关注的技术简单应用,例如摘要、内容生成和客户服务机器人。ChatGPT客户对推理模型的使用相对较少似乎支持了这一观点。 

相反,Anthropic正在投入更多资源来推出商业客户强烈需要的功能,例如更大的上下文窗口,它能够上传大量信息,AI模型可以使用这些信息来回答问题。该人士还表示,Anthropic还致力于确保模型可以使用外部工具,例如数据库和应用程序编程接口,这些工具可以帮助公司构建包含实时专有信息的应用程序。 

Anthropic的詹森表示,大多数公司正在将AI构建到已经存在一段时间的产品中。这需要更大的上下文窗口等功能,这些功能听起来可能并不性感,但却能产生重大影响。 

詹森说,这些“感觉很简单,但却能改变游戏规则的事情”。

B端模型替换之战

Anthropic对企业实用性改进的重视帮助其赢得了包括云端协作初创公司Airtable在内的一些知名客户。 

Airtable首席执行官豪伊·刘(Howie Liu)表示,Claude更大的上下文窗口允许其员工上传冗长的销售电话记录,以便模型能够更好地突出对话语气和客户投诉等细节。 

刘补充说,有时Claude的回复比其他LLM更像人。Airtable过去也测试过OpenAI的模型,并将继续将其用于其他应用程序。 

与此同时,法律研究公司LexisNexis将其约60%的AI功能用于Claude。首席技术官杰夫·雷尔(Jeff Reihl),其中许多与起草或分析法律文件有关,而大型上下文窗口在此非常有用。他补充说,其余功能使用OpenAI模型(如GPT-4)和开源模型(如Mistral AI)。 

10月份,Intercom宣布,其用于解决客户支持工单的AI聊天机器人Fin将由Anthropic的Claude模型提供支持,而不是OpenAI的模型。这家客户支持初创公司在一篇博客文章中表示,Claude允许其代理“更准确、更深入、更快速地回答更多问题”,在无需对模型进行任何额外调整的情况下解决了51%的客户支持工单,高于使用OpenAI模型支持时的23%。

构建编码优势

Anthropic在自动化编码任务方面已经构建起比OpenAI更大的优势。

编码助手初创公司Augment的首席执行官斯科特·迪岑(Scott Dietzen)表示,在今年夏天之前,这家已筹集超过2.5亿美元资金的初创公司仅在其产品中使用免费的开源模型。但是,当Anthropic在6月份发布Claude 3.5 Sonnet后,Augment开始付费使用它,因为他们认为这是一个"突破性模型",表现超越了他们测试的其他模型,包括OpenAI的产品。

迪岑表示:“目前,即便是我们将开源模型与后期训练相结合,与Sonnet所能实现的功能之间仍存在显著差距,特别是在那些需要更多推理时间和深入理解的应用场景中。”

另一家以Claude 3.5 Sonnet为默认模型的编码助手Sourcegraph,其联合创始人兼首席执行官奎因·斯拉克(Quinn Slack)也表示,其三分之二的客户选择继续使用Anthropic模型,而不是切换到OpenAI、谷歌或其他公司的模型。

10月份,就连OpenAI的主要盟友微软也开始在其GitHub Copilot编码助手中允许开发者使用非OpenAI模型,包括来自Anthropic的模型。

虽然阿尔特曼很少公开谈论Anthropic或阿莫迪兄妹,但他在上月的一场活动中承认,这位竞争对手"确实拥有一个在编码方面非常出色的模型,这是一项令人印象深刻的成就"。

火力全开,好戏上演

近期迹象显示,Anthropic已开始对OpenAI发起攻势。

詹森透露,公司已显著扩大销售团队规模:目前企业销售团队的人数是一年前的五倍多。同时,销售策略也发生了转变。

据一位接触过其销售的人士称,今年年初时,Anthropic销售人员向潜在客户传递的信息相对保守,他们通常会承认大多数开发者都在使用OpenAI等公司的模型,只是表示Anthropic的模型在特定用途(如构建自定义模型)上更具性价比或优势。

这位知情人士表示,自6月份发布最新Claude模型后,公司的销售策略转为更加积极主动。Anthropic的销售代表开始向潜在客户强调,其模型在今年多次通过新版本超越了OpenAI的产品,并重点突出Claude模型在多个主流AI基准测试中的优异表现。

尽管并非所有AI业内人士都认同基准测试能准确反映模型在实际应用中的表现,但众多AI模型客户都对Anthropic今年的技术进步给予了高度评价。

在11月份的高盛活动上,AI搜索引擎初创公司Perplexity的首席执行官阿拉文德·斯里尼瓦斯(Aravind Srinivas)称,夏季发布的Claude 3.5 Sonnet是“真正的突破,不仅对我们的产品如此,对市场上许多其他产品也是如此”。

斯里尼瓦斯表示,该模型"在推理能力上有了显著提升"。


本文编译自The Information,采用Gemini、Notion AI编译,编辑:从林

本文为翻译作品,原文版权归原作者所有。未来学人仅作编译,文章观点不代表未来学人立场。如有侵权,请联系我们删除。



特别提示:本信息由相关用户自行提供,真实性未证实,仅供参考。请谨慎采用,风险自负。


举报收藏 0评论 0
0相关评论
相关最新动态
推荐最新动态
点击排行
{
网站首页  |  关于我们  |  联系方式  |  使用协议  |  隐私政策  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  鄂ICP备2020018471号