智谱宣布完成新一轮30亿元融资,将继续投入基座大模型|甲子光年

   日期:2024-12-26    作者:inleftside 移动:http://ljhr2012.riyuangf.com/mobile/quote/36250.html

从中国的OpenAI,到世界的智谱。

作者|赵健

大模型的融资节奏在放缓,但远没有结束。

12月17日,“大模型六小虎”之一的智谱宣布完成新一轮30亿人民币融资,引入多家战投及国资,君联资本等老股东继续跟投。

这是智谱近期可查的第二轮融资。今年9月,中关村科学城公司宣布以投前200亿估值领投智谱。智谱成为当前估值最高的国产大模型公司之一。

同时,智谱也首次公开其商业化成绩: 2024年商业化收入增长超过100%,平台日均Tokens消耗量增长150倍。其中,MaaS平台的API年收入同比增长超过30倍,MaaS平台已经吸引了70万企业和开发者用户。

智谱业务覆盖智能汽车、制造、大消费、金融、政务服务、医疗健康、游戏娱乐、文化旅游等行业,近期推出的Agent带动大模型在智能设备的落地。

C端产品智谱清言App拥有超过2500万用户,年化收入(ARR)超千万。清言可以通过文本、图像、音频、视频来进行多模态互动,是拥有最全模态的AI助手。

对于本次融资,智谱打算怎么花?还会继续做预训练吗?

此前业内曾有传闻有两家大模型公司放弃预训练。在上周的2024甲子引力年终盛典上,智谱CEO张鹏对此明确回复:“ 我们肯定一直在做预训练,今年8月份还刚刚发布了最新迭代的模型GLM-4-Plus。按照我们的节奏,差不多4~6个月就会迭代一版新模型。”

今天的大模型有从预训练转向后训练的趋势,OpenAI发布的o1模型就代表了向推理的范式转移,国内已经有AI公司在迅速跟进。关于智谱在预训练与后训练推理的算力分配,张鹏也在甲子引力现场透露,“大约一半一半”。

智谱表示,本轮融资将用于智谱基座大模型的进一步研究, 从回答问题升级到解决复杂推理、多模态任务,更好地支撑行业生态发展。

在国内的“大模型六小虎”里,智谱是最稳扎稳打的一名。2023年年初,智谱曾定下目标:用一年的时间追平OpenAI最先进的模型。此后两年时间里,智谱大部分资源都投入在了确定性最高、风险最小的领域,那就是紧盯行业内最好的AI公司——OpenAI,从底层的预训练框架,到模型,到最上层的应用,做全方位的对标。

在预训练层,智谱在2020年自研了预训练框架GLM(General Language Model),这是与OpenAI的GPT(Generative Pre-trained Transformer)并不相同的技术框架。

基于GLM预训练框架,智谱在2021年训练完成百亿参数模型GLM-10B,同年利用MoE架构成功训练出收敛的万亿稀疏模型,2022年研发了中英双语千亿级超大规模预训练模型GLM-130B并开源。GLM-130B已经实现大模型在昇腾、海光、神威等国产平台上的从零训练,适配在寒武纪、摩尔、燧原等国内外40多种GPU芯片上的高效推理。

基于全自研基座大模型的能力,智谱打造了完整的模型产品,包括AI提效助手智谱清言、高效率代码模型CodeGeeX、多模态理解模型CogVLM和文生图模型CogView等。

图片来自智谱

2023年,智谱推出千亿基座对话模型ChatGLM并两次升级,开源版本的ChatGLM-6B让大模型开发者的本地微调和部署成为可能。目前,智谱开源模型系列全球累计下载量超过3000万,并入选Hugging Face平台最受欢迎人工智能机构。

2024年1月,智谱推出新一代基座大模型GLM-4,整体逼近GPT-4;6月,智谱开源GLM-4-9B及视觉模型GLM-4V-9B,多模态能力媲美GPT-4V;7月,智谱推出视频生成模型CogVideoX以及视频生成产品“清影”,与Sora直接对标;8月,智谱新升级基座大模型GLM-4-Plus推出;10月,智谱发布对标GPT-4o的端到端情感语音模型GLM-4-Voice。

如果智谱的发布节奏停留在此,可以说智谱仍然只算是一名追赶者,OpenAI始终领先半步。但接下来,智谱在10月发布大模型交互智能体AutoGLM,以及11月的升级版本和GLM-PC,意味着智谱真正走到了探索AI创新的最前沿。

AutoGLM与GLM-PC是智谱发布的Agent产品,前者可以模仿人类操控手机(phone use),后者可以模仿人类操控电脑(compute use)。在11月的发布会上,张鹏在现场演示了用AutoGLM在微信里建群并在群里发出了100个、总价值2万元的红包。

萨姆·奥尔特曼也非常看好Agent技术的突破,但OpenAI目前尚未发布类似产品。

此前,智谱公布了其接下来面向AGI的的路线图。

智谱定义了大模型发展的五个阶段,与OpenAI的定义有所不同,其中,L1代表语言能力,L2代表逻辑思维能力与多模态能力,L3代表使用工具(Agent)的能力,L4代表自我学习的能力,L5代表全面超越人类、探究科学规律的能力。

图片来自智谱

并且,智谱也提出了他们认为每一个阶段的进度条。目前,L1的语言能力已经达到80%;L2的逻辑思维能力完成度为60%,o1模型是推理模型的新范式;L3 Agent的能力还比较早期,只有40%,与人类相比还有很大的提高空间;L4、L5基本才刚刚开始。

张鹏认为,目前的Agent能力更像是在用户和应用之间,增加一个智能的调度层,链接所有应用甚至是所有设备。 这可以看做是大模型通用操作系统(LM-OS)的一种雏形。未来,基于大模型智能能力(从L1到L4乃至更高),有机会实现原生的人与机器交互的方式LM-OS,这将改变人与机器交互的方式。

去年,大模型公司都被看作“中国的OpenAI”,某种程度上这仍然是跟随者的标签。自从2023年下半年开始,智谱就在很多场合强调,做中国的ChatGPT远非公司的目标。

很多人可能忽略了,智谱成立于2019年,远远早于ChatGPT发布的时间点。智谱成立的第一天,就写下了“让机器像人一样思考”的愿景,这跟今天的AGI殊途同归。

据「甲子光年」了解,今年有智谱员工在飞书的个性化签名上写着: “不做中国的OpenAI,做世界的智谱”。

这句话也可以看作智谱通往AGI之路的必经之路。


特别提示:本信息由相关用户自行提供,真实性未证实,仅供参考。请谨慎采用,风险自负。


举报收藏 0评论 0
0相关评论
相关最新动态
推荐最新动态
点击排行
{
网站首页  |  关于我们  |  联系方式  |  使用协议  |  隐私政策  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  鄂ICP备2020018471号