进入2024年2月,ChatGPT引发的全球人工智能(AI)大模型热度不断攀升,如同中国春节一样“热闹非凡”。
过去一个月内,OpenAI、谷歌、微软、英伟达、字节跳动等多家国内外大科技公司均发布了多个关于 AI 的重要消息,动作不断,OpenAI 突然推出的视频生成模型Sora引爆了市场,而且科技巨头纷纷下场“造芯”,还有各种AI应用工具层出不穷,让人眼花缭乱。
此次,钛媒体AGI 回顾并梳理了二月份通用人工智能(AGI)行业的重大新闻事件,帮助读者快速了解瞬息万变的 AI 技术领域,感受 AI 浪潮带来的全新科技革命。
2月1日
OpenAI构建早期预警系统
OpenAI公司宣布正构建一个早期预警系统,用于辅助识别大语言模型 (LLMs)在生物威胁创建方面的能力。
字节跳动版GPTs上线
字节跳动正式推出 “Coze 扣子”Al Bot 开发平台。任何用户都可以快速、 低门槛地搭建自己的 ChatBot,且支持用户分享,提供Bot商店和插件等。
智源研究院院长换人,前快手技术副总裁王仲接替黄铁军
北京智源人工智能研究院2月1日宣布,前快手技术副总裁王仲远博士接任智源研究院院长,全面负责研究院各项工作。自此,黄铁军将不再兼任院长的身份,而是任智源研究员理事长。
2月2日
谷歌推出AI图像生成器ImageFX
2月2日消息,谷歌对生成式AI产品进行了一系列更新:Brand支持文生图,但仅支持英文生成;推出AI图像生成器ImageFX、全新文生音乐平台 MusicFX以及文本扩写平台 TextFX,谷歌还宣布在地图中增加生成式 AI 功能。
Meta今年将发布新一代自研芯片
为摆脱对英伟达的重度依赖,Meta宣布二代自研AI芯片Artemis今年正式投产,新的芯片将被用于数据中心的推理(Inference)任务,并与英伟达等供应商的GPU一起协同工作。
英伟达对华“特供版”H20芯片接受订购
2月2日消息,英伟达开始接受预订“中国特供缩水版” AI 芯片H20,性能远低于H100,但定价与华为昇腾产品相当, 分销商的订单定价为每张卡 12,000 美元至 15,000 美元。
2月3日
免费版GPTs “HuggingChat 助手”发布
AI 社区Hugging Face发布 HuggingChat 助手,类似于OpenAI推出的GPTs,不过不同的是,GPTs需要每月付费20美元使用,而Hugging Chat完全免费使用。
Meta开发AudioSeal技术,可为音频添加水印
Meta开发出AudioSeal的技术,能够在人工智能生成的语音中嵌入隐形水印,用于主动检测AI生成的言论,同时还能够识别生成它的具体模型。
2月4日
OpenAI等数十家 AI 芯片企业“围剿”英伟达
随着AI算力需求增长,英伟达在数据中心AI市场占据98%的份额,面临来自 OpenAI、Meta等多家AI公司的“围剿”。全球有超过18家AI芯片设计初创公司获得超过60亿美元融资,估值超过250 亿美元。此外,英特尔、AMD等芯片巨头也在持续挑战英伟达的市场地位。
2月5日
AI芯片需求飙升,华为放缓智能手机生产
2月5日消息,因华为AI芯片需求飙升,加上制造方面的限制,华为考虑放缓高端手机Mate60生产。
苹果公布开源图片编辑神器MGIE,或将搭载到 iPhone 上
苹果公布一项研究,名为 MGIE的多模态大模型,将图像视为输入,并提供视觉感知响应,从而用于解决指令引导不足等问题。
OpenAI发布 visionOS 版 ChatGPT
2月5日,OpenAI 发布Apple Vision Pro版ChatGPT,用户通过这款应用可提出问题、获取答案、接收建议、学习新的话题等,并能够生成图像和文本。苹果表示,目前该设备的全新应用商店中有超过600种新的空间体验、超过100万个兼容应用。
2月6日
阿里通义千问模型升级Qwen1.5
2月6日,通义千问大模型(Qwen)1.5 版上线,新版大模型包括六个型号尺寸:0.5B、1.8B、4B、7B、14B 和 72B,其中最强版本的性能超越了GPT-3.5、Mistral-Medium,包括 Base 模型和 Chat 模型,且有多语言支持。
阿里通义千问团队表示,相关技术也已经上线到了通义千问官网和通义千问 App。
昆仑万维发布新版MoE大语言模型天工2.0
昆仑万维正式发布新版MoE大语言模型天工2.0与新版天工AI智能助手APP,这是国内首个搭载MoE架构并面向全体C端用户免费开放的千亿级参数大语言模型AI应用。
2月7日
黄仁勋入选美国工程院院士
2月7日消息,美国国家工程院(National Academy of Engineering, NAE)公布了新增院士名单,英伟达创始人兼CEO黄仁勋赫然在列。
DeepMind与斯坦福团队推出二代ALOHA
DeepMind联合斯坦福华人团队发布二代版本ALOHA 2,与一代相比,ALOHA 2 具有更强的性能、人体工程学设计和稳健性,且成本还不到 20 万元人民币。
2月8日
谷歌推出史上最强大模型 Gemini Ultra 1.0
2月8日,谷歌推出史上性能和功能最强大的Gemini Ultra 1.0模型,并公布基于模型的付费产品Gemini Advanced,同时将Google Bard更名为Gemini,推出安卓版本的独立App。
2月9日
2023年OpenAI收入已突破20亿美元,到2025年有望翻倍
有消息称,OpenAI在2023年的年度经常性收入(ARR)已达到20亿美元,同比增长超过4500%。报道还称,随着越来越多客户采用ChatGPT等生成式AI工具来提高工作效率,到2025年这一数字有望翻倍。
2月10日
OpenAI CEO奥尔特曼计划7万亿美元造芯,用于整个 AI 基础设施建设
2月10日,OpenAI CEO奥尔特曼发文确认了启动“造芯”。此前有消息称,奥尔特曼计划筹资7万亿美元建立 AI 芯片半导体制造网络,以解决GPU 短缺等问题。
2月11日
华为公布15亿参数的盘古微小模型
华为 AI 研究团队日前公布了两个 PanGu-π-1B Pro 和 PanGu-π-1.5B Pro,参数规模分别为10亿/15亿,声称以一个 1B 大小的语言模型作为载体,在分词器裁剪、模型架构调优、参数继承、多轮训练等方面具有巨大优势,GPU 的推理速度和效率远超GPT-3.5。
2月12日
中东 AI 龙头G42撤出中国的投资
2月12日消息,中东地区领先的 AI 技术公司G42证实正准备削减在中国的业务,未来将专注于投资美国、以色列、德国、英国等西方市场 AI 产业布局。
“女版巴菲特”Cathie Wood团队预测:最快2026年实现通用人工智能
被称为“女版巴菲特”的方舟投资管理公司CEO“木头姐”凯茜·伍德(Cathie Wood)发布报告预测, AGI 最早将在2026年出现,最晚则到2030年出现,时间从2019年预测的80年,缩短至不到7年。
2月13日
英伟达发布新款GPU RTX 2000 Ada,公司市值突破1.8万亿美元
2 月 13 日消息,英伟达发布面向专业市场的入门级工作站显卡 RTX 2000 Ada Generation,售价 625 美元(约 4500 元人民币),美股2月12日收盘,英伟达市值一度飙升至1.8万亿美元,超越了谷歌、亚马逊,位列美国第三。
英伟达官宣本地AI聊天机器人Chat with RTX
英伟达13日发布一个 AI 对话机器人 “Chat with RTX”,面向 GeForce RTX 30 系列和 40 系列显卡用户(至少有 8GB VRAM),不仅支持本地运行,而且可帮你检索、分析保存在电脑上的文件。
2月14日
OpenAI 技术大神Andrej Karpathy离职
OpenAI创始成员之一、公司 AI 技术研究员安德烈·卡帕蒂 (Andrej Karpathy)社交平台上证实已从OpenAI 离职,没有“发生”任何不愉快的事情,接下来他将开展个人创业项目。
OpenAI宣布小范围测试ChatGPT“记忆”功能
OpenAI官宣正在小范围测试 ChatGPT 的“记忆”功能,该功能可以记住个人的聊天对话内容,避免重复输入相同的信息,提升交流效率。
2月15日
OpenAI发布文生视频模型Sora
2月15日,OpenAI发布文生视频模型Sora,通过简短或详细的提示词描述,或一张静态图片,Sora就能生成类似电影的逼真场景,涵盖多个角色、不同类型动作和背景细节等,最高能生成1分钟左右的1080P高清视频。
2月16日
谷歌推出Gemini 1.5版本模型
谷歌发布新一代多模态大模型Gemini 1.5系列,最高支持1000万上下文,可支持100万tokens,性能和多任务方面均比1.0版本有提升,可对大量信息进行复杂推理,在给定提示内无缝分析、分类和总结大量内容。
2月17日
OpenAI允许员工出售股份,投后估值超800亿美元
据纽约时报报道,OpenAI公司日前已完成一项允许员工出售公司股份的交易,由风险投资公司Thrive Capital牵头,公司员工可将其所持公司股份出售套现。融资完成后,OpenAI的投后估值已超过800亿美元。不到 10 个月的时间里,OpenAI 估值几乎翻了三倍。目前,OpenAI估值仅次于字节跳动 (ByteDance) 和 SpaceX,已成为全球第三大科技独角兽企业。
谷歌被曝出内部AI大语言模型Goose
据报道,一份泄露的文件显示,谷歌悄悄推出了名为“Goose”的内部AI大语言模型,以帮助员工更快地编写代码,协助开发新产品,提高工作效率。
2月18日
英伟达首次公开目前最快AI超算,搭载4608个H100 GPU
英伟达首次向外界公布其最新的面向企业的AI 超级计算机Eos,同时也是英伟达目前速度最快的AI超级计算机。据介绍,Eos共配备了4608个英伟达H100 GPU,同时还配备了1152个英特尔Xeon Platinum 8480C处理器(每个CPU有56个内核)。Eos还采用了英伟达Mellanox Quantum-2 InfiniBand技术,数据传输速度高达400 Gb/s,对训练大型AI模型和系统扩展至关重要。
英国AI芯片独角兽拟以超35亿美元“卖身”
对标英伟达的英国 AI 芯片公司Graphcore正在考虑将其出售给外国所有者,交易金额可能超过5亿美元(4亿英镑,约合人民币35.60亿元),潜在交易对象包括 OpenAI、日本软银集团和 Arm 等公司。
2月19日
ElevenLabs预览 AI 声音模型演示
2月19日,ElevenLabs首次公布一款文本到语音模型,宣称使用OpenAI Sora能生成令人难以置信、带有声音的视频。
2月20日
马斯克:Neuralink首位人类受试者已康复且思维可控制鼠标
特斯拉CEO马斯克在社交平台透露,脑机接口公司Neuralink的首位人类受试者“似乎已完全康复,并能仅凭思维在电脑屏幕上移动鼠标”。据悉,脑机接口技术是一种在脑与外部设备之间建立直接的通信渠道,它是通向AGI关键方向之一。
三星电子据悉在硅谷成立新团队,开发通用 AI 芯片
知情人士透露,三星电子已在硅谷成立新团队,开发通用人工智能芯片。据悉,谷歌前开发人员Woo Donghyuk将领导该团队。
Groq推出“最快”AI推理芯片
硅谷初创AI芯片企业Groq 因推出“最快”AI推理芯片一夜爆火,Groq宣称其自研的LPU(语言处理单元)芯片的推理性能是英伟达GPU(图形处理器)的10倍,而成本仅为其十分之一。生成速度接近每秒500 token(文本中的一个最小单位),碾压GPT-3.5的每秒40 token。
2月21日
Sora新视频只发TikTok,OpenAI账号4天涨粉10万
悄无声息,OpenAl正式杀入TikTok,加上洗脑配乐直接让人刷到停不下来, 疯狂引流吸粉中:短短4天,涨粉10万,50万点赞。a16z合伙人惊呼,如果这是在信息流里刷出来的,绝对分不出真假。
2月22日
谷歌最强开源大模型Gemma发布,可用于笔记本电脑设备
谷歌表示,Gemma是全球性能最强大、轻量级的开源模型,分2B(20亿参数)和7B(70亿)两种尺寸版本,可在笔记本电脑、工作站或谷歌云上运行。在18个语言理解、推理、数学等关键基准测试中,Gemma-7B有11项测试分数超越Meta Llama-2等其他开源模型。
三星移动部门负责人透露Galaxy AI将扩展到可穿戴设备
三星移动部门负责人 TM Roh对外透露该公司未来在AI方面的计划,表示三星下一步将把Galaxy AI 技术应用范围扩展到可穿戴式设备等产品当中,而不仅仅是手机。
2月23日
文生图鼻祖模型Stable Diffusion 3震撼发布
2月23日凌晨,生成式AI 公司 Stability AI发布Stable Diffusion 3,公司声称这是全球最强大的文生图模型。新模型采用Sora同源技术,在生成质量、文字书写效果等方面具有较大改进。
英伟达市值一夜暴涨2770亿美元,创史上最大单日涨幅
美股22日英伟达市值单日暴涨 2770亿美元,创华尔街最大的股票单日涨幅,股价也创历史新高,总市值升至1.96万亿美元,成为全球第三大科技公司。
字节跳动文生图开放模型SDXL-Lightning发布
2月23日,字节跳动发布文生图开放模型 SDXL-Lightning,通过渐进式对抗蒸馏的技术,实现前所未有的生成速度,能够在2步或4步内生成极高质量和分辨率的图像,将生成速度加快十倍,是1024分辨率下速度最快的文生图模型,计算成本则降低为十分之一。
2月24日
谷歌Gemini生图功能紧急关闭
近期谷歌接连推出Gemini Pro 1.5等多个模型技术产品,然而,发布之后用户反馈 Gemini AI 图像生成存在偏见问题,如拒绝图像中描绘白人、生成违背事实图片等。最终,谷歌称暂停Gemini人物图像生成功能,并宣布正在开发改进版本。
普林斯顿大学 AI 团队提前300毫秒预测聚变中等离子体“撕裂”
英国《Nature》(自然)杂志发表一项研究,普林斯顿大学和普林斯顿等离子体物理实验室研究核聚变能的科学家利用多模态动态模型以及 AI控制器方法,通过在圣地亚哥的 DIII-D 国家聚变设施进行实验,发现 AI 提前 300 毫秒预测潜在的等离子体撕裂,将潜在不稳定性实时检测并阻止其发生。
2月25日
英伟达成立专攻具身智能的AI实验室
英伟达高级科学家Jim Fan宣布,将在英伟达内部组建一个新研究小组 GEAR,专攻通用具身智能体研究。他们相信未来机器人和模拟智能体将像iPhone一样无处不在。
OpenAI、英伟达、贝索斯向人形机器人公司Figure AI投资6.7亿美元
2月26日彭博社称,亚马逊创始人贝索斯、英伟达、微软和OpenAI日前投资了基于 AI 的人形机器人初创公司 Figure AI,总额约为6.75亿美元,投前估值达到约20亿美元。
2月26日
谷歌DeepMind推出基础世界模型Genie
谷歌DeepMind 2月26日宣布推出110亿参数的首个基础世界模型Genie,这是第一个从未经监督训练的、由未标记的互联网视频生成的交互式环境的模型,可生成通过文本、合成图像、照片,甚至草图描述的无限多种可控行动的虚拟世界。
高通推出全球首个PC运行的音频推理多模态大模型
MWC 2024首日,高通推出终端侧AI模型,包括全球首个在Windows PC上运行的音频推理多模态大模型演示,它能理解音频并进行推理、可实现语音输入的多轮对话。
英伟达发布最便宜GPU芯片,AI性能提高1400%
AI 芯片巨头英伟达(NVIDIA)宣布推出全新NVIDIA RTX 500 和 1000 Ada一代消费级GPU(图形处理器)加速芯片,全面支持在轻薄笔记本电脑等移动设备中运行生成式AI(AIGC)软件。
Mistral Al推出Mistral Large大模型,微软宣布与其合作
法国AI 独角兽Mistral Al宣布推出Mistral Large大模型,并宣称在基准测试中以81.2%超越了谷歌Gemini Pro、GPT-3.5、Meta Llama 2-70B三款模型。与此同时,大模型发布当天,微软还宣布与Mistral Al达成合作关系。
2月27日
Meta公布10亿以下小模型MobileLLM
图灵奖得主Yann LeCun宣布,Meta公布一项最新研究论文,推出1.25亿/3.5亿参数规模的移动设备应用预训练模型MobileLLM,性能达到 SoTA,特别是在聊天/ API 调用方面表现出色。LeCun称这是Meta为移动设备领域做的巨大贡献。
Mistral Al新模型对标GPT-4,不开源且与微软合作
法国 AI 公司Mistral AI发布旗舰大模型 Mistral Large,性能更强、体量更大,直接对标 OpenAI的GPT-4,并且公司宣布与微软进行深度合作。有消息称,微软向Mistral AI投资了1500万欧元。
AI搜索公司Glean融资2亿美元
2月27日消息,美国AI初创企业Glean在最新一轮融资中筹集2亿美元。此次融资由Kleiner Perkins和光速创投共同领投,投后估值达到22亿美元。
Glean成立于2019年,创始人Arvind Jain此前是Google搜索工程师。创立之初,Glean聚焦企业级知识搜索与知识管理,在众多企业SaaS应用的基础之上搭建Glean平台,以实现企业内部的跨应用搜索。2023年,Glean加载了大语言模型,上线Glean Assistant功能,提供语义理解、文本归纳等能力。
Glean只为企业客户提供服务,目前已积累超过200家企业客户,包括Databricks、Niantic、T-Mobile等。
2月28日
苹果放弃造车,转向生成式AI技术
据彭博报道,苹果首席运营官(COO)Jeff Williams和负责该项目的副总Kevin Lynch在内部宣布,将取消电动汽车项目,该“特殊项目组”( SPG)团队中的许多员工将转岗到苹果机器学习和AI战略副总John Giannandrea 领导的AI部门,涉及将近2000名员工,苹果将专注于生成式AI项目。
字节跳动正秘密研发多模态数字人等多个AI产品
2月28日有消息指,字节跳动正在AI大模型领域秘密研发多个产品,其中包括多模态数字人产品以及AI生图、AI生视频产品等,目前demo反馈良好。另外,字节跳动旗下剪映也在秘密研发AI产品,暂未上线。
阿里推出音频驱动的肖像视频生成框架EMO
近日,阿里巴巴集团推出了一项名为EMO的新项目,这是一个音频驱动的肖像视频生成框架,旨在生成具有表情丰富的面部表情和各种头部姿势的声音化身视频。
2月29日
AlphaFold 预测细菌生存所需的1402种蛋白互作
有消息称,西班牙巴塞罗那自治大学研究人员日前使用人工智能工具 AlphaFold,预测并模拟了细菌中必需蛋白质之间的1402 种相互作用,并绘制完整相互作用图谱,从而为开发新的抗生素提供潜在靶点。
Meta计划今年 7 月推出开源模型Llama 3
据The information报道,Meta公司计划在今年7月推出开源大模型Llama 3系列。此前Meta公司CEO扎克伯格称,Llama 3训练中要囤积35万块H100 GPU显卡。