分享好友 最新动态首页 最新动态分类 切换频道
小型语言模型:AI领域的新热点
2024-12-29 01:39

小型语言模型在简单的专业领域可能更有优势。 图片来源:视觉中国

小型语言模型:AI领域的新热点

多年来,谷歌等科技巨头和OpenAI等初创公司,一直在不遗余力地利用海量在线数据,打造更大、更昂贵的人工智能(AI)模型。这些大型语言模型(LLM)被广泛应用于ChatGPT等聊天机器人中,帮助用户处理各种各样的任务,从编写代码、规划行程,到创作诗歌等。

自ChatGPT面世以来,AI模型便在变大、变强之路上“狂奔”。但喧嚣过后,科技公司也越来越关注更小、更精简的小型语言模型(SLM)。他们认为,这些小巧玲珑的模型不仅“术业有专攻”,而且部署成本更低廉、更节能。

未来,这些规模不一的AI模型将协同工作,成为人类的左膀右臂。

小型模型独具优势

随着AI技术突飞猛进,AI模型的“块头”与日俱增。ChatGPT的缔造者OpenAI去年夸耀称,其GPT-4模型拥有约2万亿个参数。参数表示AI模型的大小,一般参数越多,AI模型的能力越强,庞大的参数量使GPT-4成为迄今最强大的AI模型之一,能回答从天体物理学到动物学等多领域包罗万象的问题。

但是,如果某家公司只想借助AI模型解决特定领域(如医学)的问题,或者一家广告公司只需一款AI模型来分析消费者行为,以便他们更精准地推送广告,GPT-4这类模型就有点“大材小用”了,SLM反而更能满足用户们的要求。

美国《福布斯》双周刊网站在11月的报道中,将SLM称为AI领域的“下一个大事件”。

微软公司生成式AI副总裁塞巴斯蒂安·布贝克表示,虽然SLM的参数量目前并没有统一标准,但大约在3亿到40亿个之间,小巧到可以安装在智能手机上。

专家声称,SLM更胜任简单的任务,如总结和索引文档、搜索内部数据库等。

法国初创公司LightOn的负责人劳伦特·都德认为,与LLM相比,SLM拥有诸多优势:首先,这些模型的反应速度更快,能同时响应更多查询,回复更多用户;其次,SLM部署成本更低,能源消耗也更少。

都德解释道,目前很多LLM需要大量服务器来进行训练,然后处理查询。这些服务器由尖端芯片组成,需要大量电力来运行,并进行冷却。而训练SLM所需芯片更少,运行耗费的能源也更少,这使其更便宜、更节能。

SLM还可直接安装在设备上,在不依赖数据中心的情况下运行,这能进一步确保数据的安全性。《福布斯》表示,SLM能以最少的计算资源执行各种任务,使其成为移动设备、边缘设备等的理想选择。

AI模型掀起“极简风”

谷歌、微软、元宇宙平台公司以及OpenAI等公司闻风而动,推出了各种SLM。

去年12月底,微软公司正式发布了只有27亿个参数的语言模型Phi-2。微软研究院在其X平台官方账号上表示,Phi-2的性能优于现有其他SLM,且能在笔记本电脑或移动设备上运行。今年4月,微软又推出了只有38亿个参数的Phi-3系列模型。

今年8月,微软公司再接再厉,推出了最新的Phi-3.5-mini-instruct。这款SLM为高效、先进的自然语言处理任务量身打造。9月,英伟达公司开源了Nemotron-Mini-4B-Instruct。该公司表示,这款SLM特别适合边缘计算和设备端的应用。报道称,这两款SLM在计算资源使用和功能表现之间实现了良好平衡。在某些方面,其性能甚至可媲美LLM。

OpenAI也不甘示弱。今年7月,OpenAI公司发布了GPT-4o mini,称其是该公司最智能和最实惠的SLM。

此外,亚马逊公司还允许在其云平台上使用各种规模的AI模型。

其他公司也纷纷开发更适合自身需求的SLM。例如,美国制药巨头默克公司正与波士顿咨询集团(BCG)合作开发一款SLM,旨在探究某些疾病对基因的影响。这将是一款参数介于几亿到几十亿之间的AI模型。

大小模型作用互补

虽然SLM在效率等方面具有独特优势,但LLM在解决复杂问题、提供更广泛的数据访问方面仍然具有极大优势。

展望未来,LLM和SLM两种模型将“是朋友而非对手”,它们之间的协作交流将成为主流趋势。

当遇到用户提出的某个问题时,一款SLM会“一马当先”,理解这个问题,再根据问题的复杂性,将相关信息发送给几个大小不一的AI模型。这些模型“群策群力”“并肩携手”为用户解决难题。

最新文章
网购“仅退款”的背后,商家与和消费者的天平如何平衡?
“同学和我说,线上购物可以‘仅退款’,这样买东西不用花钱。”当五年级的儿子说出这话的那晚,在电商行业摸爬滚打十余年的商家尤彦盈正深受电商平台“仅退款”规则的困扰,彻夜难眠。儿子的话让她感到震惊,“小学生之间说出这样的话,说
【新手答疑】新人该如何做好SEO
刚进SEO这个圈子的新人,大多数都还没有找到方向,也不知道怎么去优化才会更好,掌握不到方法,俗话说万事开头难,但是呢掌握好了基本方法也是很重要的,开元SEO小编在这里告诉你们新人应该如何做好SEO。成都创新互联是一家集网站建设,梁园
百度推广区域没有访客进来网站和排名都没问题这是什么个情况
问题分析1. 地域定向设置问题  检查百度推广的地域定向设置是否准确。如果设置过于狭窄,可能无法覆盖到目标受众的搜索区域。此时,需要重新审视并调整地域定向设置。2. 竞品或相关关键词排名干扰  尽管自身网站排名良好,但竞争对手或
直播运营岗位的职责与工作内容究竟包含哪些?
解析直播运营岗位的职责与工作内容策划 制定直播主题 设计互动环节 创新内容形式2、主播培养与管理 提供培训提升技巧3、用户互动与维护 引导话题与互动 回答用户问题 通过私信社区沟通4、数据分析 分析观看人数和互动量5、营销推广 制定推
Open AI回应马斯克提起的诉讼强调:马斯克希望Open AI追求盈利!
特斯拉首席执行官(CEO)埃隆•马斯克提起诉讼,要求暂停Chat GPT开发商Open AI转换为盈利法人,Open AI展开了反击。Open AI 13日(当地时间)在博客上发表题为《马斯克希望Open AI追求营利》的文章主张:“马斯克2017年提议将Open AI转换
【PRO 7(标准版/全网通)微信下载】魅族PRO7微信8.0.53免费下载
微信是一款手机通信软件,支持通过手机网络发送语音短信、视频、图片和文字,微信可以单聊及群聊,还能根据地理位置找到附近的人,带给朋友们全新的移动沟通体验。支持ios、Android、塞班等多种平台手机。ZOL提供微信官方下载,不只是个聊
抖店代运营收费明细,代运营价格参考 2024技术攻略!超好用)
1986年04月11日私域社交电商服务,微信小程序开发,微信分销系统,网站建设,全网营销,特殊类目报白,抖音财经金融直播权限,抖音黄v认证,白名单,抖音直播间,运营,小店入驻,账号运营等全互联网业务,短视频全系业务,抖音小店开通,抖音小店代运营
看广告撸包赚钱小游戏app开发
在移动互联网高速发展的今天,手机游戏已经成为人们日常娱乐的重要方式之一。随着用户对游戏体验和盈利模式的不断探索,一种新兴的游戏类型——“看广告撸包赚钱小游戏APP”应运而生,它结合了休闲娱乐与广告收益,为用户提供了一种全新的
用AI生成超逼真美女写真,搜狐简单AI带你一键体验!
访问搜狐简单AI小程序:首先,你需要在微信中搜索“搜狐简单AI”,点击进入小程序,无需下载,方便快捷。选择生成模式:在首页中,选择“美女写真”选项,进入生成界面。这里会给你提供一些漂亮模特的模板,供你挑选。自定义设置:根据自己
pptPainter网课手写助手 4.5 官方版
pptPainter4.5版更新支持打开pdf文档,并持续优化手写、绘图的流畅性pptPainter网课手写助手能够支持打开本地图片,支持从剪贴板打开图片。pptPainter网课手写助手功能特点 一、pptPainter可播放ppt/pptx演示文稿文件,支持打开本地图片,
相关文章
推荐文章
发表评论
0评