分享好友 最新动态首页 最新动态分类 切换频道
为什么大模型在企业落地难?(LLM技术挑战和解决篇)
2024-12-27 10:26

0、前言

为什么大模型在企业落地难?(LLM技术挑战和解决篇)

AI是下一代颠覆性的机会,已经是很多人的共识。尤其是在媒体的大力宣传下,大模型显得格外火热,但为什么已经到2024年了,在企业落地应用上颇有“雷声大,雨点小”的态势呢

前排提示,文末有大模型AGI-CSDN独家资料包哦

落地遇到的挑战是什么?希望尝试从3个不同的角度来讨论

1)大模型技术本身的挑战(本文

2)企业认知和自身工作流成熟度的挑战

3)负责企业落地的算法产研团队挑战

最容易想到和有共识的,是大模型本身技术还不成熟的问题,因此本篇先聊聊此方面的挑战,和当下的解决方案。

首先我们从企业落地的角度来看看,大模型和之前的AI有什么区别,能让大家看到“未来的希望”。

相对之前AI 1.0时代,大模型最大的变化是之前不论做什么,都需要花人力先整“特定场景”的数据,再训个“定制模型”。而大模型写写prompt,就能出结果,有些场景甚至也还不错

先不论这个结果能不能满足所有企业级要求,但它一下子就越过了之前的前置流程,要知道之前很多场景,都是被卡在前置数据和训模型的环节上了。这也是大模型一度颇有“百花齐放”的原因,毕竟尝鲜的门槛降低了,很多场景从“原本想都不敢想”到“都能低成本、短周期 试试”。

然而大模型也不是万能的,以大语音模型LLM为例,通用的大语言模型技术直接落地企业实际业务需求,有以下问题

  • 幻觉问题 大模型的原理是“文字接龙”,也就是基于数学概率预测后面要输出的文字,这导致了大模型输出结果存在幻觉的问题。

  • 知识过期 大模型本身训练的数据是静态的,当前主流的大模型(比如 ChatGPT、通义千问、文心一言…)的训练集基本都是抓取网络公开数据,所以大模型所掌握的知识存在截止日期,也不具备实时性的、非公开的知识。

  • 安全性 企业都不愿意泄露自己的私域数据,因此很难同意传给别人训练。

  • 对话长度限制 如果给大模型的内容过多,超过或接近限制,就会失败或容易“漏指令”。

  • 可解释性:大模型输入输出充满了不确定性,缺乏可解释性、黑盒问题。(以前AI 1.0时代好歹是有一个目标清晰的限定场景,自己知道自己用的什么数据,什么方式训得,或者训练数据量和模型参数量都小。但大模型动不动就是百亿千亿为单位的训练量和参数量,而且企业通常都是调用的第三方大模型厂商的API,甚至是闭源的大模型

  • 灵活性 大模型一旦训练完成,再调整的周期和成本就是很高的。

之前的文章已经提到了企业落地时几种主流方案,这里罗列比较全的4种方案

1prompt:仅靠提示词对通用LLM下达指令

2RAG 通用LLM结合RAG,本文常简写成RAG

3微调 基于开源LLM,用SFT等方法微调一个大模型

4从头训练 用海量企业私有数据,从头训练一个适配企业行业或场景的大模型

这里给出一个不严谨的结论,仅为了能从整体上有个大概的感知

效果:从头训练>微调>RAG>prompt

成本:从头训练>微调>=RAG>prompt

训练/搭建周期:从头训练>RAG >=微调>prompt

推理响应耗时:RAG >从头训练>微调>=prompt

(要提醒的是:由于过于简化,细化到具体的场景,可能有不一样的结论,尤其是RAG可以由简单拓展成复杂的架构,以及几种方案往往是逐渐叠加使用,不是孤立的

由于从头训练一个大模型不是一般企业能吃得消的(钱、卡、人才、数据都是挑战),所以企业落地方案一般讨论的是:prompt、RAG和微调。

RAG和微调有一定理解门槛,之前几篇文章专门讲过,详见RAG(附链接)和微调(附链接,这里不再赘述。而prompt理解门槛不高(当然想写好也不容易,因此我总结了一张对比表,可以系统比对,不再展开prompt。

区别比对表


Prompt

RAG

微调 Fine-tuning

类比

在模型的考卷上,框定/提炼得分要点。

为模型额外提供教科书,允许它开卷考,随时翻书

正式开考前,让模型上专项冲刺班,提供和正式考卷差不多题型的模拟试卷和标准答案,消化巩固和提高。

优势/

适合

快速

希望快速出效果用于测试和验证

简单

不需要复杂特定的上下文背景知识的任务

低成本

当前资源预算有限,也没有人力大规模标注或训练。

动态知识

预期的回答需要基于频繁更新的,不断变化的信息

相比于微调,不需要繁重训练周期,即时获取新信息


对幻觉消除有一定要求

可以结合多个信息源和文档生成答案的复杂查询;有助于减少语言模型产生的错误或虚构信息


可以溯源

生成答案时引用外部信息源,增加可信度和可追溯性。


特定领域

需要的知识是来自私域专属积累的知识库。

定制任务

特定风格/要求的任务,需模型内化的有较复杂的上下文背景知识的任务

有训练数据

企业有大量的、能反映该任务特征的、可用于训练的私有标注数据

需长期

需长期使用,保持较持久性能的场景

劣势

效果不稳定

仅凭提示词指令,不一定能每次、全部都生效,难以精准控制,保持效果一致性


复杂任务效果不佳

复杂和特定任务很难仅通过提示词实现全要求精准控制


私有知识效果不佳

提示词控制效果上限依赖通用大模型训练数据及通用能力,很难覆盖企业私有知识



响应时间较长

检索和生成的双重过程会导致较长的响应时间,不适合对时效性要求很高的应用


复杂性高

若对性能、准确性要求较高,本身外挂的数据量还大的话,需维护一个高效的检索系统和生成模型,而且系统的架构将越来越复杂。


高依赖数据质量

生成结果的质量高度依赖数据文档的质量。



成本较高:

微调需大量的计算资源和较多的时间周期


高依赖数据质量

需构建大量高质量的有标注的数据,数据准备、验收、筛选处理过程可能会消耗大量人力和沟通精力


不灵活

一旦微调完成,若任务更新或需求发生变化,模型就很难变通。所以不适合频繁调整的需求场景。


可解释性低

黑箱,模型回复badcase,难定位原因,难解决,难给业务解释

首先声明一点:除非是从上到下发起的AI战略要求,否则企业落地时,并不看中背后是什么模型,什么技术,看中的只是能不能用最有性价比的方式,解决实际场景的问题。黑猫白猫,只要能抓到老鼠的就是好猫。有些场景,用的还是AI1.0时代的模型方案,而不是非得大模型方案。甚至有时,人为制定的规则、脚本代码的稳定性更高,根本不需要全部用AI,所以最后往往是各方综合的方案,这要是展开来说,可能过于零碎和定制化。

因此本小节只讨论,LLM大模型在企业内落地时,推荐可以尝试的路径,来帮助企业更有效,更经济,更快捷的评估及使用。另外,以上提到的prompt、RAG和微调几种方式,往往是逐渐叠加使用,并不是相互冲突的。

要考虑的因素也非常的多,包括:模型能力、训练和推理成本、数据成本、时效性要求等。

下图来自Meta官网于24年8月给出的建议,极具参考意义

需魔法:https://ai.meta.com/blog/adapting-large-language-models-llms/

翻译一下其推荐的路径

prompt ->进阶prompt(添加示例)->简单RAG ->简单微调 ->进阶RAG+微调->>从头训(预训练…

读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用

对于0基础小白入门

如果你是零基础小白,想快速入门大模型是可以考虑的。

一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。

包括:大模型学习线路汇总、学习阶段,大模型实战案例,大模型学习视频,人工智能、机器学习、大模型书籍PDF。带你从零基础系统性的学好大模型

👉AI大模型学习路线汇总👈

第二阶段 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用

第三阶段 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统

第四阶段 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统

第五阶段 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型

第六阶段 以SD多模态大模型为主,搭建了文生图小程序案例

第七阶段 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

👉大模型实战案例👈

光学理论是没用的,要学会跟着一起做,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。

👉大模型视频和PDF合集👈
👉学会后的收获👈

• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等,通过这门课可获得不同能力

• 能够利用大模型解决相关实际项目需求 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求

• 基于大模型和企业数据AI应用开发实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

👉获取方式
最新文章
让ai智能写个拍摄脚本的软件:推荐列表与盘点指南
随着数字媒体时代的到来,影视创作逐渐迈向高效与智能化。人工智能()在影视制作领域的应用日益广泛其是自动生成拍摄脚本的软件,成为了多创作者的得力助手。本文将为您盘点一系列免费且好用的脚本编写工具,帮助您轻松打造具有创意的拍摄
用AI生成美女写真,轻松打造你的个性化形象!
在这个科学技术飞速发展的时代,AI生成图像的能力已经颠覆了传统的图像创作方式。家人们,有没有想过通过人工智能生成一张属于自己的逼真美女写真?不再需要专业的摄影师或复杂的后期制作,这一切都可以通过一些简单的工具轻松完成。本篇文
百度推广的几种方式
百度推广的几种方式主要包括:搜索推广、信息流推广和品牌广告推广。搜索推广通过关键词竞价和优化,使企业网站或产品信息在搜索结果中排名靠前,提高曝光率和点击率。信息流推广则是在百度平台上展示广告,根据用户行为和兴趣进行精准推送
美团外卖启动“恶意差评治理专项行动”:引入 AI 识别关键词,未来将预警风险用户
12 月 12 日消息,据美团外卖官方 12 月 10 日消息,美团外卖多部门近期联合行动,成立“恶意差评治理专项组”,从差评的识别、判责、申诉、预警等多个环节入手,搭建更透明高效的差评处理机制,帮助商家将精力更好地投入到线上经营本身,
贝加莱B&R触摸屏4PP065.0571-P74
贝加莱BR触摸屏4PP065.0571-P74,上海韦米机电设备有限公司主营供应产品,产品图片实物拍摄,原厂原装,质保一年,大量产品现货供应,价格优惠快速报价,联系人:雷青。欢迎咨询采购!贝加莱BR触摸屏物料号:4PP065.0571-P74描述:电源面板PP
草莓ios:草莓风味盛宴:探索无尽的美味与创意搭配
  草莓作为一种受欢迎的水果,其鲜艳的色彩和甜美的味道常常给人带来愉悦感。将这种元素融入到手机iOS主题中,不仅能够提升用户体验,还能让手机更加个性化。草莓iOS主题以生动活泼、清新的设计风格,深得年轻人的喜爱。  对于那些希望
全网营销新风向,SEO代理助力企业市场拓展策略揭秘
随着互联网营销的快速发展,SEO全网营销成为企业拓展市场的关键。本文揭秘全网营销新趋势,借助SEO全网营销代理,帮助企业高效提升品牌影响力,拓展更广阔的市场空间。随着互联网的飞速发展,企业对于网络营销的需求日益增长,在这个的时代
【U8680豌豆荚下载】华为U8680豌豆荚8.2.5.1免费下载
豌豆荚拥有超过 200 万个最全的安卓应用和安卓游戏免费下载资源,六年为全国 4 亿人提供全面的手机内容服务。四个的原因:1. 从全网 29 家应用商店收录了超 200 万的应用和游戏。全网最全面的应用库,随便来折腾。2. 每一个应用游戏都经过
【Y516(移动3G)WiFi万能钥匙下载】华为Y516 移动3GWiFi万能钥匙5.1.02免费下载
下载WiFi万能钥匙,认准官方正版!免费安全WiFi热点,无忧一键连接。日常任务随时做,轻松赚现金外快~【积分赚钱】完成简单日常任务,轻轻松松赚现金【安全免费】随时随地免费连接,畅享安全免费WiFi,节省流量快人一步!【权威认证】通过
定义中国AI投资新坐标!全市场首只创业板人工智能ETF今日开创上市
中国AI产业最新权威统计数据来了!据中国互联网络信息中心最新发布的《生成式人工智能应用发展报告(2024)》统计,截至2024年6月末,我国生成式AI产品用户规模已达2.3亿人;截至目前,我国共有309个生成式AI产品完成备案,我国AI核心产业
相关文章
推荐文章
发表评论
0评