分享好友 最新动态首页 最新动态分类 切换频道
互联网新时代要到来了(三)什么是ChatGPT?
2024-12-26 08:38

什么是ChatGPT?

互联网新时代要到来了(三)什么是ChatGPT?

tips:资料来自百度百科、openAi、CSDN博主「琦在江湖飘」、Info写作社区、CSDN博主「夕小瑶」等网页资料。

ChatGPT本质是一个应用在对话场景的语言模型,基于GPT3.5通过人类反馈的强化学习微调而来,能够回答后续问题、承认错误、质疑不正确的前提以及拒绝不适当的请求。
我们可以让今天的主角ChatGPT来亲自介绍自己。

不过,目前ChatGPT未对中国大陆开放,注册需要境外手机号或是使用VPN等途径,非常不方便。

核心技术

2.1语言模型
语言模型通俗讲是判断这句话是否通顺、正确。数学函数表达为给定前N个词,预测第N+1 个词概率,将概率序列分解成条件概率乘积的形式,这个函数就可以实现语言模型去生成句子。那么是什么样的语言模型如此强大

ELMo非常明显的缺点在特征抽取器LSTM结构带来的,17年Google在机器翻译Transformer取得了效果的突破,NLP各种任务开始验证Transformer特征提取的能力比LSTM强很多。自此NLP开启了Transformer时代。

2018年OpenAI采用Transformer Decoder结构在大规模语料上训练 GPT1模型横扫了各项NLP任务,自此迈入大规模预训练时代NLP任务标准的预训练+微调范式。由于GPT采用Decoder的单向结构天然缺陷是无法感知上下文,Google很快提出了Encoder结构的Bert模型可以感知上下文效果上也明显有提升。随后2019年OpenAI提出了GPT2,GPT2拥有和GPT1一样的模型结构,但得益于更高的数据质量和更大的数据规模有了惊人的生成能力。同年Google采用了Encoder-Decoder结构,提出了T5模型。从此大规模预训练语言模型兵分三路,开始了一系列延续的工作。

2020年OpenAI提出GPT3将GPT模型提升到全新的高度,其训练参数达到了1750亿,自此超大模型时代开启。技术路线上摒弃了之前预训练+微调的范式,通过输入自然语言当作指示生成答案,开始了NLP任务新的范式预训练+提示学习。由于GPT3可以产生通顺的句子但是准确性等问题一直存在,出现WebGPT、InstructGPT、ChatGPT等后续优化的工作,实现了模型可以理解人类指令的含义,会甄别高水准答案,质疑错误问题和拒绝不适当的请求。

2.2深度学习
深度强化学习(deep reinforcement learning,DRL)是强化学习一个分支,基于深度学习强大的感知能力来处理复杂的、高维的环境特征,并结合强化学习的思想与环境进行交互,完成决策过程。DRL在游戏场景这种封闭、静态和确定性环境可以达到甚至超越人类的决策水平。比较著名的事件是2017年DeepMind 根据深度学习和策略搜索的 AlphaGo 击败了围棋世界冠军李世石。2018 年OpenAI 团队基于多智能体 DRL推出的OpenAI Five 在Dota2游戏中击败了人类玩家。DRL算法主要分为以下两类

值函数算法:值函数算法通过迭代更新值函数来间接得到智能体的策略,智能体的最优策略通过最优值函数得到。基于值函数的 DRL 算法采用深度神经网络对值函数或者动作值函数进行近似,通过时间差分学习或者 Q 学习的方式分别对值函数或者动作值函数进行更新。代表性的是2015 年 DeepMind 团队提出深度Q网络(DQN,及其后的各种变种DDQN、Dueling DQN、分布式DQN等。

策略梯度算法:策略梯度算法直接采用函数近似的方法建立策略网络,通过策略网络选取动作得到奖励值,并沿梯度方向对策略网络参数进行优化,得到优化的策略最大化奖励值。可以用来处理连续动作。在实际应用中流行的做法是将值函数算法和策略梯度算法结合得到的执行器‒评价器(AC)结构。代表性工作有策略梯度算法、AC 算法以及各种变种DDPG、A3C、PPO等。ChatGPT使用的就是策略梯度算法PPO。

技术原理

ChatGPT整体技术方案是基于 GPT-3.5 大规模语言模型通过人工反馈强化学习来微调模型,让模型一方面学习人的指令,另一方面学习回答的好不好。

ChatGPT在对话场景核心提升了以下三方面

1)更好的理解用户的提问,提升模型和人类意图的一致性,同时具备连续多轮对话能力。
2)大幅提升结果的准确性,主要表现在回答的更加的全面,同时可以承认错误、发现无法回答的问题。
3)具备识别非法和偏见的机制,针对不合理提问提示并拒绝回答。

ChatGPT的提升主要涉及以下三方面技术

1)性能强大的预训练语言模型GPT3.5,使得模型具备了博学的基础。
2)webGPT等工作验证了监督学习信号可大幅提升模型准确性。
3)InstructGPT等工作引入强化学习验证了对齐模型和用户意图的能力。

ChatGPT的训练过程分为微调GPT3.5模型、训练回报模型、强化学习来增强微调模型三步

第二步:训练回报模型。第一步微调的模型显然不够好,至少他不知道自己答的好不好,这一步通过人工标注数据训练一个回报模型,让回报模型来帮助评估回答的好不好。具体做法是采样用户提交的prompt,先通过第一步微调的模型生成n个不同的答案,比如A、B、C、D。接下来人工对A、B、C、D按照相关性、有害性等标准标准并进行综合打分。有了这个人工标准数据,采取pair-wise 损失函数来训练回报模型RM。这一步实现了模型判别答案的好坏。

第三步:强化学习来增强微调模型。使用第一步微调GPT3.5模型初始化PPO模型,采样一批和前面用户提交prompt不同的集合,使用PPO模型生成答案,使用第二步回报模型对答案打分。通过产生的策略梯度去更新PPO模型。这一步利用强化学习来鼓励PPO模型生成更符合RM模型判别高质量的答案。

通过第二和第三步的迭代训练并相互促进,使得PPO模型能力越来越强。

具体详见CSDN博主「琦在江湖飘」文章

ChatGPT的实际应用

ChatGPT可以应用于多种领域,主要应用场景如下

问答系统:ChatGPT 可以通过对询问进行理解和生成简明易懂的回答。

聊天机器人:ChatGPT 可以用于构建人机对话系统,以帮助用户解决其问题并回答其问题。

文本生成:ChatGPT 可以用于生成文本,例如新闻文章、诗歌、小说等。

接入 chatGPT 你的程序能做的 49 件事情
当你开通 chatGPT 之后,你的程序就可以通过接口完成以下基本的 49 件事情了;我给大家都批注好了,那一项不明白的就评论区交流;下面每一项勇哥都熬夜晚过了,非常 NICE。

  1. ChatGPT进入百度“弱智吧”后,疯了。
    https://mp.weixin.qq.com/s/BE1TkqY8CY99jQuAToW-FQ

不得不说,“弱智吧”的一些经典提问,真的会把ChatGPT搞到崩溃。。。这一点上,我觉得还是人类更胜一筹。

  1. ChatGPT惊人语录大赏
    https://mp.weixin.qq.com/s/csyCHucLtUQAsT8QRS5AUw

这里是一些关于ChatGPT的经典语录大赏,真的是看了之后毁三观。

甚至还有网友让ChatGPT扮演猫娘,笔者看了聊天记录之后直接吐血。。

可以说,ChatGPT好不好玩,纯看你的脑洞大不大。。。

  1. 谷歌要完,百度也危了
    https://mp.weixin.qq.com/s/qVt89FS_wzfu6-ShiWTv_Q

最后是把ChatGPT当成一个搜索引擎来用,你会发现非常惊喜。。这究竟会不会成为一个颠覆谷歌、百度的新型搜索引擎形态,谁也不好说。但至少目前来看,潜力非常大。

5.1慢的问题
chatGPT 火遍全球,涌入了大量的访问者,那么这就是 chatGPT 慢的原因吗?其实不然,试想 chatGPT 背后那么多大佬,不缺服务器,但为什么依旧接近不了慢、网络错误等问题呢?AI 算力是核心关键,如下图大量用户访问 chatGPT,chatGPT 要并发的从海量数据模型中去计算用户请求的真实目的,并给出正确结果。这需要非常庞大的算力,而这个正是卡主 chatGPT 脖子的事情.

5.2错的问题
网上也有一大堆网友在调侃 chatGPT 的错误,其实这是真实存在的,如下图评价歌曲明显是回答有偏差了。那么这说明 chatGPT 还有努力的空间,同时也方向证明了,大佬都解决不了的问题,它本身就具有很高的复杂性。

最新文章
2025年家用投影仪选购指南:2025家用4K投影仪销量排行榜
快要过年了,很多人会想着趁着年底或者新年活动的时候买投影,但是普通人买投影看参数只会觉得头疼,到底如何挑选投影仪?今天就给大家分享一下2025家用4K投影仪销量排行榜,大家可以看一看哪些投影买的人比较多,也可以给自家买投影的时候
2024揭阳惠来艺体生文化课怎么样?>top5怎么样?排名一览
2024揭阳惠来艺体生文化课怎么样?top5怎么样?排名一览  2. 揭阳惠来高三复读辅导班  3. 揭阳惠来立行高考复读冲刺班  4. 揭阳惠来立行高中复读集训班
flink规则引擎设计思路
在日常工作中我们经常收到一些诸如此类需求:“用户给点击了开屏广告,给用户下发私信”、“用户进入了推荐线,但在60秒内没有任何点击操作,弹框引导用户选择感兴趣的内容”、“用户点赞了某位作者的两篇以上的内
AI生成美女写真:如何用简单AI工具创造视觉奇迹?
在这个充满创意与科技的时代,想象一下,有没有那么一天,你只需轻轻一点,就能生成一张让人赞叹的美女写真?是的,这并非梦境,AI技术的飞速发展使得这一切变得触手可及。越来越多的人开始关注AI绘画工具,用它们创造出超逼真的美女摄影作
LE浏览器 11.0.13 官方版
LE浏览器软件功能 1.极速上网,畅享淋漓体验。2.永久标签,不再隐藏,可永久固定。3.标签页无限制,可开启任意数量的网页。4.自定义收藏夹,方便你的网上冲浪生活。5.保存网页,让网页永久保留在你的电脑上6.地址栏直接搜索,可以免去到搜
IETester设计_今日ietester使用方法设计教程
摘要:IETester设计,今日ietester使用方法设计教程,新片场素材小编尤诺彤IETester设计,今日ietester使用方法设计教程相关内容整理,如果您对IETester设计,今日ietester使用方法设计教程感兴趣欢迎访问免费阅读。IETester设计,今日ietester
2025年百度SEM开户代运营全攻略:助力企业高效营销
随着互联网的快速发展,搜索引擎营销(SEM)已成为企业获取流量、提升品牌知名度的重要途径。百度作为中国最大的搜索引擎平台,其SEM服务更是备受企业青睐。然而,对于许多企业来说,百度SEM开户及后续运营可能是一个相对陌生且复杂的领域
360公布搜狗收集用户密码证据 搜狗称对手抹黑
  360 公司今天下午召开媒体发布会,公布搜狗收集用户隐私信息并泄漏的相关资料,称此次由于搜狗泄密而导致了重大安全事故。不过,搜狗方面向新浪科技发来的声明坚称,搜狗浏览器无问题,这次漏洞事件完全是 360 精心策划、幕后操纵的行
AIGC“重塑”影视制作产业 快手可灵AI用户超600万 探索多元变现模式
  AI制作电影、AI生成品牌广告、AI再现百年前奥运往事……如今,AIGC已被广泛应用在各行各业,迈入规模化应用期。  12月12日,在“2024AIGC视觉应用论坛”上,快手副总裁、大模型团队负责人张迪表示,可灵AI将于近期推出全新的1.6版本
12月第2周海沧人气楼盘榜单发布!这些楼盘拥有独特卖点,让你眼前一亮!
12月第2周(12.9-12.15)海沧新房热搜榜出炉!此次楼盘排名数据根据房天下用户浏览及关注度综合计算产生。房天下研究院数据显示,12月第2周(12.9-12.15)海沧楼盘中,位于海沧区05-11新市区南片区东屿北路与沧凤路交叉口南侧的东屿北路与
相关文章
推荐文章
发表评论
0评