前言:前三讲分别介绍了搜索引擎的整体架构,如何进行召回和排序。这一讲重点介绍实际业务上我们重点关注的搜索引擎的业务效果评估指标和搜索引擎的业务辅助作用。
在第一讲的时候列举了大量的指标来综合评估电商搜索引擎效果的好坏,如下图介绍这么多是为了让大家对指标体系有一个全面完整的认识。
但实际在业务开展的时候,负责搜索引擎的部门背的核心KPI就是搜索引擎的CTR、CVR和PGMV这三个指标,上述其他指标更多是作为辅助指标来进行综合评估,并不会列为部门的KPI,其他指标在业务上反映的价值并没有那么重要和直观。
CTR分曝光、请求和Session三个维度口径。通过下图进行举例说明:
大家可以发现上图中请求维度 & 用户纬度的CTR极端情况下结果会大于100%。实际业务中CTR并不会超过100%,用户的点击次数都不会这么高,用户浏览几十个商品都不一定点击一次。电商平台曝光口径的CTR在5%左右。
- 曝光口径:曝光维度的CTR会有两个潜在的小问题,第一对于部分搜索无结果的请求,此时分子为0,分母也为0,因为没有任何结果展现也就不存在曝光;这种情况下就不能真实反映搜索引擎的实际效果。当然对于大型电商平台搜索无结果的请求占比很低;第二就是可能会出现一种极端情况,某一个搜索引擎搜索结果用户更感兴趣,用户浏览和点击的都更多,但是曝光维度下的CTR不一定更高。比如用户在搜索引擎A和B上分别搜索“手机”,搜索引擎A上是浏览5,点击1;搜索引擎B是浏览20,点击3。直观上肯定是用户对搜索引擎B返回的结果更感兴趣,但是A的CTR为20%,B的为15%,从CTR角度反而A的更高。
- 请求口径:请求维度可以很好地规避上述曝光维度存在的两个潜在小问题。第一种情况搜索无结果分子为0,分母还是1。第二种情况A和B的分母都是1,就看点击次数。请求维度相对更加客观地评估搜索引擎的效果;
- Session口径:Session维度指的是一段时间内用户的行为统计,用户从开始使用搜索框功能到最终退出不再使用,这一期间内发生的行为统计。比如用户在搜索框里连续搜索了手机”、“华为”和“苹果”,这样一系列搜索行为及最终的曝光点击,我们视为一个Session。Session口径下的CTR我们用的不多。
实际电商平台主要以曝光维度CTR + 请求维度CTR进行综合评估搜索引擎的线上用户点击的效果。
CVR的计算口径也分为:曝光、请求和点击三种;详情见下图:
- 业务部门:很多业务部门只关心最终的成交量,所以他们看CVR主要看的是曝光和请求口径的,他们不关心用户点击后的转化率是多少,业务部门只看最终目标,不关心中间目标;而曝光和请求口径下的CVR就是用户浏览了多少商品最终下单了多少商品;电商平台搜索引擎曝光口径的CVR一般都在千分之几;
- 算法部门:在算法侧,用户的下单要拆分为两步,第一步先是对商品产生兴趣发生点击;第二步是点击进入商详页后,用户基于商品详情页决定是否购买产生转化,这是两个独立的步骤。一般算法部门统计CVR时都是使用点击口径,电商平台搜索引擎点击口径的CVR在2%-5%之间。
CTR和CVR并不是完全正相关的,很多SKU的CTR很高,但是CVR很低,比如一些标题夸张主图奇特的商品,用户可能会被商品的标题和主图等吸引产生点击,但是最终是否下单用户还是会根据自己的实际需求进行综合考虑的。
对于那些刚起步做搜索引擎的平台,正常前期CTR的优化都会带来CVR同步的增长。但是在成熟的电商平台算法侧优化CVR模型时,一般是CVR提升,CTR会略有降低,甚至会降福较大。
我们上述介绍了CTR和CVR指标,但电商平台其实最关注的一个核心指标是GMV(Gross Merchandise Volume),商品交易总额。电商平台是卖货的,每到双11淘宝京东都会公布自己的成交额GMV是多少,从来不会公布自己的CTR和CVR是多少。所以在业务上我们最需要关注的一个指标就是GMV。正常算法侧看的GMV指标我们叫做PGMV,也分为单次曝光 or 请求 or Session带来的成交额。
用户A搜索了3次,浏览了20个商品,最终下单2000元。三种口径下的PGMV如下:
- 曝光口径:2000/ 20 = 100;
- 请求口径:2000/3 = 666.67;
- Session口径:2000;
PGMV指标和CVR指标之间的关系也不是完全正相关的,因为CVR的分子是订单,订单多的不一定订单金额大。转化一单茅台要比转化100单餐巾纸带来的GMV都要高。
当平台业务和搜索引擎都发展到很成熟时,CTR & CVR & PGMV三种业务最关心的指标很难同时兼顾,没办法做到CTR,CVR和PGMV全部大幅增长。这时候就需要业务决定以哪个指标为核心考核指标,正常是某项指标需要大幅增长,其他几个指标可以保持不变或者略有降低均可接受。
整个系列主要是在为大家介绍搜索引擎,这里面也穿插和大家介绍一下搜索 & 推荐场之间一些核心的目标和指标差异。
- 目标不同:推荐是以发掘用户兴趣为主,希望推荐的商品用户感兴趣可以留住用户,甚至推荐的商品还会有很多探索商品去探索用户的兴趣。而搜索不是,搜索是用户带着明确的需求来的,所以搜索结果列表页里面的商品需要符合用户的实际需求,返回最符合用户需求和消费习惯的商品,促进用户转化。推荐以吸引用户,兴趣引导为主。搜索以定位需求,促进转化为主。
- 指标不同:结合上述的目标不同,推荐场景主要是考核CTR,而搜索场景主要是考核CVR和PGMV。当然业务上需要看电商平台自己业务所处的阶段和内部的业务定位要求,实际还是以多个指标组合在一起综合评估。
用户的会在搜索场景上十分明确地表达自己的意图,比如近期用户大量搜索“泡泡玛特”说明最近用户对泡泡玛特的产品很感兴趣,基于用户明确的意图就可以在商品扩充和商品供应上做进一步下钻。
某段时间发现用户在平台上大量搜索A商品,然后平台监控到该商品在平台上并没有售卖。类似于A商品的还有很多B商品、C商品等等。尤其是还处在快速成长期的电商平台,不管是像京东这样自建供应链的还是像淘宝这样通过第三方卖家进行招商的,都需要有的放矢的在平台上重点发力构建哪些品类商品的供应链,招商哪些商家。而用户的搜索词就反馈了平台用户的需求,对于京东淘宝这种全国性的电商平台不太需要按照区域去分析用户的搜索词。
但对于像叮咚买菜、永辉超市这种生鲜电商就需要根据区域分析用户的搜索词,不同区域的用户对生鲜商品的需求完全不一样,所以生鲜类电商还需要根据区域性用户的需求来建立供应链。
对于生鲜类电商,很多商品都不适合大量囤货,不然会造成商品的大量损耗。所以生鲜类电商都需要做一件事情,就是销量预测,基于销量进行采购。传统的销量预测大部分都是专家经验,由采购人员根据历史的经验人工拍板每个商品今天采购多少,而这种经验随着人员的离职也都被带走了。