ROWNUMBER() OVER( PARTITION BY COL1 ORDER BY COL2)用法，先分组，然后在组内排名，分组计算，主表与附表一对多取唯一等

日期：2024-12-28 作者：2fnuf 移动：http://ljhr2012.riyuangf.com/mobile/quote/76284.html

今天在使用多字段去重时，由于某些字段有多种可能性，只需根据部分字段进行去重，在网上看到了rownumber() over(partition by col1 order by col2)去重的方法，很不错，在此记录分享下：
　　row_number() OVER ( PARTITION BY COL1 ORDER BY COL2) 表示根据COL1分组，在分组内部根据 COL2排序，而此函数计算的值就表示每组内部排序后的顺序编号（组内连续的唯一的).
　　与rownum的区别在于：使用rownum进行排序的时候是先对结果集加入伪列rownum然后再进行排序，而此函数在包含排序从句后是先排序再计算行号码．

row_number()和rownum差不多，功能更强一点（可以在各个分组内从1开时排序）．
rank()是跳跃排序，有两个第二名时接下来就是第四名（同样是在各个分组内）．
dense_rank()l是连续排序，有两个第二名时仍然跟着第三名。相比之下row_number是没有重复值的.
lag（arg1,arg2,arg3):
　　arg1是从其他行返回的表达式
　　arg2是希望检索的当前行分区的偏移量。是一个正的偏移量，是一个往回检索以前的行的数目。
　　arg3是在arg2表示的数目超出了分组的范围时返回的值。

函数语法：
OPAP函数语法四部分：
1.function 本身用于对窗口中的数据进行操作；
2.partitioning clause 用于将结果集分区；
3.order by clause 用于对分区中的数据进行排序；
4.windowing clause 用于定义function在其上操作的行的集合，即function所影响的范围；

RANK()
dense_rank()
【语法】RANK ( ) OVER ( [query_partition_clause] order_by_clause )
dense_RANK ( ) OVER ( [query_partition_clause] order_by_clause )

【功能】聚合函数RANK 和 dense_rank 主要的功能是计算一组数值中的排序值。
【参数】dense_rank与rank()用法相当，
【区别】dence_rank在并列关系是，相关等级不会跳过。rank则跳过
rank()是跳跃排序，有两个第二名时接下来就是第四名（同样是在各个分组内）
dense_rank()l是连续排序，有两个第二名时仍然跟着第三名。
【说明】Oracle分析函数

ROW_NUMBER()
【语法】ROW_NUMBER() OVER (PARTITION BY COL1 ORDER BY COL2)
【功能】表示根据COL1分组，在分组内部根据 COL2排序，而这个值就表示每组内部排序后的顺序编号（组内连续的唯一的）
row_number() 返回的主要是“行”的信息，并没有排名
【参数】
【说明】Oracle分析函数

主要功能：用于取前几名，或者最后几名等
sum(...) over ...
【功能】连续求和分析函数
【参数】具体参示例
【说明】Oracle分析函数

lag()和lead()
【语法】
lag(EXPR,<OFFSET>,<DEFAULT>) OVER ( [query_partition_clause] order_by_clause )
LEAD(EXPR,<OFFSET>,<DEFAULT>) OVER ( [query_partition_clause] order_by_clause )
【功能】表示根据COL1分组，在分组内部根据 COL2排序，而这个值就表示每组内部排序后的顺序编号（组内连续的唯一的）
lead （）下一个值 lag（）上一个值

【参数】
EXPR是从其他行返回的表达式
OFFSET是缺省为1 的正数，表示相对行数。希望检索的当前行分区的偏移量
DEFAULT是在OFFSET表示的数目超出了分组的范围时返回的值。
【说明】Oracle分析函数

以上内容摘抄自：http://blog.csdn.net/yinshan33/article/details/18738229

之前用过row_number()，rank()等排序与over( partition by ... ORDER BY ...)，这两个比较好理解: 先分组，然后在组内排名。

今天突然碰到sum(...) over( partition by ... ORDER BY ... )，居然搞不清除怎么执行的，所以查了些资料，做了下实操。

1. 从最简单的开始

　　sum(...) over( )，对所有行求和

　　sum(...) over( order by ... )，和 = 第一行到与当前行同序号行的最后一行的所有值求和，文字不太好理解，请看下图的算法解析。

2. 与 partition by 结合

　　sum(...) over( partition by... )，同组内所行求和

　　sum(...) over( partition by... order by ... )，同第1点中的排序求和原理，只是范围限制在组内

以上内容摘抄自：http://www.cnblogs.com/luhe/p/4155612.html

案例：

有圈子表CMSocial，圈子成员表CMSocialMember，圈子审核表CMSocialCheck，其中圈子审核被拒绝的话，修改信息后可以再次提交审核，也就是说圈子可以生成多条圈子审核信息。

如果要查询某用户的全部圈子，同时获取其中每条圈子对应的最近一条审核状态？（假设某用户MemberID=1 ）

SQL语句可以这样写：

注意：

SELECT ROW_NUMBER() OVER (PARTITION BY CMSocialID ORDER BY CreateTime DESC) AS group_index ,*
FROM CMSocialCheck WHERE IsDelete<>1
) AS SCsub WHERE SCsub.group_index=1

sql根据某一个字段重复只取第一条数据
使用分析函数row_number() over (partiion by ... order by ...)来进行分组编号，然后取分组标号值为1的记录即可。目前主流的数据库都有支持分析函数，很好用。
其中，partition by 是指定按哪些字段进行分组，这些字段值相同的记录将在一起编号；order by则是指定在同一组中进行编号时是按照怎样的顺序。
示例(SQL Server 2005或以上适用)：

主表1条数据，对应子表，附表多条数据，取唯一：

特别提示：本信息由相关用户自行提供，真实性未证实，仅供参考。请谨慎采用，风险自负。

点赞 0举报收藏 0评论 0

0 条相关评论

相关最新动态

推荐最新动态

点击排行