深入学习SQL Server聚合函数算法优化技巧

sql server聚合函数在实际工作中应对各种需求使用的还是很广泛的，对于聚合函数的优化自然也就成为了一个重点，一个程序优化的好不好直接决定了这个程序的声明周期。sql server聚合函数对一组值执行计算并返回单一的值。聚合函数对一组值执行计算，并返回单个值。除了 COUNT 以外，聚合函数都会忽略空值。聚合函数经常与 SELECT 语句的 GROUP BY 子句一起使用。

一.写在前面

如果有对sql server聚合函数不熟或者忘记了的可以看我之前的一片博客。

本文中所有数据演示都是用Microsoft官方示例数据库：Northwind，至于Northwind大家也可以在网上下载。

二.sql server标量聚合

2.1.概念：在只包含聚合函数的 SELECT 语句列列表中指定的一种聚合函数（如 MIN()、MAX()、COUNT()、SUM() 或 AVG()）。当列列表只包含聚合函数时，则结果集只具有一个行给出聚合值，该值由与 WHERE 子句谓词相匹配的源行计算得到。

2.2.探索标量聚合：

我们先用sql server的"包括实际的执行计划"来看看一个简单的流聚合COUNT()来看看表里数据所有的行数。

再通过SET SHOWPLAN_ALL ON(关于输出中包含的列更多信息可以在链接中查看)来看看有关语句执行情况的详细信息，并估计语句对资源的需求。

通过SET SHOWPLAN_ALL ON我们来看看COUNT()具体做了那些事情:

索引扫描：扫描当前表的行数
流计算：计算行数的数量
计算标量：将流计算出来的结果转化为适当的类型。(因为索引扫描出来的结果是根据表中数据的大小决定的，如果表中数据很多的话，COUNT是int类型就会有问题，所以在最终返回的时候需要将默认类型(数值一般默认类型是Big)转成int类型。)
小结：通过SET SHOWPLAN_ALL ON我们可以查看sql server聚合函数在给我们呈现最终效果的时候，为这个效果做了些什么事情。

2.3.标量聚合优化技巧：

SQL查询来看看他们的区别

代码如下:

查询从语句上来说没什么太大的区别，但是为什么开销会不一样，一个是查询城市一个是查询订单号。这是因为其实DISTINCT对于OrderID查询来说，是没有什么意义的，因为OrderID是主键，是不会有重复的。而ShipCity是会有重复的，sql server的去重机制在去重的时候，会有一个排序的过程。这个排序还是比较消耗资源的。

次数多的字段去重运算。所以我们这里可以对ShipCity进行优化一下。可以对ShipCity创建一个非聚集索引。

深入学习SQL Server聚合函数算法优化技巧

一.写在前面

二.sql server标量聚合

三.sql server哈希聚合

四.运算过程监控指标

相关文章