《SQL必知必会》| 第10课 分组数据 学习笔记
第10课 分组数据
- 这一课介绍如何分组数据,以便汇总表内容的子集。这涉及两个新
SELECT
语句子句,GROUP BY
子句和HAVING
子句。 - 讲授了如何使用
GROUP BY
子句对多组数据进行汇总计算,返回每个组的结果。 - 我们看到了如何使用
HAVING
子句过滤特定的组,还知道了ORDER BY
和GROUP BY
之间以及WHERE
和HAVING
之间的差异。
10.1 数据分组
使用分组可以将数据分为多个逻辑组,对每个组进行聚集计算。
10.2 创建分组
分组是使用SELECT
语句的GROUP BY
子句建立的。
-
GROUP BY
子句可以包含任意数目的列,因而可以对分组进行嵌套,更细致地进行数据分组。 -
如果在
GROUP BY
子句中嵌套了分组,数据将在最后指定的分组上进行汇总。换句话说,在建立分组时,指定的所有列都一起计算(所以不能从个别的列取回数据)。 -
GROUP BY
子句中列出的每一列都必须是检索列或有效的表达式(但不能是聚集函数)。如果在SELECT
中使用表达式,则必须在GROUP BY
子句中指定相同的表达式。不能使用别名。 -
大多数
SQL
实现不允许GROUP BY
列带有长度可变的数据类型(如文本或备注型字段)。 -
除聚集计算语句外,
SELECT
语句中的每一列都必须在GROUP BY
子句中给出。 -
如果分组列中包含具有
NULL
值的行,则NULL
将作为一个分组返回。如果列中有多行NULL
值,它们将分为一组。 -
GROUP BY
子句必须出现在WHERE
子句之后,ORDER BY
子句之前。
提示:
ALL
子句
Microsoft SQL Serve
r等有些SQL
实现在GROUP BY
中支持可选的ALL
子句。这个子句可用来返回所有分组,即使是没有匹配行的分组也返回(在此情况下,聚集将返回NULL
)。具体的DBMS
是否支持ALL
,请参阅相应的文档。注意:通过相对位置指定列
有的
SQL
实现允许根据SELECT
列表中的位置指定GROUP BY
的列。例如,GROUP BY 2, 1
可表示按选择的第二个列分组,然后再按第一个列分组。虽然这种速记语法很方便,但并非所有SQL
实现都支持,并且使用它容易在编辑SQL
语句时出错。
10.3 过滤分组
说明:使用
HAVING
和WHERE
HAVING
与WHERE
非常类似,如果不指定GROUP BY
,则大多数DBMS
会同等对待它们。不过,你自己要能区分这一点。使用HAVING
时应该结合GROUP BY
子句,而WHERE
子句用于标准的行级过滤。说明:
HAVING
和WHERE
的差别这里有另一种理解方法,
WHERE
在数据分组前进行过滤,HAVING
在数据分组后进行过滤。这是一个重要的区别,WHERE
排除的行不包括在分组中。这可能会改变计算值,从而影响HAVING
子句中基于这些值过滤掉的分组。
10.4 分组和排序
提示:不要忘记
ORDER BY
一般在使用
GROUP BY
子句时,应该也给出ORDER BY
子句。这是保证数据正确排序的唯一方法。千万不要仅依赖GROUP BY
排序数据。说明:
Access
的不兼容性
Microsoft Access
不允许按别名排序,因此这个例子在Access
中将失败。解决方法是用实际的计算或字段位置替换items
(在ORDER BY
子句中),即ORDER BY COUNT(*), order_num
或ORDER BY 2, order_num
。