Stairway to T-SQL DML Level 7: Summarizing Data Using a Simple GROUP BY Clause

阶梯

  这篇文章是阶梯系列的一部分:通往T-SQL DML的阶梯。

  通过使用SQLServer的Transact-SQL (T-SQL)方言,这个阶梯将为您提供如何使用SQL Server表数据的基本理解。DML是数据操作语言,它是处理数据的语言的一个方面。它包括语句选择、插入、更新和删除。这个阶梯将提供一些SQL语言的历史和一些关于集合理论的一般概念。每一级将建立在之前的水平上,所以当你完成你会有一个好的理解如何选择从SQL Server和修改数据。

  在阶梯6中,我向您展示了如何使用ORDERBY子句对数据进行排序。这允许你根据单个或多列的顺序整理你的详细记录。如果您想要查看特定记录中的数据,那么详细的数据是非常有用的,但是有时您需要将详细的数据汇总到汇总值中。总结您的数据,您可以使用GROUP BY子句来完成。有两种类型的GROUP BY子句。一种被称为简单的GROUP BY子句和另一种,它提供了一些简单的摘要,也就是general GROUP BY子句。这两种类型的主要区别是简单的GROUP BY只包含GROUP BY子句,而general GROUP BY子句包含其他操作符,如ROLLUP和CUBE。

  在本文中,我将介绍如何使用简单的group BY子句对数据进行分组。在后续的一篇文章中,我将讨论更复杂的general GROUP BY子句。

简单的GROUP BY子句

  使用简单的GROUP BY子句允许您基于单一列、多个列或表达式聚合您的数据。根据GROUP BY子句中指定的列和/或表达式,每个惟一值将返回一个总结行。当SQL Server通过子句处理一个组时,它通过惟一的列或表达式值对详细记录进行分组,然后根据选择列表中包含的聚合函数对每个集合进行总结。

  为了更好地掌握如何使用这个组,让我们假设您有一个表,其中包含不同商店的详细销售信息,您希望通过存储来总结总销售额。您可以使用GROUP BY子句来聚合每个商店的总销售额。在本例中,您将分组的唯一列将是商店名称,而要聚合的列将是销售额。你的结果将显示为每个唯一的商店名称一行,和每个商店的行包含该商店的销售额的总和。通过查询,SQL Server对哪些列可以包含在一个组的选择列表中有一些限制。查询组的选择列表中指定的每一列都需要归入以下类别之一:

  在GROUP BY子句中指定的列。

  在GROUP BY子句中指定的表达式。

  从聚合函数返回的值。

扫描二维码关注公众号,回复: 43559 查看本文章

  如果一个列不属于这些类别中的一个,那么当试图通过查询运行群组时,您将会得到一个错误。注意,GROUP BY子句中包含的列或表达式不需要在select列表中。

  让我通过几个示例来帮助演示如何使用简单的 GROUP BY子句获得汇总值。

简单的GROUP BY子句的示例数据。

  为了演示如何使用一个简单的GROUP BY子句,我需要构建一些示例数据。我提供了一个脚本来创建我的示例数据,这样您就可以运行本文提供的示例代码。使用清单1中的脚本构建并填充示例表。

USE tempdb;

GO

 

SET NOCOUNT ON;

 

-- Create Sales Table  

CREATETABLE dbo.SalesTransaction

   (Id INTIDENTITYPRIMARYKEY

   ,CustomerName VARCHAR(65)

   ,TotalSalesAmount money

   ,SalesTypeDesc VARCHAR(200)

   ,SalesDateTime DATETIME

   ,StoreName VARCHAR(100));

 

  

-- Add data to Sales Table

INSERTINTO dbo.SalesTransaction

      VALUES('John Smith', 124.23,'Software','09/22/2011 11:51:12AM','The SoftwareOutlet');

INSERTINTO dbo.SalesTransaction

      VALUES('Jack Thomas', 29.56,'Computer Supplies','09/23/2011 10:21:49AM','The SoftwareOutlet');

INSERTINTO dbo.SalesTransaction

      VALUES('Sue Hunter', 89.45,'Computer Supplies','09/23/2011 2:51:56AM','The SoftwareOutlet');

INSERTINTO dbo.SalesTransaction

      VALUES('Karla Johnson', 759.12,'Software','09/23/2011 2:54:37PM','The SoftwareOutlet');

      INSERTINTO dbo.SalesTransaction

      VALUES('Gary Clark', 81.51,'Software','09/22/2011 11:08:52AM','Discount Software');

INSERTINTO dbo.SalesTransaction

      VALUES('Scott Crochet', 12345.78,'Computer Supplies','09/23/2011 3:12:37PM','Discount Software');

INSERTINTO dbo.SalesTransaction

      VALUES('Sheri Holtz', 12.34,'Software','09/23/2011 10:51:42AM','Discount Software');

INSERTINTO dbo.SalesTransaction

      VALUES('Mary Lee', 101.34,'Software','09/23/2011 09:37:19AM','Discount Software');

      INSERTINTO dbo.SalesTransaction

      VALUES('Sally Davisson', 871.12,'Software','09/22/2011 05:21:28PM','Discount Software');

INSERTINTO dbo.SalesTransaction

      VALUES('Rod Kaplan', 2345.19,'Computer Supplies','09/23/2011 5:01:11PM','Discount Software');

INSERTINTO dbo.SalesTransaction

      VALUES('Sandy Roberts', 76.38,'Books','09/23/2011 4:51:57PM','Computer Books andSoftware');

INSERTINTO dbo.SalesTransaction

      VALUES('Marc Trotter', 562.94,'Software','09/23/2011 6:51:43PM','Computer Books andSoftware');

清单1:创建示例数据的脚本。

  如果您查看清单1中的脚本,您会发现我创建了dbo.SalesTransaction表。然后,我将一些记录插入到这个表中。我将使用这个表 来演示如何使用一个简单的GROUP BY子句来聚合数据。


分组成多个列

  有时您需要开发一份报告,其中的数据需要由多个列进行分组。为了实现这一点,您需要做的就是在GROUP BY子句中添加额外的列。当在GROUP BY子句中指定多个列时,SQL Server将根据GROUP BY子句中各列的惟一组合值对详细行进行聚合。在清单3中,我通过在GROUP by子句中添加第二列,扩展了清单2中的查询。

 

  清单3:基于单个列的组

  当我根据我的示例数据运行清单3中的代码时,我得到了报告2中的结果。

 

  报告2:运行清单1的输出值

  在报告2中,您可以看到StoreSalesAmount现在总结为StoreName和SalesTypeDesc级别。还要注意,返回的聚合行不是按照GROUP BY子句中列的顺序排序的。如果我希望汇总数据以StoreName顺序出现,那么我将需要在SELECT语句中包含ORDER BY子句。我将让您将订单添加到清单3中的代码以返回StoreName订单中的汇总数据。

 

  在GROUP BY子句中使用表达式

  有时,您可能希望将数据分组,而不是特定的列或列集。例如,您可能希望根据一些VARCHAR列的前几个字符,或者仅仅是日期,或DATETIME列的月份来总结您的数据。SQL Server允许您在GROUP BY子句中指定表达式来完成此操作。表达式可以是基于正在聚合的详细记录集中的列的任何有效表达式。为了演示如何在GROUP BY子句中使用表达式,请查看清单4中的代码。

 

  清单4:基于单个列的组

  在清单4中,SELECT语句将基于表达式的数据分组,在本例中为转换函数。如果在GROUP BY子句中使用表达式,则必须在SELECT列表中使用相同的表达式。CONVERT函数将解析SalesDateTime列,并只返回该列的日期部分。使用GROUP BY子句中的CONVERT函数,可以根据不同销售记录的实际日期对销售数据进行汇总。通过这样做,我可以总结我的示例,以获得所有商店的总销售额,如报告3所示。

 

  报告3:根据表达式汇总数据时输出。

  使用表达式可以让您以编程方式识别您的详细数据的哪些部分将被用于聚合成数据。

 

HAVING子句

  如果您使用GROUP BY子句聚合数据,您可能希望不返回所有聚合的值。相反,您可能只想返回聚合值的一个子集。可以使用HAVING子句来选择性地识别您想要从组中返回的聚合值。

修改翻译结果。

  通常,当我们选择数据时,我们使用WHERE子句来限制返回的行。惟一的问题是WHERE子句操作行值,而不是聚合值。因此,WHERE子句不能使用GROUP by子句创建的聚合值。但是,在GROUP BY子句后面添加一个HAVING子句为您提供了一种指定条件来确定您想要返回的特定汇总值的方法。为了更好地理解这一点,我来举几个例子。

  在查看商店销售数据时,有一个常见的HAVING子句可能用于确定没有达到特定销售限额的商店。如果您想找到所有不满足最低销售金额的商店,您可以使用清单5中的代码来实现。

 

  清单5:使用HAVING子句限制结果集

  在清单5中,我将结果集限制为那些累计总销售额小于1000.00的商店。在我这个简单的例子中,您会发现“计算机书籍和软件”的StoreName是唯一一个没有达到$1000.00的销售配额数量的商店。

  HAVING子句可以用于未聚合的列。如果您希望根据GROUP BY子句中使用的任何列的特定值来限制返回的行,那么您也可以这样做,清单6演示了这一点。

 

  清单6:基于GROUP BY子句的列能限制结果

  在清单6中,我只希望看到在他们的商店名称中有“Outlet”或“Books”的商店的汇总数据,这个例子还表明在HAVING子句中可以有多个条件。另一种方法是考虑WHERE和HAVING之间的区别,即WHERE子句在数据被聚合之前过滤掉数据行,而HAVING子句在应用程序组之后过滤出聚集的行。

 

  用简单的GROUP BY子句汇总数据

  在本文中,我向您展示了如何使用简单的GROUP BY子句来总结您的数据。我讨论了如何使用单个列、多个列以及GROUP BY子句中的表达式来总结详细数据。通过使用我所演示的内容,您现在应该能够构建一个简单的GROUP By子句来总结您的数据,并且可以选择使用HAVING子句来过滤汇总数据。

  在我的下一篇文章中,我将扩展我对GROUP BY子句的讨论。在这篇后续文章中,我将向您展示如何使用多维数据集和ROLLUP操作符来生成额外的汇总数据,如子总数和总值。

猜你喜欢

转载自blog.csdn.net/emmm00/article/details/79996088