早在 2020 年 3 月,关系数据库系统中的 NULL 值及其用途一文就介绍了 NULL 值及其在关系数据库中的特殊含义。那篇文章还描述了如何在数据库表中允许 NULL 以及如何在查询中引用它们。在今天的文章中,我们将学习如何将 NULL 与 SQL Count() 函数结合以实现各种目标。
计算 Null 值和非 Null 值
Count() 函数有两种形式:COUNT(*) 返回表中的所有行,而 COUNT(Expression) 忽略 Null 表达式。因此,如果你提供一个允许 NULL 值的列名,那么 Count() 将返回具有非 NULL 值的所有行。Count() 的这两种不同的用法为我们如何获得特定列的 NULL 值计数提供了重要线索。这是通过从总数字段中减去非 NULL 字段数,如下所示:
SELECT COUNT(*) - COUNT(<Column Name>)
现在我们知道如何计算表中的 NULL 行、非 NULL 行和所有行,让我们看一个例子。我们将对 MySQL classicmodels 示例数据库的 customers 表运行此查询。这是 Navicat Premium 的表设计器
addressline2 字段包含不属于街道名和号码的其他地址详细信息。因此,正如我们在此表数据示例中所见,并非所有地址都需要它:
此查询以三种方式使用 Count() 函数来显示所有表行、有数据的 addressLine2 行数和 Null 值行数:
SELECT COUNT(*) AS All_Rows, COUNT(addressLine2) AS addressLine2_Count, COUNT(*) - COUNT(addressLine2) AS Null_addressLine2_Rows FROM customers;
这是 Navicat Premium 的查询设计器中的上述 SELECT 语句,以及结果:
正如预期的那样,addressLine2_Count 和 Null_addressLine2_Rows 结果加起来就是 All_Rows 计数。
在内容分析中使用 NULL
Count() 函数的 COUNT(Expression) 版本忽略 Null 表达式这一事实对于编译有关表数据的统计信息非常有帮助,尤其是在与 SQL IF() 函数等其他函数结合使用时,这基本上是三元运算符的 SQL 等价物:
IF(predicate, true-value, false-value)
如果谓词为 true,则 IF 计算为 true 值,或在下面的查询中为 1。如果谓词为 false,则计算结果为 false 值或 NULL,如下面的语句所示。然后 COUNT 将 IF 为 1(即谓词为 true)的每一行制成表格:
SELECT count(IF(country = 'Australia', 1, NULL)) as Australia_Count, count(IF(country = 'Germany', 1, NULL)) as Germany_Count, count(IF(country = 'Canada' OR country = 'USA', 1, NULL)) as North_America_Count, count(IF(country like 'F%', 1, NULL)) as F_Countries_Count, count(IF(creditLimit between 20000 and 1000000, 1, NULL)) as CreditLimit_Range_Count, count(*) as Total_Count FROM customers WHERE dob >= '1960-01-01';
这是 Navicat 中的查询和结果:
总结
在今天的文章中,我们学习了如何将 NULL 与 SQL Count() 函数结合以实现各种目标。不仅仅是计算 NULL 和非 NULL 值的一种方法,当与其他 SQL 函数(如 IF() 和 SUM())结合使用时,它们可用于编译有关数据的各种统计信息!