早在 2020 年,我们就了解了关系数据库系统中的 NULL 值及其用途。正如那篇文章所述,NULL 值已成为一个特殊标记,表示不存在任何数值。你也可以说 NULL 值可能表示列可能有一个值,但是你还不知道该值是什么。在这种情况下,它们充当占位符,直到你最终收集到所需数据,用实际值填充表字段。
此外,当你考虑到所有主要数据库供应商都支持 NULL 作为默认值时,只有使用它们才有意义,不是吗?好吧,没那么快。除非绝对必要,否则有些数据库设计人员会避免使用 NULL。他们是不是知道其他人不知道的事?请继续阅读,找出答案!
空间考虑因素
尽管 NULL 值表示“无”或“无值”,但数据库将它们视为一个值。就此而言,它们会占用硬盘的空间。因此,如果你认为使用 NULL 值可以节省硬盘空间,那么你可能错了。事实上,NULL 被认为是一个可变长度的值,这意味着它可以是两三个字节或几个字节,具体取决于列类型。数据库会为额外的字节留出空间,会大于字段中存储的值,结果是你的数据库可能会比使用常规值占用更多的硬盘空间。
不创建缺少信息的记录
一些数据库管理员认为,如果无法填充记录的所有列,则不应创建记录。这个论点显然不适用于所有用例,但它的意思是只有当所有字段都有实际值而没有任何占位符时才应该创建记录。例如,在银行应用程序中,如果你不知道交易金额,你不会继续进行交易。这很有道理,但是这种严格的标准在其他行业(例如电子商务或收集用户数据的网站)中不是很有效。
复杂的 SQL
另一个缺点会影响数据库存储过程。虽然大多数数据库都提供了检测 NULL 值的函数,但仍必须特别注意区分 NULL 和其他值。这意味着你的 SQL 过程可能比所需的要長得多,并且它们也可能变得难以阅读。如果过程过于复杂或难以理解,数据库管理员可能会拒绝代码更改。
例如,以下是 Navicat Premium 16中的一个小型表,它有数值、空字符串和 NULL:
在 Navicat 中,使用“编辑”菜单就能很容易插入空字符串或 NULL。
以下是一个根据各种条件计算 name 数量的查询:
我们想看到 5 的计数,因为记录 4、5、7、8 和 10 中没有值。但是,只有 combo_count 返回了 5。这是因为虽然 NULL 值没有长度,但 length() 函数不会拣选 NULL。
从这个例子中,我们可以得出一个结论,允许 NULL 值可能会令你更难获取你在寻找的数据。此外,允许 NULL 值可能会降低你对数据库中数据的信心,因为你永远无法确定某个值是否存在。
总结
大多数数据库从业者选择在他们的数据库表中允许一些 NULL 值,因为它们几乎是所有数据库的默认值,并且可以用作缺失数据的占位符。但另一方面,有一些 DBA 认为允许 NULL 是得不偿失的。而这篇文章的重点是,在设计数据库之前,你应该考虑自己的业务流程,并选择最适合你的数据的结构。