Navicat 博客

永远不要在数据库中存储这三类信息 2024 年 1 月 19 日,由 Robert Gravelle 撰写

在数字时代,数据库在无数应用程序和系统的管理和组织信息方面扮演着重要的角色。作为宝贵数据的守护者,企业和开发人员必须重视数据库的存储信息类型。尽管数据库旨在高效地处理数据,但有些类型的信息最好不要存储在数据库中。本文,我们将探讨你应避免存储在数据库的三类信息,以保持数据的完整性、安全性和合规性。

1. 重复和冗余的数据

在数据库中存储重复和冗余的数据可能一开始看起来并无要害,但是它可能导致一系列问题。重复数据不仅会浪费存储空间,还会引起不一致和错误的风险。当信息在多个记录之间重复时,实例更新可能会被忽略,从而导致的差异则会损害数据的准确性。

为了解决这个问题,设计数据库时则需要考虑规范性原则。规范性涉及数据的组织,以最大限度地减少冗余和依赖,确保每一条信息只存储在一个地方。这样做,你不仅可以优化存储,还可以提高数据的一致性和完整性。

2. 信用卡信息

在线上交易和电子商务领域,金融信息的保护尤为重要。在数据库中存储信用卡信息会带来重大风险,并引发对遵守行业标准如支付行业数据安全标准 PCI DSS)的高度关注。PCI DSS 概述了处理和保护信用卡数据的严格准则,以防止欺诈并保护消费者。

企业不应该直接存储信用卡信息,而是要应用安全的支付网关。支付网关使得信用卡信息在用户、商家和金融机构之间安全传输。这不仅降低数据泄露风险,而且还可以确保符合行业法规。

3. 敏感的个人身份信息(PII)

在数据库中存储敏感的个人信息,比如社会保障号码、护照详细信息或者驾驶执照号码,如果没有适当的保护措施,会导致灾难性后果。PII 是身份盗窃的主要目标,如果落入不法分子之手,可能会被用于欺诈活动。即使加密了数据库,但风险仍然很高,因为解密密钥很可能被破解。

为了降低这种风险,建议采用标记化或假名化技术来处理 PII。标记化技术涉及将敏感数据替换为唯一标记,使原始信息不可读。假名化技术则是利用可逆算法替换或加密敏感标识符,以确保数据受到保护,同时保证授权用户对数据可用。

例外情况和注意事项

虽然某些值可以从其他字段派生出来,但出于性能原因,可能会有些例外。假设你有数百万条记录,那么与循环遍历记录并每次动态计算答案相比,从数据库中获取实际值有时更为可取。考虑到这一点,这里有一些你可能想存储在数据库中的字段:

零售价

零售价通常计算为成本价加上税。然而,当基础价格变化或新的销售税生效时,这个看似简单的概念却引入了复杂性。将计算出的价格存储在数据库中需要一个“截止日期”作为上下文。这允许查看历史价格,并确保随着时间推移,即使影响定价的因素发生变化,也能准确记录。

年龄

当你拥有某人的出生日期和今天的日期时,似乎不必要再存储年龄信息。然而,考虑到年龄随着时间不断变化,存储记录的“截止日期”和存储时的“截止年龄”可以消除有时需要进行棘手计算的必要性。这个方法确保与年龄相关信息能够保持准确,并提供个体在特定时间点的年龄快照。

如果你需要存储计算字段,你可以在 Navicat 16 中快速创建一个插入触发器。

navicat-trigger (53K)

总结

知道数据库中包含哪些数据与理解数据库中不包含哪些数据同样重要。通过避免存储重复和冗余的数据、敏感个人信息和一些更适合动态计算的信息,你不仅可以优化存储,还可以提高数据一致性、完整性和安全性。

Navicat 文章
频道条目
分享
文章归档