尽管计算机内存技术取得了进展,出现了动态 RAM (DRAM) 和同步 DRAM (SDRAM),但它们仍然受到成本、容量和保留时间的限制。 当计算机关机时,RAM 保留数据的能力也随之消失。 那么有何解决方案呢? 答案是数据存储。
通过数据存储空间,用户可以将数据保存到设备上。 当计算机关机时,数据仍得以保留。 用户可以指示计算机从存储设备中提取数据,而无需手动将数据输入计算机。 计算机可根据需要从各种来源读取输入数据,然后再创建输出,并将其保存到相同的源位置或其他存储位置。 用户还可以与他人共享数据存储。
如今,组织机构和用户需要数据存储来满足高级计算需求,例如大数据项目、人工智能 (AI)、机器学习和物联网 (IoT)。 需要庞大数据存储量的另一个原因是防止由于灾难、故障或欺诈导致的数据丢失。 因此,为避免数据丢失,组织机构还可以使用数据存储作为备份解决方案。
数据存储的工作原理
简单来说,现代计算机(或称为终端)直接或通过网络连接到存储设备。 用户指示计算机从这些存储设备访问数据并将数据存储到其中。 但根本而言,数据存储有两个基本要素: 数据所采取的形式,以及记录和存储数据的设备。
数据存储设备
无论采用何种形式存储数据,用户都需要存储设备。 数据存储设备分为两大类: 直接区域存储和基于网络的存储。
1、直接区域存储也称为直连存储 (DAS),顾名思义, 这种存储器通常位于本地区域并直接连接到访问它的计算机。 通常,只有一台计算机与之连接。 DAS 也可以提供良好的本地备份服务,但共享功能有限。 DAS 设备包括软盘、光盘 (CD 和 DVD)、硬盘驱动器 (HDD)、闪存驱动器和固态驱动器 (SSD)。
2、基于网络的存储支持多台计算机通过网络对其进行访问,因此更有利于数据共享和协作。 它的异地存储能力也使其更适合备份和数据保护。 有两种常见的基于网络的存储设置:网络连接存储 (NAS) 和存储区域网络 (SAN)。
NAS 通常是由冗余存储容器组成的单个设备,或是或独立磁盘冗余阵列 (RAID)。 SAN 存储可以是由多台不同类型的设备所组成的网络,包括 SSD 和闪存存储、混合存储、混合云存储、备份软件和设备以及云存储。 以下是 NAS 和 SAN 的不同之处:
NAS
单个存储设备或 RAID
文件存储系统
TCP/IP 以太网
用户有限
速度有限
扩展选项有限
成本较低且易于设置
SAN
多设备网络
块存储系统
光纤通道网络
针对多用户进行了优化
性能更快
高度可扩展
成本较高且设置复杂
存储设备的类型
1、SSD 和闪存
闪存是一种固态技术,它使用闪存芯片来写入和存储数据。 固态磁盘 (SSD) 闪存驱动器使用闪存来存储数据。 与 HDD 相比,固态系统没有移动部件,因此延迟更低,所需的 SSD 更少。 由于大多数现代 SSD 基于闪存,因此闪存已成为固态系统的代名词。
2、混合存储
SSD 和闪存提供比 HDD 更高的吞吐量,但全闪存阵列的价格较高。 许多组织机构采用混合方法,将闪存的速度与硬盘驱动器的存储容量结合在一起。 平衡的存储基础架构使公司能够针对不同的存储需求应用恰当的技术。 它提供了一种经济实惠的方式来告别传统的 HDD 模式,而无需完全采用闪存。
3、云储存
与将文件存储到本地硬盘驱动器或存储网络相比,云存储提供了一种经济实惠且可扩展的替代方案。 云服务提供商允许您将数据和文件保存在异地位置,然后通过公共互联网或专用私有网络连接进行访问。 提供商负责托管、保护、管理和维护服务器及相关基础架构,并确保您在需要时能够随时访问数据。
4、混合云存储
混合云存储结合了私有云和公共云元素。 借助混合云存储,组织机构可以选择将数据存储在哪种云上。 例如,具有严格归档和复制要求的高度管制数据通常更适合存储到私有云环境。 而敏感性不高的数据可以存储在公共云中。 一些组织机构借助混合云中的公共云存储来补充其内部存储网络。
6、备份软件和设备
备份存储和设备可防止因灾难、故障或欺诈而造成数据丢失。 它们定期将数据和应用程序副本复制到单独的辅助设备,然后使用这些副本进行灾难恢复。 备份设备可以是 HDD、SSD、磁带驱动器、服务器等等,但备份存储也可以作为服务提供,也就是所谓的备份即服务 (BaaS)。 与大多数“即服务”解决方案一样,BaaS 提供了一种保护数据的低成本选项,以易于扩展的方式将数据保存在远程位置。
数据存储的形式
有三种主要形式来记录和存储数据: 文件存储、块存储和对象存储。
1、文件存储
文件存储也称为文件级或基于文件的存储,是一种用于组织和存储数据的分层存储方法。 换言之,数据存储在文件中,文件被组织在文件夹中,文件夹则被组织在目录和子目录的层次结构下。
2、块存储
块存储有时也称为块级存储,是一种用于将数据存储成块的技术。 这些块随后作为单独的部分存储,每个部分都有一个唯一的标识符。 对于需要快速、高效和可靠的数据传输的计算场景,开发人员倾向于使用块存储。
3、对象存储
对象存储通常称为基于对象的存储,是一种用于处理大量非结构化数据的数据存储架构。 这些数据无法轻易组织到具有行和列的传统关系数据库中,或不符合其要求。 具体示例包括电子邮件、视频、照片、网页、音频文件、传感器数据以及其他类型的媒体和 Web 内容(文本或非文本)。