故障域

维基百科,自由的百科全书

计算中,故障域包含计算环境的物理或逻辑部分,当关键设备或服务遇到问题时,该部分会受到负面影响。换句话说,故障域是基础设施中可能发生故障的区域或组件。每一个域都有自己的风险和挑战,需要进行架构。[1]

故障域的大小及其潜在影响取决于发生故障的设备或服务。例如,可能出现问题的路由器通常会比网络交换机产生更重要的故障域。较小的可以降低网络大面积中断的风险,并简化故障排除过程。[2]

故障域内的冗余是帮助减轻故障风险的关键方法。例如,RAID等技术通过创建多个数据副本,有助于减轻驱动器故障的风险。复制(Replication)有助于减轻服务器或存储阵列故障的风险。[3]

参见[编辑]

参考文献[编辑]

  1. ^ Wright, Eric. Thinking Like an Architect: Understanding Failure Domains. blog.turbonomic.com. [2019-10-19]. (原始内容存档于2019-10-19) (英语). 
  2. ^ Scaling Networks Companion Guide. Cisco Press. 2014: 9 [2020-06-09]. ISBN 978-1-58713-328-2. (原始内容存档于2020-06-21). 
  3. ^ Pure Storage 101: Ensuring 100% Performance. Pure Storage Blog. 2014-04-02 [2019-10-19]. (原始内容存档于2019-10-19) (英语).