一直以来,云计算都是大家的关注焦点之一。因此针对大家的兴趣点所在,小编将为大家带来云计算的相关介绍,详细内容请看下文。
一、如何评估云计算提供商
(1)云计算提供商使用的软件和硬件技术
他们是否使用相同的管理程序?这对于保持与企业目前拥有的兼容性以及允许转移现有技能集非常重要。如果没有,再培训可能是隐藏的成本。另外,他们是否使用类似或更好的企业级计算和存储基础设施?企业必须依赖云计算提供商的基础设施,使其性能、弹性和可靠性与其将在其自己的数据中心中安装的设备一样。可靠性取决于网络层上使用的设备,云计算提供商的服务等级协议(SLA)应该保证高可用性。
(2)评估共享(公共云)或专用(私有云)环境
云计算提供商对于基于云计算的基础设施具有不同的选择。如果企业选择将其环境放置在共享平台中,那么它将与其他租户共享资源。它可能不介意将较低层的应用程序或开发系统放置在可能无法以较低成本保证交易中的全部资源可用性的环境中。对于更关键的应用程序,企业可能需要验证云计算提供商没有超额订购,并且可以满足工作负载需求;需要完全控制表明需要采用私有云。
(3)云计算环境管理
选择云计算提供商的企业必须了解并适应其与环境的互动和管理方式。它是自我管理的,因此可以即时添加其他计算机或网络,还是云计算提供商为企业管理这些事情?这两种选择都有其优势,但成本点也不同。
(4)云计算透明性和管理级别与内部部署
当企业将业务迁移到云计算提供商时,IT团队可能不再对存储指标、虚拟机管理程序利用率甚至网络拓扑具有可见性。因此,企业应评估其对环境具有洞察力以交付业务价值所需的工具。或者,它应该评估不具有管理功能和可见性的风险和影响。重要的是要了解云计算供应商提供了哪些工具,从通过VPN的远程访问一直到集成控制台。
二、云中断处理策略
1、确定灾难恢复计划的业务价值
确定需要执行什么来实施灾难恢复计划。有些计划是自动的。例如,重要的工作负载通常通过某种类型的集群来保护,即使节点(或实例)发生故障,集群也应继续运行。但是,针对次要工作负载的灾难恢复策略可能需要人为干预或分散步骤,例如恢复和重新启动快照或切换到备份实例。
如果需要人为干预,需要考虑恢复过程中涉及的工作和费用,并确定启动恢复的业务价值。询问恢复工作负载是否会比只是等待云计算提供商解决中断所需的时间更长且成本更高。来自云计算提供商的通信将会显著影响这一决定。
2、实施灾难恢复计划
在许多情况下,关键任务灾难恢复计划可能是完全自动化的,并且管理人员可能无需采取任何有意的操作。例如,即使一个节点在云计算中断期间变得不可用,跨越AWS云计算可用性区域或Azure云区域的集群也可能继续起作用。
但是,不太重要的工作负载可能需要采取有计划的行动。采用准备好的脚本、模板或其他资源,以协调适当的灾难恢复响应。当企业决定启动需要人为干预的灾难恢复计划时,管理员必须立即采取行动。这可能包括在云计算中断期间从快照重新启动或将流量重定向到备用实例。
灾难恢复计划需要定期测试。执行测试演练,以确保适当的过程和资源来推动工作负载恢复。测试还验证相关资源的配置,例如IP地址以及相关的驱动程序和相关性。如果恢复在常规测试中正常运行,则很可能在实际灾难恢复情况下正常运行。
3、监控灾难复原策略
无论实施灾难恢复策略所涉及的工作量或自动化程度如何,验证已恢复的工作负载是否正常运行仍然很重要。管理人员应将以灾难恢复状态运行的工作负载的性能与在正常条件下运行的相同工作负载的性能进行比较。
应用程序监视工具(例如Amazon CloudWatch和Google Stackdriver)着眼于工作负载运行状况。这些工具还收集日志、指标和事件,以中继有关已恢复工作负载的操作数据。此外,他们将在整个云计算中断期间继续监视工作负载的性能和可用性。
最后,小编诚心感谢大家的阅读。你们的每一次阅读,对小编来说都是莫大的鼓励和鼓舞。希望大家对云计算已经具备了初步的认识,最后的最后,祝大家有个精彩的一天。