专业的信息化与通信融合产品选型平台及垂直门户
注册 登陆 设为首页 加入收藏
首页 企业新闻 招标信息 行业应用 厂商专区 活动 商城 中标信息

资讯
中心

新闻中心 人物观点
厂商专区 市场分析
行业
应用
政府机构 能源产业 金融机构
教育科研 医疗卫生 交通运输
应用
分类
统一协作 呼叫客服 IP语音 视频会议 智能管理 数据库
数字监控 信息安全 IP储存 移动应用 云计算 物联网

TOP

数据中心自动化的利与弊
2014-03-27 13:32:16 来源:cnw.com.cn 作者:【
关键词:数据中心
 
在数据中心,自动化手动或重复性任务能帮助管理员减少工作量,但也这可能带来巨大灾难。

  在IT界,特别是在数据中心架构、建设和维护工作中,我们能够从构建新事物以及看着它们成功运作中获得满足感。在数据中心的所有领域都是如此,从网络到存储,我们喜欢构建事物。

  在我们构建了事物后,我们会开始优化它。在这里做些调整,那里做些更新,并监控一切以确保其正常运行。在大多数情况下,这最终会涉及到一定程度的自动化,而这正是工具箱脚本和开发发挥作用的地方。我们编写一些代码来自动化手动任务,将其放入生产环节,并移动到下一个目标。

  理想情况下,我们应该尽可能多地对代码进行错误检查,但很多时候,开发人员并不会进行真正的错误检查,这可能带来巨大的灾难。

  我们看一个真实的例子。我们有一个虚拟服务器模版(用于进行自动服务扩展),当web应用程序的负载增加时,该模版会用来增建web服务器。这是简单的事情—我们只需要能够按一个按钮(或者自动执行它)。

  假设我们已经部署了程序来调整负载均衡器,以及添加新的web服务器,我们真正要关注的是确保这些服务器上的应用程序堆栈的稳定性和正常运行。我们编写了一些代码,并将其放入到init脚本,让每台web服务器可以下载某些需要的变量因素,以便可以正常运行。这又是简单的事情。我们可以自动化anrsync或者scp进程。我们可以非常快速方便地测试这个代码。

  但是,如果我们没有对该代码进行足够的错误检查,我们可能会发现,在半年内,整个应用程序开始间歇性崩溃。也许文件名更改了,或者服务器被替换,或者某人更改了authorized_keys文件。这些都是看苏无害的变化,当这些web服务器启动时,它们将无法访问它们需要的东西,从而无法正常运行。

  在这种情况下应该会发生这样的事情:服务器通过SNMP或者电子邮件显示错误,并不会打开web服务。这个问题将会显而易见,也许一些调试就可以解决。然而,如果服务器继续打开所有服务,并加入到负载均衡组,它可能无法正常工作。

  根据所遇到的实际问题,这可能意味着新服务器上的所有服务都崩溃了,可能让服务、内容和应用程序监控框架无法检测到攻击。服务器可能看起来没问题,但实际并不是这样。

  如果这种影响相对较小,可能更加令人不安,这意味着通过该模版生成的新服务器启动时,又会出现错误报告,或者只会有小部分用户受影响,因为已经运行的服务器没有相同的问题。这些问题很难发现。笔者更愿意看到这样的情况:启动十几台服务器、发现一个错误、发送警报,然后破坏应用程序。与损坏的可能破坏数据库的快速应用程序相比,容量较低而减缓运行的应用程序更可接受。

  这个问题的关键是,看似微小的自动化工作可能能够完美地工作很长的时间,但最终还是会带来破坏。自动驾驶仪是伟大的发明,但我们还是希望由人来驾驶汽车,以确保事情的正常运行。对于简单的自动化任务,我们应该尽可能多地进行错误检查,因为这和自动化本身一样重要。

  笔者的一些自动化脚本是25%的函数代码,以及75%的错误检查和故障处理。当自动化脚本出现问题时,我们应该将调试信息输出到STDOUT。当与cronjobs或启动脚本中的mail-E结合使用时,调试到STDOUT能够带来简单的通知步骤。

  自动化确实能够带来很大的满足感。我们能够构建一个机智的框架来简化一些工作,然后看着其运作。但就像乐高车一样,如果我们不重视,它最终将会碰壁。最好一开始就做好规划。

      

责任编辑:admin
免责声明:以上内容转载互联网平台或企业单位自行提供,对内容的真实性、准确性和合法性不负责,Voipchina网对此不承担任何法律责任。

】【打印繁体】【投稿】【收藏】 【推荐】【举报】【评论】 【关闭】 【返回顶部

上一篇上海研发平台构建规模化数据中心
下一篇山石网科数据中心防火墙通过Citri..

热门文章

图片主题

最新文章

相关文章

广告位

Copyright@2003-2009 网络通信中国(原VoIP中国) 版权所有
联系方式:503927495@qq.com
  京ICP备05067673号-1 京公网安1101111101259