小蜜锋 - 云代码空间
—— 技术宅拯救世界!
“因机房空调系统故障,正在积极组织抢修。目前暂停互联网售票、退票、改签业务。”春运还没开始,小小的元旦又让日点击量超14亿,堪称“网站传奇”的12306铁路客户服务中心网上订票系统down掉了,意外的是,就连车站的自动售票柜机也跟风“罢工”。12306反复瘫痪,究竟为什么?
难道,真的像官方所说,是由于“机房空调系统故障”吗?这样的解释,你信吗?
我想,如果空调能说话了,它的第一句肯定会是:原来,不动,也中枪。
远的不说,今年国庆中秋扎堆的8天十一长假,就再一次让12306出尽了“风头”。显然,日点击量创下全国互联网站点新高的光鲜数据背后,被戳14亿次的滋味也是不好受的。表面上看,甚至让人觉得它有情可原,不过回过头来仔细一想,不对,12306的背后是中华人民共和国铁道部。
解决的方法?有,我来总结一下目前可以看到的:
·电话预订和车站售票窗口购票
·铁道部官方订票手机端APP
·提高铁路运力
·招标,重建网站
篇幅原因,后文作进一步地解释。对于大家最关注的招标事宜,我也整理了一些,根据导航跳转看吧。
编辑的小啰嗦
十一期间的12306事件因编辑部内部原因被告搁浅,前段日子终于让我逮到机会,分析了一下深圳地铁,感谢上帝反映不错。那时候虽然报道了却有些不忍,但一想到轨道交通追尾的严重后果,又觉得写这样的东西实在是有必要。
这次也是,看到编辑部风声还不算紧,先入为主吧,想到那么多远在他乡,因为交通问题不好回家的朋友们,决定还是再写一写。
当然,也希望大家有所觉悟,这是个老大难问题,我们身在的环境决定着一切,在这里,奇迹更不会每天上演,只能学着淡定。>>
推荐阅读
“WiFi逼停地铁”事件 前因后果全面分析
http://network.pconline.com.cn/news/1211/3060855.html
近看铁道部的一些解决方案
作为一个人口大国的铁道部,我想这里的人一定承受着非同凡响的压力,大家也应该认识到这一点。只是,如此大的工程,我们无条件的信赖,作为回报,是不是应该办得干净、漂亮一些。
·电话预订和车站售票窗口购票
官方公告,“您可通过电话预订2013年1月6日以内车票,也可在车站售票窗口或代售点购买2013年1月4日以内的车票。”好吧,我承认我太现实,看到的只有:想网上订票的同志们,交通管制,此路不通。·铁道部官方订票手机端APP
铁道部声称9月底上线的“掌上12306”手机购票应用程序拖延两个月,至今仍未推出。但在App Store和Google Play上,各种“准12306客户端”已有数十款出炉。对此,官方工作人员提醒,旅客切勿通过其他第三方软件付款购票,请继续“耐心等待”官方版本。·提高铁路运力
提高运力,究竟有没有落实,离我的编辑范围太远就不调查了。但是这种解决方法,好像只会让人觉得,你这是在搪塞,推脱责任。
招标,重建网站
自“十一12306”风波后,铁道部堪称腹背受敌,决定对12306网站改造再一次进行公开招标,据披露这次的“悬赏”金额居然达到3.3亿元。经过新一轮升级,系统虽然在响应速度和连接率上有了进步,但关于招标的很多事宜,官方却守口如瓶,称这些都是“内部机密”,无可奉告。我们似乎应该习惯相关部门这样的办事风格了。>>
12306网上订票系统瘫痪
可能的罪魁:机房制冷系统故障针对12306网上订票系统瘫痪,官方的解释是由于“机房空调系统故障”。如果真如官方所说,那么,机房空调系统在机房中起到一个什么作用?机房数据中心的制冷系统究竟起着什么作用?制冷系统故障会有多大后果?
我们先来看一下标注数据中心机房的能源分配,可以看到除了服务器网关等IT设备外,最耗电的就是制冷系统。其次是空气流通,这实际上也有着制冷的作用。
从数据中心制冷系统的耗电量之大,就可以看出制冷系统在机房以及数据中心起着重要作用。一方面,由于众多服务器以及电源等设备的发热量大,如果不及时散热,这些设备在高温的环境下,运行速率就会大大降低,相信大家都有感觉,自己的笔记本在十分卡的时候,一定是非常烫的时候,这时候就会想到去清理风扇。
机房数据中心更是如此,现在都是高密度的机架式服务器,众多服务器放置在一起,如果制冷系统出现问题,散热不良,机房温度就会急剧升高,严重影响服务器的运行速率,进而导致网站瘫痪。
现在几乎所有的工业机器和设备的冷却技术都是采用液冷,然而奇怪的是大多数大型数据中心还是采用的空气冷却的方式。这是由于服务器发热主要在于CPU,然而承载CPU的集成电路板又是不能接触常见的水等冷却液体,因此大多数大型数据中心还是采用的空气冷却的方式。
在传统服务器中,往往有许多风扇,为发热比较高的处理器进行冷却,而一旦风扇出现问题,服务器就会因CPU过热而出现故障问题。此外空气中也会有许多灰尘,采用空气制冷不可避免的是灰尘在服务器内部堆积的情况,而灰尘累计过多也会影响系统的散热。
虽然服务器内部有着风扇,但是想想一下,众多服务器堆积在一起,光靠内部风扇是不够的,因此需要整个机房中的空调等设备进行空气的流通,将热空气带走,进行热量交换。
因此空调制冷系统在数据中心机房有着举足轻重的作用,一旦制冷系统瘫痪,整个机房的服务器运行速率就会受到严重影响,导致业务或是网站瘫痪。
然而,真凶就是它了吗?
12306网上订票系统瘫痪
专业解疑,技术维护和管理机制才是幕后真凶
网上订票难如果可以理解,三天内连续两次“因空调故障”导致订票系统瘫痪,隔三差五down机就说不过去了。难道,真的仅仅是因为机房空调系统故障所致吗?对此,专家给出了正面回答,实际上,也是对这个疑问辟了谣。
正略钧策管理咨询合伙人乔胜普认为,如果是由于机房空调设备故障,最有可能导致服务器机房温度过高,造成服务器死机,这种事情一般情况夏天经常会遇到,但在冬天类似故障发生的可能性较小。“其实可能还是订票系统本身的架构问题,增强订票系统的处理能力是解决这个问题的关键。”
IT法律专家、北京惠诚律师事务所赵占领律师表示,空调设备故障导致暂停网上订票的说法值得推敲。机房不可能只有一套空调设备,至少会有备用的设备防止出现意外,尤其是12306这样访问量极高的网站,应该会有多种紧急情况下的处理机制。
“所以,我觉得要么是其他原因导致不得不暂停售票,要么就是多套设备都存在严重质量问题。三天出现两次故障,晚上维修、白天仍停机,可见12306的技术维护能力和处理效率都存在问题。”赵占领认为。
主要还是体制原因所致,铁道部应该考虑放开限制,允许民营互联网企业经营火车票网售业务,至少也应该与技术实力雄厚的民营互联网企业进行技术合作。有专家建议。>>
医院、银行系统也来凑热闹
其实,down机情况决不是12306订票系统的专利。网络系统使用率越高,出现问题的几率也就越大,比如医院和银行。近日,多家三级甲等医院的系统就不同程度地发生了故障,此后网上也有披露称银行系统down机的消息。之所以提到医院和银行,我想这只是更醒目的例子,网路系统出现故障的地方大有人在。远的就不说了,近日,包括儿童医院、友谊医院、积水潭医院在内的三级甲等医院先后出现了网络系统故障,直接导致患者挂号、开处方、划价等环节被迫停滞,可以想象,本来“看病难”问题就一直存在,这样更是雪上加霜。屋漏偏逢连夜雨,接下来,又有消息传出北京中医药大学东方医院,以及一些专科医院都出现了down机的情况。
另外不知大家还记不记得前些日子中行信用卡大机系统down机的事情,IBM的大机,一down就超过4个小时。银行柜机故障,网络系统故障,后果可想而知,银行的队只会越来越长,如果牵扯到hack,严重性更难以想象。
腾出这一页的目的,只是想说明一个事实,不论是哪里的网络系统,是大是小,都会出现down机的情况。没有十全十美的人,更没有完美无漏洞的系统,人都会出错,意外都是难免的。但是,作为各机构/部门/单位的负责人,“紧抓安全,严防死守”不能只靠上嘴唇碰下嘴唇。
设备系统出问题,有它自己的原因:故障、老化,很正常,但是我想,只要人为干预,这些都能排除。网络系统的安防管理不是一朝一夕的事,如果你有能力控制它,就请把心思多放在它们身上,就像上文专家们指出的,技术维护和管理机制必须得到重视。
关于招标,铁道部的回应
我记得,力争“公正透明”是国家下属部门机构进行招标工作的一贯宗旨,作为国务院办公厅重要的组织部门,更应该严格遵守。公众对于12306网站改造招标工作产生的质疑,铁道部也及时作出了回应。
招标项目分2个包件
铁道部称,招标项目分为两个独立的包件,内容主要包括12306网站订票、客服网站、客服语音、互联网接入安全、电子支付平台、系统网络、列车服务、营销决策、系统监控、系统测试环境、代售点接入安全、机房环境等系统配套软硬件设备的采购及建设。招标代理机构依法在“中国采购与招标网”上发布招标公告,共有7家单位购买了招标文件。
5家投标两家中标
标书售出20天后,项目在京公开开标,共5家投标人递交了投标文件,均满足本次招标合格投标人条件。
铁道部信息技术中心依据评标委员会的评标报告及授标建议,确认在两个包件中分别报价最低、得分最高的太极计算机股份有限公司、同方股份(600100,股吧)有限公司为中标单位。评标结果依法在招标代理网站上公示满3个工作日无异议后,向中标单位发出了中标通知书。
鉴于新一代客票系统是对原有铁路客票系统的升级,为保证系统应用软件开发连续性和功能配套要求,根据相关法律法规,由原铁路客票系统研发单位中国铁道科学研究院电子所承担了全国铁路新一代客票系统应用软件的研发工作。
四大疑点
疑点二:中标“神速”。根据《工程建设项目货物招标投标办法》,招标流程大致为 “招标投标开标和评标定标”等,且规定:自招标文件开始发出之日起至投标人提交投标文件截止之日止,最短不得少于20日。实际上,从7月10日的招标到8月1日候选人结果出来刚好20天,这意味着,在提交投标文件截止之日,中标候选人就已出炉,开标、评标、定标时间甚至“忽略不计”。
疑点三:3亿元的项目费用是怎么计算出来的?铁道部为何不愿拿出明细表?业内人士称,一般客票系统的建设费用合计不超过3000万元。
疑点四:项目是否进行,双方说法矛盾。太极股份相关发言人表示,公司承担的项目刚刚中标,合同还没有签,项目也还没开始;而铁道部信息技术中心的说法是“已按计划使用了部分招标采购的设备”。
公众的反应
A、铁道部回应的升级改造招投标信息不全面,并没有说哪5家公司参与招投标,每个公司方案、报价究竟如何?
B、我们最关心的是,12306网站升级上线到现在到底花了多少钱?网站建设设计是否经过招投标?如经过招投标多少企业参与,相关的投标方案报价信息。
C、除此之外,12306升级上线以来,全部设计建设招投标信息,网站设计、建设运营总造价、参与招投标企业名称、营业执照、资质证明、标书方案信息、招投标时间进程、招投标主持机构名称、营业执照、资质证明、中标企业资质证明等信息。难道不应该公示吗?>>
12306网上订票系统升级回顾:连曝6项低级漏洞
随着9月末“包裹”漏洞新鲜出炉,仅仅在一个9月份,12306就被曝存在6个安全漏洞。据国内权威漏洞报告平台“乌云”网站统计数据显示,从今年2月份开始,除了6月和8月,12306几乎每月都会有新的漏洞报告出来。其中,9月份的漏洞报告就达到6份之多,更有“12306系统可随意修改任何密码”的漏洞让众人咋舌。
乌云网站技术负责人直言不讳,从安全的角度看,这样的漏洞有点简单和低级。“一般网站上线前,公司都会对系统进行系列的严格的测试,所以这种简单的错误和漏洞就会避免。12306曝出低级错误,说明缺乏这种检测措施。”
据介绍,从12306曝出的漏洞类型看,主要为SQL注射漏洞、账户体系控制不严、系统/服务运维配置不当、设计缺陷/逻辑错误,其中,SQL注射漏洞这一类型的漏洞最多的,比例达到78%。
中国铁道科学研究院浮出水面
与此同时,这份提交了低级漏洞的报告,也让系统开发方中国铁道科学研究院浮出水面,因为12306上出现在的所有漏洞,都跟该学院直接挂钩。查阅资料,中国铁道科学研究院成立于1950年3月1日,2002年由事业单位转制为铁道部直属大型科技企业。在铁道科学研究院的官网上, 一个铁道部先进集体引起了记者的注意,该集体正是“全路客票发售和预订系统项目组”,于1996年组建而成,这个时间正是铁路客票系统最早期的开发时间。
承担开发建设中国铁路客票发售和预订系统任务的总体组,组员为抽调集中了中国铁道科学研究院、北方交通大学、长沙铁道学院、上海铁道 大学、西南交通大学、华东交通大学、大连铁道学院、兰州铁道学院、石家庄铁道学院及有关铁路局一批科技精英,历时4年时间开发。>>
12306网上订票系统升级回顾:新增“强制排队”
9月中旬,12306网站完成新一轮订票系统升级,新增“提交订单排队”功能。但有乘客反映,被“强制排队”后购买失败的概率很大。
网友纷纷吐槽,他们在购票排队上吃了“暗亏”,排队后提交订单,需要等待一段时间,但提交几次都会失败,耽误了时间,错过了购买其他车次车票的时间。有人开始猜测,这种情况存在内部暗箱操作。
9月20日,铁路部针对网友质疑“内部留票”的问题作出回应,坚决否认存在这一现象并表示网络瘫痪和反复排队是由于点击量过大造成的。
9月24日,网络购票对“强制排队”进行了修改,变为显示“余票”。
订票程序
注册车票预定选择车次、时间选择席别,输入姓名、身份证号订单提交:
因为“强制排队”更改为“余票显示”的缘故,需要注意的:
1、排队人数超过余票数,取消订单提交修改席别或重新选择车次;
2、显示余票数量,确定订单提交订单提交成功订单确认45分钟内在线支付票款付款后可到车站、代售点、取票机取票。