全球宕机
频发的“数字灾难”为信息技术安全敲响警钟
2024年07月27日  来源:齐鲁晚报
【PDF版】
     7月19日,美国微软公司旗下部分应用和服务出现访问延迟、功能不全或“蓝屏”等问题,对全球多国包括航空、铁路、医疗、金融、媒体等在内的多领域造成影响。为何此次故障波及规模如此之大?近年来各领域频频爆出的宕机事件,暴露出网络安全领域存在哪些问题?

微软崩了 全球乱了
  网络会议故障、酒店服务瘫痪、自助收款机卡壳……7月19日,对不少人来说充满了戏剧性。因微软公司旗下部分应用和服务出现访问延迟、功能不全或无法访问问题,“微软蓝屏”话题冲上热搜。
  作为目前世界上应用最为广泛的计算机桌面操作系统之一,微软视窗操作系统的稳定性,直接影响到一些国家重要机构、关键设施在内大量用户的日常运行或工作生活。
  一时间,从美洲、欧洲到亚洲的全球企业和用户,都无法正常访问系统,航空、铁路、媒体、金融、科技、医疗等几乎所有行业,均出现不同程度混乱。
  除受波及最广的澳大利亚外,英国伦敦证券交易所旗下Workspace新闻和数据平台遭遇故障,西日本旅客铁道公司列车行驶位置信息无法获取,美国超过3200架次航班被取消、超过11900架次航班延误……
  当地时间19日,美国电脑安全技术公司“众击”发表声明称,该公司对微软“视窗”系统发布的一个更新存在缺陷,导致相关用户在使用过程中出现系统崩溃、“蓝屏”等故障,目前相关更新问题已经修复。据称,这次事件与网络攻击无关。
  7月19日晚间,微软官方账号发布公告称,“根本问题已得到修复,但残余影响仍会继续影响一些Microsoft 365应用和服务。”
  据悉,“众击”公司在全球拥有近3万家客户,其中包括很多世界500强企业。
  舆论普遍批评“众击”和其他网络公司,在追求利润时牺牲了基本的安全原则,缺乏质量保障和有效的安全测试。专家表示,全球技术系统对少数几家科技公司软件的过度依赖,是导致此次问题如此严重的原因之一。
经济损失 或超10亿美元
  微软公司20日发布消息称,此次事故导致大约850万台视窗系统设备受到影响。美国研究机构安德森经济集团首席执行官估计,此次事件造成的经济损失很可能超过10亿美元。
  大范围宕机事件对美国航空业造成不小影响。美国航班跟踪网站数据显示,21日又有1461架次的美国国内、国际航班被取消,达美航空与联合航空两家公司所受冲击最大。
  英格兰国民保健署也发出警告,尽管受此事影响的医疗系统在大部分地区已恢复正常,但未来一段时间,英国一些地区的服务仍可能出现中断,特别是全科医生服务方面。专业人士预估,要平复这一错误给各行业带来的影响仍需不少时间。
ChatGPT近日也多次崩溃,AI安全如何跟上
  除了微软,全球最受关注的人工智能(AI)对话机器人ChatGPT近期也连续出现宕机事故。
  “ChatGPT又宕机了吗?我已经厌倦了这种挫败感”。6月17日,不少用户在社交媒体上反映,移动端和网页版ChatGPT,经常无法应答用户的提问,并提示各种错误。
  OpenAI对此次服务中断原因“守口如瓶”,有美国科技媒体推测,可能是受系统更新和服务器需求增加等多重因素影响。
  此次故障距离上一次,间隔还不到半个月。6月4日,ChatGPT也经历了长达数小时的宕机。有用户在移动端发问,“ChatGPT,你今天怎么了?”回复页面显示“服务器内部错误”字样。
  再向前追溯,ChatGPT的另一次严重宕机发生在2023年11月,当时服务中断了约90分钟。OpenAI首席执行官最初将服务器不稳定,归咎于OpenAI使用量“远超预期”。
  然而,后期调查发现,这次故障是由网络攻击造成的,这种攻击疑似为DDoS。DDoS是网络攻击的一种,旨在将系统资源消耗殆尽,使其无法回应服务请求。
  ChatGPT的多次故障并非个例。国内外一些知名大模型都曾出现过故障和服务中断问题,有时甚至产生“多米诺骨牌式”连锁反应。
  人工智能专家郭涛分析称,目前主流大模型出现故障的主要原因,包括流量过载、网络攻击、架构设计不合理、数据处理和资源分配不均,以及技术更新和兼容性问题。
  业内人士称,“ChatGPT最近发生的中断,为所有依赖AI工具来支持业务的人敲响警钟。想象一下,在产品发布或客户急需支持期间,失去对关键工具的访问权。这可能是毁灭性的。”
  大模型在金融、医疗等行业的应用,更是伴随着风险和挑战,任何故障都可能产生严重后果,因此确保数据的安全性和稳定性至关重要。
  今年早些时候,国内多家机构共同发布的一份报告认为,随着大模型能力的不断增强和适用范围的延伸,其在金融、医疗、广告、营销等商业领域的应用,使得大模型中存在的微小安全隐患,都会造成巨大损害,因而大模型安全问题引起广泛关注。

全球“宕机”事件为何屡见不鲜
  近年来,各大系统、应用出现宕机事件并不鲜见。今年3月,Meta公司旗下的“脸书”和“照片墙”等多款应用程序一度出现宕机,影响了全球数十万用户,持续了1个多小时。
  去年5月11日,很多苹果手机用户反映Apple ID崩了,登录不上,反复要求输入密码,貌似是全球宕机。Mac、iPhone、苹果官网都受影响,持续时间约55分钟。2023年12月,X平台在全球范围内出现宕机,影响了很多PC Web端及移动平台客户端的用户……
  在国内,7月2日,“小红书崩了”、“B站崩了”相继冲上微博热搜。据悉,当天B站App出现多项功能故障,小红书内容也无法刷新。  此次事件背后,阿里云也被牵扯其中。据阿里云客户服务中心反馈,北京时间2024年7月2日10:04,阿里云监控发现,上海地域可用区N网络访问出现异常,工程师正紧急处理……
  业内认为,云服务宕机是一件非常严重的事情,即使只断了1分钟,也可能造成难以估量的损失。
  服务器宕机的主要原因,包括系统升级失败、服务器故障、第三方服务故障、黑客攻击、磁盘空间耗尽、服务器Bug或错误行为、复制问题、数据丢失问题等。

“不要把鸡蛋放在一个篮子里”
  全球屡屡出现的“宕机”事件,不仅仅是技术问题,更是严峻的现实警示。科技高度发展的今天,人们已习惯了网络生活的便捷与高效。
  但反观之,当一切皆可编程,万物均要互联,小到普通人的衣食住行、工作休闲,大到整个社会的运转、生产,可以说,一切人类基本生存生活要素,都架构并依托于网络。而一旦技术本身出现问题,其影响之广、之深,往往超乎人类想象。
  正所谓“牵一发而动全身”,服务器过载、网络连接中断、存储设备损坏,任何一个环节出现纰漏,都可能导致服务突然终止、生活陷入混乱。
  《技术与文明》一书中提到,不做机器的奴仆和不过分迷信技术,否则人的福祉就不是因机器和技术而扩大,相反会因机器受到限制,甚至走到反面。相比于建构城市的钢筋水泥,虚拟空间的数字显得更为脆弱。我们虽然没有必要对技术应用因噎废食,但还是要时刻保持“晴天修房顶”的危机感。
  中国国际问题研究院助理研究员谢卉表示,私营部门在技术发展和创新上处于前沿,和公共利益的联系也越来越紧密,因此有必要加强对私营部门的监管,让他们投资建设更为可靠的网络基础设施,减少由单点故障带来的风险。
  各国也应加强国际合作,比如建立跨国信息共享平台,加强对网络威胁的感知和响应,或者共同开发先进的网络安全防护系统和技术,共同应对网络安全的挑战。
  此外,鼓励全球网络安全企业公平竞争,加强多层次的防御策略,“不要把鸡蛋放在同一个篮子里”,可以规避系统性风险


本稿件所含文字、图片和音视频资料,版权均属齐鲁晚报所有,任何媒体、网站或个人未经授权不得转载,违者将依法追究责任。
网友为此稿件打分的平均分是:
齐鲁晚报多媒体数字版
按日期查阅
© 版权所有 齐鲁晚报
华光照排公司 提供技术服务