我,被新京报的记者采访了。

2022/01/17

推荐阅读: 《西安一码通又崩了,每天生活在全国人民的笑话中。。。》 《天津、广东一码通也崩了。。。》

1.2名记者找我

前两天,我打开知乎想看看有什么新闻的时候,发现知乎有两个私信,随手就点开看了一下。

发现新京报的记者和澎湃新闻的记者,都在知乎上给我发了信息,其中一个还在知乎上进行了付费提问。

根据留言,大家也能看出来是为什么,前一段时间西安一码通崩溃的时候,我写了一篇文章:《西安一码通崩溃的原因》

这篇文章在公众号上有超过10万+的阅读,而我将这篇文章同步到知乎上的一个问题下面,竟然超过了100万+的阅读量。

整个采访的经历,在给B站录了视频和大家分享,感兴趣的小伙伴可以在 B站搜索:我是纯洁的微笑,关注后查看。

2.根本原因

我在网上看,大家针对此事件讨论了很多内容,技术圈的朋友们都在分析是什么导致的崩溃。

比如,有的朋友认为崩溃是接口直接传输的是图片,或者说图片没有压缩,还有的朋友分析是接口没有走 CDN。

我觉得这都是原因的一部分,但并不是崩溃的最根本原因。

最根本的原因是:系统架构的设计不足以应对高并发访问,导致系统过载崩溃。

架构设计不完善,导致出现问题的时候,不能及时通过水平扩容的方式来承载更多的流量访问。

这两天我看很多其它地方的健康码或者核酸检测系统也都崩溃过,也并不是只有西安才会出现这样类似的问题。

只不过每地的情况都不一样,比如有的直接部署了6个核酸检测系统,有的出现问题后在很短的时间内修复。

但更狠的是,有的直接让关键字在微博成了敏感词。。。

另外,我在知乎上还看到一名防疫人员吐槽,现在很多当地的防疫系统自动化还非常落后,系统与系统之间没有对接。

导致非常大的人力浪费,这些可能都是后期需要持续完善的部分,一味的批评并不能真正的解决问题。

但足够的关注和重视,让专业的人来做专业的事情,就能促进这个系统不断的走向完善,健壮。

技术真的可以改善我们的生活,请一定要把它用在刀刃上。

3.经验

健康码/核酸检测频繁的出问题,其实可以给我们带来一些启发和经验。

而这个经验,也是我作为一个曾经在职场工作了10年的程序员老兵,在互联网大型项目的实施过程中最深有体会的几点。

第一,设计一个好的系统架构非常非常重要。

可能在日常功能上使用无感,但如果流量突增的时候,大的需求变更,就可以感受到,一个强大的系统架构有多么重要。

另外到了今天,设计一个分布式架构真的不是那么的难,有很多很多成熟的技术方案可以选择。

西安一码通团队之所以没选择,一方面可能是团队对这些技术栈不是那么熟悉,传统外包项目都以单体项目为主;

另一封面,可能一码通项目上线周期比较多,团队只能用最快段方式先完成需求。

第二,全面的压力测试非常重要。

系统在上线之初一定要做压力测试,只有经历过严格的压力测试,才能发现高并发下隐藏的系统缺陷,将问题缺陷问题消灭在萌芽中。

第三,系统运维和紧急预案很重要。

像这种关系到国际民生的系统,要设置24小时的监控机制,监控系统在关键节点的 每一个指标,一但出现异常需要立刻组织技术团队进行修复。

同时做好紧急预案,一但系统在短时间内无法恢复正常,需要设置一个第二个方案、保证最核心功能够对外提供支撑。

比如,系统功能降级,保证核心功能使用,或者提供其它工具化的支持。 为全面恢复提供时间上的支撑。

所以,一个大型系统能够稳定运行,是一个比较复杂的工程。

需要在项目开发之初设计好架构,研发中保证代码质量,交付之前进行压力测试,交付之后持续跟踪,同时制订好紧急预案,保证突发情况下,能够实现快速应变。

同是程序员的你,还有哪些看法,欢迎在留言区探讨。

< END >

程序员摸鱼基地成立了!

纯洁的微笑读者交流群(摸鱼、白嫖技术课程为主),又不定时开放了,感兴趣的朋友,可以在公号内【了不起的程序员】回复:666


微信扫描二维码,关注一个有故事的程序员

(点击了解: 关于程序员的专属导航!

Show Disqus Comments

Post Directory

扫码关注公众号:纯洁的微笑
发送 290992
即可立即永久解锁本站全部文章