zkSync 团队发布了关于昨天 zkSync Era 宕机事件的详情,并表示已经对监控系统进行了提升。目前 zkSync Era 仍处于 Alpha 阶段,团队不能完全排除短期内偶尔出现问题的可能性,但“正在不断提升和完善系统”,以降低发生问题的频率。
北京时间4月1日7:52至12:02,zkSync Era 主网出现宕机,原因是区块队列数据库发生故障,导致停止出块。而数据库警报因为能连接到数据库而没能触发。服务器 API 并没有受到影响,可以将交易添加到内存池。尽管团队对所有组件布置了全面的监控和警报,但由于 API 正常,因此警报均没有触发。此外事发时,zkSync 团队均处于凌晨2点左右,均未在线。
最终整个修复过程仅花费5分钟。团队表示已经对数据库监控进行了提升,即便数据库出现问题,监控代理也能连接到数据库来收集指标。如果数据库监控代理发生故障,团队会得到警报。同时团队表示,要从长期解决网络可用性的问题,唯一的方案是定序器的去中心化,这也将是 zkSync 工程团队接下来的首要任务。