全銀システムが止まると日本の経済活動に壊滅的な影響(その3)

いろいろ報道されていますが、原因の詳細はまだ分からないようです。

ITmedia NEWS (2023/10/18)
全銀ネット障害、いまだ根本原因特定できず メモリ不足の指摘には「分からない」

全国銀行協会(以下、全銀)は10月18日、銀行間の送金を行う「全国銀行データ通信システム」(全銀ネット)で10日から11日にかけて発生した障害について会見を行い、現状を説明した。未だに根本的な原因は特定できず、暫定的な“代替対応”のまま運用しているという。

不具合はシステムのリプレース直後に発生した。全銀は7~9日の3連休を利用し、加盟14銀行の中継コンピュータを「23シリーズ」と呼ぶ新機種に更新した。それまでの「17シリーズ」は各機関に設置していたが、今回は全銀センターに集約して運用する形にした。
9日までに製品単体試験から相互運転試験までいくつもの試験を行っていたが、不具合は見られなかったという。
しかし10日午前8時30分。システムが通信を始めると、10行の中継コンピュータで電文の送受信ができなくなった。りそな銀行や三菱UFJ銀行などで他行宛の振込取引ができない状態になった。

バックアップ体制は有効に働かなかった。ハードウェアは二重化していたものの、今回はハードではなくソフトの故障だったため、両方で不具合が発生した。

原因はテーブルの破損、ではその原因は?
全銀は23シリーズの導入にあたり、手数料の金額入力を、1)金融機関が予め電文に金額を入力して中継コンピュータに送信する、2)予め中継コンピュータに設定されたテーブルを参照し、コンピュータが電文に金額を入力する、という方法を用意していた。今回のトラブルは、2)を選択した10行で発生している。

全銀によると、中継コンピュータでエラーが発生した直接の原因は、銀行間手数料を入力する際に参照するインデックステーブルが壊れていたこと。一部金融機関のコードが読み取れず、エラーが発生した。
小林氏は「展開されたテーブルが不正な状態になっていた。事前準備の段階で何らかの原因で壊れた」とみている。
一方、一部報道ではメモリ不足や64bit OSへの移行を問題視しているが、小林氏は「現時点でそれがテーブルにどう影響したか分からない」としている。



システム障害に係る対応状況について

全ての面で二重化していると宣伝しているバックアップ体制は、実はハードウェアだけで、ソフトウェアの事は考えていなかったようです。

かなりお粗末だと思いますが、それはそれとしても、障害が起きてから1週間経って、まだ原因の詳細が分からないというのも、かなり問題のような気がします。

もしかして、何十年も前に実装された処理で、もう詳細を分かっている人が誰もいないのでしょうか?
しかも、設計資料はほとんど残っていなくて、ソースコードはスパゲッティ状態。
そんな状況だったら、1週間以上かかることもあるかもしれません。

もし、全銀システムのソフトがそんな状態だとしたら、また何かのきっかけで不具合が出てもおかしくないと思います。

全銀システム、そして日本のITインフラ、大丈夫でしょうか・・