ここをクリックしてお気軽にお問い合わせください!

クラウドとオンプレ

コンピューターシステムの業界ではサーバー管理といえばAWSやAzure、GCPなどクラウド全盛の時代ですね。
今やインフラエンジニアとしては仕事をそちらのサービスに奪われているのではないでしょうか?

SI業界でのクラウドの対義語は通称オンプレと言います。オンプレミス(on-premises)の略で自社環境に物理的にサーバーを置いて運用すると言う形態ですね。

サーバーは大量の処理をするケースが多いので物凄く電力を使います。電力を使うと熱が発生する為に冷却が必要になるんですよね。昨今、ゲーミングPCなどを自作されている方はこの熱対策に一苦労されているのではないでしょうか?
熱暴走なんて言葉があるくらいでマシンに大量の熱が生じるとありもしない挙動を起こしてしまいます。

その為、オンプレ運用している会社は”マシン室”と呼ばれるサーバーを置く部屋を別途用意するケースがほとんどだと思います。マシン室は常時一定温度を保つようにし、通称”フリーアクセス”と呼ばれる二重床構造で地面に這うケーブルを整理しています。
映画とかで企業のマシンルームにハッキングに入ったりする部屋、あのなんか縦長の機械ばかりの部屋、あれがサーバールーム(マシン室)です。意外に思われるかも知れませんが、コンソール(液晶モニタやキーボード)とかは通常のサーバーでは必要ないんですよ。コンソールが必要になるのは対人間の場合だけ、サーバーとサーバーの通信に関してはケーブルを繋げばデータを処理していくれるので不要となります。

Server room

リアルにこんな部屋。

ここでちょいと昔話を。
僕がまだ新人だったころ、福島のあるお客様のシステムを開発しておりました。当時のサーバーはUNIXサーバーと言うものでして今ではあまり使われていないかも知れませんが、macOSやLinuxの源流となるようなOSでした。
性能としては今でこそ家庭用パソコン以下かもしれませんが、当時は「それが無いと処理しきれない」と言う感じでした。当時のクライアントPCの性能は驚くほど低かったのです。

無事、システムは完成し僕は福島からまた関東に戻ってきて別件の仕事をしておりました。それからしばらく経ってからの事、「福島のシステム、サーバーがUNIXだけだと性能が出なくなった。汎用機にも対応させられるようにするぞ」とまた呼ばれました。

汎用機とは通称”ホストコンピューター”と呼ばれるもので、メインフレームとも呼ばれています。当初のコンピュータエンジニアはこのメインフレームをお客様にレンタルしてそのレンタル料で売上を賄っていました。ソフトは無料。僕たちは月額で億を稼いでくれるメインフレームを継続利用してもらうためにシステムを作っていたんです。今とは逆みたいな考えですね。

Host machine

当時のラスボス、メインフレーム!

それほど当時のメインフレームは強かったらしいです。

僕が担当した頃のメインフレームのレンタル料は覚えてないんですけれど当時の営業が今の自社の営業のトップにまで登り詰めた事を考えると相当美味しい商売だったのかもしれません。

さて、また福島に呼ばれたのですが、今回はサーバー”変更”ではなくてサーバー”増設”と言う扱いをとる事にしたとの事。つまり従来のUNIXにもアクセスできて、今度新設するホストにもアクセスできる仕組みにしろ、と。
ホスト側のプログラムは僕は未経験だったのでほんの少ししか書けませんでしたが、クライアント側のプログラムは使い分けずに設定だけでUNIX、ホストを意識させずにアクセスする仕掛けを作るのは結構大変でした。

…とこう書くとタダの昔の自慢話になってしまうのですが、ここからは失敗の話。晴れてホストを導入する事が決まった時にお客様のマシン室ってもうぎゅうぎゅうだったんですよ。簡単に言うと”導入したい汎用機を置く場所が無い”状態。本末転倒とはこの事を言うのかも知れません。
そこで我々がとった方法は……「発電容量を考えるとどうしてもホストの方が電力を喰うからUNIXサーバーをマシン室の外に出してそこにホストをいれる!」と言うものでした。当時、そのシステム用に使っていたUNIXはAP/DBサーバー合わせて4台あったのでそれをマシン室から出すとちょうどホストが入る、と。「んな無茶な!」って感じですが、実際そうだったのだから仕方ありません。テトリスとかぷよぷよみたいにちょうどUNIXサーバーを外に出せばホストが置けたのですから。結果、不格好ではありますがマシン室の入り口のドアの横の壁に伝うように4台のUNIXサーバーを配置しました。僕がUNIXサーバーだとしたら相当な屈辱を味わう形になります。

今、自宅で普通にパソコンを使ったりノートパソコンを使われている方ってあんまり冷却って意識した事ないと思うんですよ。夏にスマホ使ってて「なんか異常に熱く無いか?」って思う事がある位だと思います。そう、夏……。

ある熱い夏の夜でした。いつものようにホスト対応にプログラムを修正していた時です。プロジェクトメンバーの誰かが「あれ?39番のサーバー生きてます?なんか繋がらなくなって…」と言いました。言い忘れましたが、プロジェクトルームとマシン室は結構距離が離れています。またUNIXサーバーは当時連番で下2桁が39,40,41,42番と呼ばれていました。

僕もさっそく確認してみます。ターミナルを立ち上げ39番サーバーに繋ぐ…確かに繋がりません。ただ40番〜42番は繋がりました。
「39番、ダメっぽいですね。ただ、40〜42番は繋がりました」と僕が言うと、先輩が「40番繋がらないよ」と。それに応じるように他の人が「さっきまで繋がっていたけれど41番、42番もダメだ…」と。

Eva maya

「39番から42番のサーバー、全台アクセスできません!!」

僕たちは一瞬焦りました。「いったいマシン室(の外の壁に置いたUNIXサーバー)で何が起こっているんだ……」と。

と言ってもゾンビ物のホラー映画では無いのでみんなで実際に行ってみる事に。
結果、一言で言うとマシンが異常な温度になったので強制的に落ちただけでした。通常、こういうサーバーはシステム内で温度管理がされており一定の温度を超えた場合、安全策として自分でシャットダウンを行うように作られています。勝手に電源が落ちるとデータが壊れるので「危ないから、そろそろ歯磨いて風呂入って寝ますわ」と言う行動を起こすように作られているのです。

ただ、今回は急激に温度が上がってしまいその猶予が無かったみたいです(それはそれで問題ですが)。39番から順番に死んでいったのは物理的に一番奥(部屋の隅で一番熱が篭るところ)から順番に死んでいったみたいです。一斉に全部死んだのならなんか分かるんですが1台ずつ落ちていく様に当時戦慄が走ったものです。

……ちなみに後日譚なのですが、とは言えマシン室は一杯ですぐに拡張できないため、UNIXサーバーが置いてある場所に応急プロジェクト部屋が作られ、扇風機と温度計が置かれる事になりました。ただ置いただけではまた同じような事が起こるのでそこに常勤するメンバー(1〜2名)を配置して仕事するという実にアナログな手法での対策。たまにその部屋に仕事で行くと「あちー」と言いながら団扇を仰ぐメンバーがいるのでした。

ちなみに、実話です。
僕はデータ流出とか大規模システム障害の件があるのでクラウドも程々にと思う古い考えですが、オンプレはオンプレでシステム運用以外に、物理的な問題もあったりするのですよと言うお話でした。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です