Node.jsを使ったWebアプリを運用していると、たまにUncaughtExceptionが発生してアプリケーションが停止してしまうことがありました.

手動で再開するまで全くアプリが使えなくなってしまうのは問題なので、これに対処する方法をまとめました.

1.問題

Webアプリを実行していると、稀にuncaughtExceptionが発生してました.

Node.jsのドキュメントを確認すると、以下のような記述があります.

Event: ‘uncaughtException’

発生した例外がイベントループまでたどり着いた場合に生成されます。 もしこの例外に対するリスナーが加えられていれば、 デフォルトの動作 (それはスタックトレースをプリントして終了します) は起こりません。

一度uncaughtExceptionが発生してしまうと、デフォルトではアプリケーションが終了してしまいます.

常に提供したいサービスであれば、例外のデバッグを行いつつもとりあえずはアプリケーションを再起動する必要があります.

(* 取り返しがつかない処理が存在するアプリであれば、停止させたままとする方がいい場合もあります.問題の影響が把握できれば、一旦再起動して後でデータをリカバリするという考え方も有るかと思いますが)

 

2.解決法

  1. node.jsで利用できるモニタリングソフトウェアを利用する

有名なのはnodemon, foreverです.

    • nodemon でアプリケーションを実行する例

    nodemon ./server.js

    • forever でアプリケーションを実行する例

    forever server.js start

  1. cluster を利用して再起動する例

コーディング例は以下のようになります.

WORKERSの値若しくはcpuの数だけworkerプロセスを起動し、そのプロセスがエラーで落ちたときに代わりのプロセスを起動しています.

 

通常はこのいずれかで解決することが望ましいのですが、さくらインターネットのレンタルサーバではこれらの対処を行うことができませんでした.

サーバを立ち上げるとすぐ Killed: 9 と表示されていたため、おそらくプロセスの負荷が高すぎるために監視に引っかかったのだと思われます.

* 試しに2. のクラスター(プロセス)数を1つまで減らしましたが、killされてしまうことに代わりはありませんでした.元のアプリケーションに比べて監視用のプロセス分、負荷が上がっているためと思われます.

 

3.より負荷の少ない対処方法

ここではprocess.on(‘uncaughtException’, function(err){});を利用した例を紹介します.

但し、uncaughtExceptionを利用した例外処理は雑なものとなってしまうため公式ドキュメントではdomainの利用が推奨されています.

ポイントは、例外発生時に元のサーバをcloseしている点です.

これを忘れると既にAddressが利用されているためエラーが発生してしまいます.

 

 

 

Leave a Reply

Your email address will not be published. Required fields are marked *