Open Grid Scheduler

構成
Open Grid Schedulerは以下のホストによって構成される.
 * マスターホスト : マスターデーモン sge_qmaster, スケジューラ デーモン sge_schedd
 * 実行ホスト : バッチジョブが実行されるホスト 実行デーモン sge_execd
 * 発行ホスト : ジョブを発行するホスト.
 * 管理ホスト : grid engineシステムの管理権限を持つホスト.

3つのデーモンが Grid Engine システムの機能を提供します.
 * sge_qmaster – マスターデーモン
 * クラスタの管理およびスケジューリング処理の中心となる sge_qmaster は、ホスト、キュー、ジョブ、システム負荷、およびユーザーの権限についてのテーブルを維持します. sge_qmaster は、sge_schedd からスケジューリングに関する決定を受け取り、適切な実行ホストの sge_execd に処理を要求します.
 * sge_schedd – スケジューラデーモン
 * スケジューリングデーモンは、sge_qmaster によってクラスタのステータスの最新ビューを維持します. スケジューリングデーモンは、スケジューリングに関する次の決定を行います.
 * どのジョブがどのキューに振り分けられるか
 * 共有、優先順位、または期限を維持するためにどのようにジョブを再整理し、優先順位を再設定するか
 * デーモンはこれらの決定を sge_qmaster に転送し、sge_qmaster は、要求された処理を開始します.
 * sge_execd – 実行デーモン
 * 実行デーモンは、ホスト上のキューインスタンスおよびこれらのキュー インスタンス内のジョブの実行を担当しています. 実行デーモンは、定期的にジョブステータスまたはホストの負荷などの情報を sge_qmaster に転送します.

一台構成 (Ubuntu Linux 10.04, 12.04)
grid engineは一台のマシンで使ってもそれなりに便利. バックグラウンドでバッチプログラムをたくさん走らせる場合の管理が楽になる.

インストール
一台のマシンでmasterとclientの両方を行う場合、 単純にgridengine-*をインストールすればよい.

デーモンの起動
デーモンが起動していることを確認する. (デフォルトではsge_scheddがありませんが. )

発行ホストの追加

 * 発行ホスト一覧 qconf -ss
 * 発行ホスト削除 qconf -ds

キューの作成

 * キュー一覧 qconf -sql
 * キュー削除 qconf -dq all.q
 * キュー設定編集 qconf -mq all.q

qconf -aq default.q 等と打つとエディタが立ち上がり、設定を編集できる.
 * 設定ファイルの意味 : man queue_conf
 * 例えば http://ait.web.psi.ch/services/linux/hpc/merlin3/sge/admin/sge_queues.html を参照のこと.

とりあえず と設定しただけ. 一台構成ですから. ここをGNU nano上で編集してそのままセーブすればよい. (/tmpの下のなんか変な名前のファイルとしてセーブするか聞かれるので、そのままの名前でセーブ）デーモンの再起動などは必要ない. 設定はファイルをセーブしただけで反映される.
 * hostlist NONE => yourhost
 * slot    1    => 8