TF報告(下書き)

見直しを進めるに当たり、現行システムの運用ドキュメントやソースコードを一か所に収集しました. （一部ライブラリなどは未包含. ）
 * ドキュメントとソースコードを収集


 * DDBJに対してIN/OUTとなるデータの収集
 * DDBJ関係者への見える化、データ移行時の簡便さ、作業者のトライアルを簡便にするため、INSD、特許庁などの交換データを一か所に収集しました. （DDBJ,EMBL-Bank,GenBankのリリースデータはサイズ大のため割愛. ）


 * 定期リリース業務詳細フローの確認
 * 収集した手順書、利用プログラムのソースコードを逐次確認し、定期リリース業務調査と文書化作業を行いました. プログラムについてはなぜそのような実装になっているかの経緯が失われてしまっており、プログラムの明確な意味が不明になってしまっている箇所もあった為、極力現状実装に依存しない形で、収集可能な範囲の情報をもとに、意味的に当該処理で何ができていればいいのかを考慮しながら処理の流れを文書化しました (定期リリース) . 作成した文書をもとに、今後検証作業を行っていきます.


 * 現行定期リリース業務のシステム稼働状況分析
 * 現行の定期リリース業務時の、当該業務サーバの各種負荷状況を確認し、処理のボトルネックを分析しました. （現行システム調査）


 * 新規分散ソフトウェア技術のフィージビリティ調査
 * 大容量のリリースデータに対して、コストパフォーマンスの高い小規模サーバで高速処理が可能であるよう、Hadoop等の新規分散ソフトウェア技術の適用可否調査を行いました.


 * DDBJ査定業務TSUNAMI Dataflowログ・メーリングリストログの解析
 * DDBJ査定業務分析のためにログの解析調査を行いました.


 * 海外他サイトのITインフラ状況の調査
 * Sanger、BGIなど、海外のNGS関連サイトのITインフラ状況について調査しました. (海外サイト状況)