2006スパコン仕様書中バンク事業部

=４－２－２DDBJ業務支援= ＤＤＢＪにおいて独自に開発した(OK注:疑問あり）ツール群の保守と機能強化および必要なツール群の新規開発を行いながら、以下の（１）～（７）に示す業務を遂行すること.

（１）DDBJデータ登録システムの運用・保守・機能拡張

 * 1) SAKURAシステム
 * 2) TSUNAMIシステム
 * 3) 大量登録更新システム
 * 4) EMBLおよびGenBankからの日更新データ取得システム
 * 5) EMBLおよびGenBankとの連携によるデータ枇造の改造ﾄなど外部仕様ファイルの変換システム

（２）データベース定期リリース作成作業

 * 1) EMBLおよびGenBankのデータ収集およびフォーマット変更
 * 2) ＤＤＢＪリリースデータの作成
 * 3) 各種データ形式での公開 INSD-XML形式、FASTA形式、CDS配列形式

(3）データベース公開作業

 * 1) DDBJ，EMBLおよびGenBankの日更新データの公開
 * 2) anonymousFTP公開
 * 3) fasta用/blast用データベース作成 (format DB)
 * 4) キーワード検索システム用データ作成
 * 5) 各種データ形式での公開 DDBJ-XML形式、INSD-XML形式、ＦＡSTA形式、ＣＤＳ配列形式
 * 6) ＷＧＳデータ公開
 * 7) ・MGAデータ公開
 * 8) 各種データベース公開 PATHWAY，PFAM，PMD，PRINTS，PRODOM，PROSITE，FSSP，HSSP，ＩMGT，MICROBE， DAD，ＰDB，UniProt’kazusaDNA，BLOCKS，ENZYME，EPD，NICEDOM,
 * 9) エントリ検索システム(getentry）
 * 10) Version番号による検索システム(getversion）
 * 11) フィールド指定による高速キーワード検索システム(ARSA）
 * 12) 遺伝子配列への正規表現によるパターンマッチング(SQmatch）
 * 13) ＰDB検索システム(キーワード検索、一次構造/二次構造/立体構造表示)(PDBRetriever）
 * 14) 生物種情報検索システム(TXSearch）
 * 15) データベース検索/配列解析システム(FLAT）
 * 16) エントリ名/DEFINITION行/TITLE行/著者名/雑誌名/Accession番号/生物種名/配列長／によるデータベース検索システム(karashi）
 * 17) PubMedCentral
 * 18) TraceArchive

(4)相同性検索システム

 * 1) ローカルホモロジーサーチシステム(fasta）
 * 2) Smith&Watermanのアルゴリズムによるローカルホモロジーサーチシステム(ssearch）
 * 3) 高速ローカルホモロジーサーチシステム(NCBI-BLAST2）
 * 4) 繰り返し処理によるスコアマトリクス最適化機能を持つローカルホモロジーサーチシステム(PSI-BLAST2）
 * 5) 近縁遺伝子配列のグループ化による圧縮データベースへのBLAST検索機能と多重整列データベース閲覧機能(CAMUS）
 * 6) ベクター配列のホモロジーサーチシステム(DDBJVectorScreeningSystem）

(5)遺伝情報解析システム

 * 1) マルチプルアラインメント作成／進化系統樹推定／bootstrap検定システム(clustalw）
 * 2) ３Ｄ－１Ｄ法による蛋白質の立体構造予測及び配列解析システム(Libraｌ）
 * 3) 最尤法による進化系統樹推定機能(fastDNAlnl）
 * 4) 進化系統樹推定・解析機能パッケージ(phylip）
 * 5) 進化系統樹推定・解析機能パッケージ(molphy）
 * 6) 最尤法による進化系統樹推定機能(puzzle）
 * 7) 分子進化解析機能パッケージ(0DEN）
 * 8) 分子進化解析機能パッケージ(IDEN）
 * 9) ケノム情報ブローカーパッケージ(GIB）
 * 10) MHC結合ペプチド予測(Libscore）
 * 11) モチーフ検索システム(HMMER）

（６）業務アプリケーションの修正版の適用
（１）から（５）項目で使用している業務アプリケーションの妓新の修正版を迅速に適用すること.

（７）障害対応
２４時間連続運用するシステムなので、障害が発生した場合は、障害が起きたデータファイルも含めて遅延なく迅速に回復すること. [edit] ４－２－３その他

（１）ＯＳのバージョンアップやシステム変更等を行う場合には十分な体制がとれること. （２）連絡経路を明らかにし、障害発生時には十分な連絡が行えるようにすること. （３）本システムで使用するＯＳとプログラムに関する障害・修正などの情報を、本研究所担当者に適宜提供すること. また、原則として１年に１回以上、０sやプログラムの障害修正のためのメンテナンス作業を実施すること. （４）ＳＥ等の支援に関しては、本研究所向けの具体的な計画、体制ならびに内容について明示すること. （５）情報通信設備等の既設機器との接続に関しては、受注者の負担において行うものとする. = ４－３マニュアル等の提供= （１）マニュアルは、日本語又は英語で記述されていること. マニュアルは、オンラインマニュアルにより提供すること.

=４－４ソフトウエア資産の移行= 本研究所がこれまでに開発ならびに収集してきた様々なプログラムを含む各種ソフトウェア並びにデータ資産等（研究用プログラム、データベース、データベース椛築ツール、利用者サービス用プログラム、各種流通プログラム、ＤＤＢＪが構築管理しているデータなど）を、新システムに円滑に移行･再稼動できることが研究者の研究活動を阻害しないために重要である｡このため、システムの更新期間中に、現有資産の移行と再稼動を速やかに行うものとする. 現有システムからの資産の移行と再稼動については､それらの方法を具体的に明示し､万全の対策を講ずること. 移行が必要な資産については以下を参照すること. また、大規模解析サーバーでは、現有のVPP5000上でユーザーが作成した既存プログラムやデータを本システムに適した状態に変換するツールを用意すること. 用意したツールを用いても非互換がある場合は、全面的に移行作業に協力すること.

(1)DDBJデータ登録システム

 * 1) SAKURAシステム（Webインターフェース、アプリケーション、定時処理用スクリプト群、登録用データ）
 * 2) SAKURAシステム開発環境（Webインターフェース、アプリケーション、定時処理用スクリプト群、登録用データ）
 * 3) TSUNAMIシステム（アプリケーション、定時処理用スクリプト群、登録用データ）
 * 4) 大量登録更新システム（アプリケーション、定時処理用スクリプト群、登録用データ）随時変更されるSEQIN、特許庁フォーマットなど外部仕様ファイルの変換システム（各種 ツール、定時処理用スクリプト群、登録用データ）
 * 5) ＥＭＢＬおよびGenBankからの日更新データ取得ジステム（各種ツール、定時処理用スクリプト群、登録用データ）
 * 6) ＥＭＢＬおよびGenBankとの連携によるデータ構造の改造（各種ツール、定時処理用スクリプト群）

(2)データベース定期リリース作成

 * 1) EMBLおよびGenBankのデータ収集およびフォーマット変更（各種ツール）
 * 2) ＤＤＢＪリリースデータの作成（各種ツール）
 * 3) anonymousFTP公開（各種ツール、リリースデータ）
 * 4) ０DEN/karashi用キーワード検索インデックス作成（各種ツール）
 * 5) fastａ用/blast用データベース作成（各種ツール）
 * 6) キーワード検索システム用データ作成（各種ツール）
 * 7) 各種データ形式での公開（各種ツール） DDBJ-XML形式、INSD-XML形式、ＦＡSTA形式、CDS配列形式

(3)データベース公開

 * 1) DDBJ，ＥＭＢＬおよびGenBankの日更新データの公開（各種ツール、定時処理用スクリプト群）
 * 2) anonymousFTP公開（各種ツール、定時処理用スクリプト群）
 * 3) ０DEN/karashi用キーワード検索インデックス作成（各種ツール、定時処理用スクリプト群）
 * 4) fastａ用/blast用データベース作成（各種ツール、定時処理用スクリプト群）
 * 5) キーワード検索システム用データ作成（各種ツール、定時処理用スクリプト群）
 * 6) 各種データ形式での公開（各種ツール、定時処理用スクリプト群） DDBJ-XML形式、INSD-XML形式、ＦＡSTA形式、ＣＤＳ配列形式
 * 7) WGSデータ公開（各種ツール、定時処理用スクリプト群）
 * 8) MGAデータ公開（各種ツール、定時処理用スクリプト群）
 * 9) 各種データベース公開（各種ツール、定時処理用スクリプト群）DAD，ＰDB，UniProt’かずさDNA，BLOCKS，ENZYME，EPD，FSSP，HSSP，ＩMGT，MICROBE，NICEDOM，PATHWAY，ＰFAM，PMD，PRINTS，PRODOM，PROSITE

（４）DDBJ公開ポータルサイト

 * 1) ポータルサイト（アプリケーション、各菰ツール、定時処理用スクリプト群）

(５）検索・解析サービスシステム

 * 1) キーワード検索システム
 * 2) ａ）エントリ検索システム(getentry）（Webインターフェース、アプリケーション、定時処理用スクリプト群、検索用データ）
 * 3) ｂ）Version番号による検索システム(getversion）（Webインターフェース、アプリケーション、定時処理用スクリプト群、検索用データ）
 * 4) ｃ）フィールド指定による高速キーワード検索システム(ARSA）（Webインターフェース、アプリケーション、定時処理用スクリプト群、検索用データ）
 * 5) d ）遺伝子配列への正規表現によるパターンマッチング(SQmatch）（Webインターフェース、アプリケーション、定時処理用スクリプト群、検索用データ）
 * 6) ｅ）ＰDB検索システム(キーワード検索、一次構造/二次構造/立体構造表示)(PDBRetriever）（Webインターフェース、アプリケーション、定時処理用スクリプト群、検索用データ）
 * 7) ｆ）生物種情報検索システム(TXSearch）（Webインターフェース、アプリケーション、定時処理用スクリプト群、検索用データ）
 * 8) ｇ）データベース検索/配列解析システム(FLAT）（アプリケーション、定時処理用スクリプト群、検索用データ）
 * 9) ｈ）エントリ名/DEFINITION行/TITLE行/著者名/雑誌名/Accession番号/生物菰名/配列長／によるデータベース検索システム(karashi）（アプリケーション、定時処理用スクリプト群、検索用データ）ｔ
 * 10) 相同性検索システム
 * 11) ａ）ローカルホモロジーサーチシステム(fasta）（Webインターフェース、アプリケーション、定時処理用スクリプト群、検索用データ）
 * 12) ｂ）Smith&Watermanのアルゴリズムによるローカルホモロジーサーチシステム(ssearch）（Webインターフェース、アプリケーション、定時処理用スクリプト群、検索用データ）
 * 13) ｃ）高速ローカルホモロジーサーチシステム(NCBI-BLAST2）（Webインターフェース、アプリケーション、定時処理用スクリプト群、検索用データ）
 * 14) d）繰り返し処理によるスコアマトリクス最適化機能を持つローカルホモロジーサーチシステム(PSI-BLAST2）（Webインターフェース、アプリケーション、定時処理用スクリプト群、検索用データ）
 * 15) ｅ）近縁遺伝子配列のグループ化による圧縮データベースへのBLAST検索機能と多重整列データベース閲覧機能(CAMUS）（Webインターフェース、アプリケーション、定時処理用スクリプト群、検索用データ）

ベクター配列のホモロジーサーチシステム(DDBJVectorScreeningSystem）（Webインターフェース、アプリケーション、定時処理用スクリプト群、検索用データ）


 * 1) 遺伝情報解析システム
 * 2) ａ）マルチプルアラインメント作成／進化系統樹推定／bootstrap検定システム(clustalw）（Webインターフェース、アプリケーション、定時処理用スクリプト群）
 * 3) ｂ）３Ｄ－ｌＤ法による蛋白質の立体構造予測及び配列解析システム(Libraｌ）（Webインターフェース、アプリケーション、定時処理用スクリプト群、検索用データ）
 * 4) ｃ）最尤法による進化系統樹推定機能(fastDNAml）（アプリケーション）
 * 5) d）進化系統樹推定・解析機能パッケージ(phylip）（アプリケーション）
 * 6) ｅ）進化系統樹推定・解析機能パッケージ(molphy）（アプリケーション）
 * 7) ｆ）最尤法による進化系統樹推定機能(puzzle）（アプリケーション）
 * 8) ｇ）分子進化解析機能パッケージ(0DEN）（アプリケーション）
 * 9) ｈ）分子進化解析機能パッケージ(IDEN）（アプリケーション）
 * 10) ｉ）ゲノム情報ブローカーパッケージ(GIB）（Webインターフェース、アプリケーション、定時処理用スクリプト群、データ）
 * 11) j）ＭＨＣ結合ペプチド予測(Libscore）（アプリケーション）

* (6)利用者資源
 * 1) ユーザーカウント
 * 2) ○ユーザーホームディレクトリ
 * 3) ○ メールスプール
 * 4) ○ＤＮＳ、ＮＩＳ等のネットワーク環境
 * 5) ○ファイアウォールのセキュリティポリシー
 * 6) ○バックアップ装置に保管されているデータ