各種解析サービスとFTPダウンロードの利用統計

=各種解析サービスとFTPダウンロードの利用統計= それぞれのサービスの利用度数とトレンドを下に示しました. 出来るだけ質問数で利用度を比較できるようにいくつかのサービスPageviewのみの記録しかないものについては典型的な質問を想定してquery数を算出しています. <検索サービスDDBJ> getentry<サービス内容> DDBJエントリーのIDを受けてフラットファイルを返す <検索サービスDDBJ＞ BLAST	<サービス内容> 核酸アミノ酸の配列を受けて類似エントリのリストおよびアランメントを返す <検索サービスDDBJ＞ ARSA	<サービス内容> キーワードを受けてDDBJなどのDBエントリーのIDを返す <解析サービスDDBJ＞ ClustalW 	<サービス内容> 配列類似性の相互関係をツリーにして表示する <検索サービスDDBJ＞ GIB 	<サービス内容> DDBJエントリーのバクテリアゲノムIDを受けてグラフィカルにエントリーのフィーチャーを表示する <検索サービスDDBJ＞ PSI-Blast<サービス内容> 類似アミノ酸グループのパターン化とパターンによる検索を繰り返し高感度に近縁アミノ酸配列を探す <検索サービスDDBJ＞ TxSearch<サービス内容> DDBJが使用しているNCBI生物分類のIDを受けてクラス階層を返す <検索サービスDDBJ＞ FASTA	<サービス内容> BLAST同様の配列類似性検索　古典的で感度に勝るが速度で劣る <検索サービスDDBJ＞ SSearch	<サービス内容> FASTAよりさらに生物学的に感度がよいローカルアラインメント. さらに遅い
 * DDBJでは　スパコンシステムを用いて下記のようなDB検索　配列解析　ファイル提供　のサービスを実施しています.
 * ただし利用法やページのつくりが違い受け付けた質問（query)の数とページ数(page view)が対応（比例）しない場合があります.


 * 「サービス別年次変化」グラフの赤枠箇所の拡大版グラフ.

（集計上の注意） ※各グラフのpage view単位の数字には、ロボット検索は含みません. ※各グラフのpage view単位の数字には、DDBJ内部からのアクセスは含みません. ※各グラフのquery単位の数字は、以下を元に集計しました. ・相同性（BLAST, CLUSTALW, FASTA, HMMPFAM, PSI-BLAST, SSEARCH）は、検索実行ログ ・その他のサービスは、page view値を目的のデータを参照するための一般的なページ遷移数で割り戻した数字


 * 世界中の登録票をＤＤＢＪ形式にしてまとめたファイルをリリースファイルと呼びます. 　リリースファイルは巨大になるので現在は数千ファイルに分割されftpサイトにおかれていまｓ.


 * 25年の歴史とスパコンでの運用の15年の歴史がありますがリリース作成プログラムには様々なバグが見つかります. 　GenBank　EMBL データを書き換える際に間違いを生じ　またそれぞれのバンクが独自に付与しているリンクデータなどを除いたファイルです.



=Summary of access log for anonymous ftp sites for DDBJ release 84-87= Summary of access log for anonymous ftp sites for DDBJ release address in user category	Number of Access by user category Usercategory		all	>=2--	>=10-	>=100	all--	>=2--	>=10-	>=100 DBCLS			8 	7 	7 	7 	48483 	48482 	48482 	48482 NIG (MextProject)	77 	51 	23 	13 	30145 	30119 	30009 	29781 RIKEN			5 	2 	2 	1 	2059 	2056 	2056 	2033 Japan EDU		45 	18 	8 	2 	2547 	2520 	2498 	2189 Non Japan EDU		40 	13 	3 	0 	196 	169 	138 	0 Jpan Patent Office	2 	2 	2 	2 	1385 	1385 	1385 	1385 MITI (NITE) 		6 	6 	4 	2 	369 	369 	356 	328 Ministry Agri		8 	6 	4 	3 	2004 	2002 	1998 	1936 Non Japan Gov		1 	1 	0 	0 	4 	4 	0 	0 Japan Industry		23 	11 	4 	3 	1621 	1609 	1584 	1492 Non-Japan Industry	15 	11 	4 	1 	306 	302 	279 	123 Provider Japan		83 	26 	5 	1 	476 	419 	351 	182 Provider Asia-Paci	57 	15 	5 	0 	81 	39 	0 	0 Provider EU AM		17 	7 	0 	0 	33 	23 	0 	0 Unknown Japan		15 	9 	3 	1 	413 	407 	386 	320 Unknown Asia-Paci	5 	3 	1 	1 	374 	372 	365 	365 Unknown Latin Am	6 	2 	0 	0 	9 	5 	0 	0 Unknown			3 	1 	0 	0 	4 	2 	0 	0 EBI 			3 	0 	0 	0 	3 	0 	0 	0 NIH 			3 	1 	0 	0 	5 	3 	0 	0 Admin			2 	2 	1 	0 	23 	23 	16 	0 total			424 	194 	76 	37 	90540 	90310 	89903 	88616
 * 1) Access log primarily summarized by Hashimoto, All adress 'who is-ed' and categorized by OK ~

http://farm8.staticflickr.com/7068/6941267495_f28b7d98ac_z.jpg http://farm8.staticflickr.com/7159/6479773401_80c0cc9793_z.jpg http://farm8.staticflickr.com/7158/6479773365_e8865f1ee3_z.jpg


 * Raw data protected by passwd, ask OK for a key:[[File:AnonymousFTPリリースデータDL調査結果.xlsx ]]


 * アドホックに独自の情報付加ばかり試みてきた歴史がありますが　まずは全INSDデータをきちんと扱える基礎能力を養うことが第一歩であると思われます. 　スパコン調達と抱き合わせの運用開発調達が行われており　体制および業務内容に変更を加えるには次回スパコン調達時の大幅な調達内容の変更、単純には機器とDDBJ運用協力を完全に切り分けることから始めます. 　2010-2011はこの調達準備に注力しました.
 * 未だに発見される形式変換プログラムのバグ


 * バグ1.PNG||バグ2.PNG||