SRAへの考え方

=March 24 電話会議== Lipman, Ostel, Guy, Sugawara, Nakamura, Kodama, Okubo, etc

理解できた範囲でご説明すると
 * 1) NCBI事情説明
 * 2) *1）NCBIの予算の３０％は、NIH各研究所の予算から来ている.
 * 3) *2）新年度の予算が決まらない状態で、実質２０－３０％の予算減で動いている”ＮＩＨ所長達の選択”で、NCBIの各活動のうち、コスト利益面からSRA中止が選択され、NCBIはその決定に従うしかない.
 * 4) *3）１０月までは現状通り運転するがそのあとは現在の運転は無理
 * 5) *4）もともとデータ生産に見合う予算をデータ生産者からもらってるわけでないので仕方ない. １０００人ゲノムについてもそのアーカイブについてNCBIに予算が付ていた訳ではない.
 * 6) *5）一方で、「SRAは止めよう」といった所長が戻った研究所で所員から「SRAは必要」ときう声が上がったところもある. NCBIとしては、アーカイブするデータをもっと選り好みすることを考えている.
 * 7) *6）プロジェクトのメタデータだけの収集を使い分散アーカイブになるかもしれん
 * 8) *7）Bit-Bucket 　というもっと人手のかからんバリデーションのいらないラフな保存のアイデアがある（注　bit backetのもともとはこちらhttp://en.wikipedia.org/wiki/Bit_bucket）
 * 9) *8）トレースアーカイブは値段が安いので中止をキャンセルし　BARCODEなどプロジェクト限定で持続する
 * 10) EBI側から
 * 11) *A)ＥＢＩは参照データがある場合は圧縮技術で１０分の一〜１００分の１程度の圧縮も可能と考える（参考文献　Efficientstorage of high throughput DNA sequencing data using reference-based　compression Markus Hsi-Yang Fritz, Rasko Leinonen, Guy Cochrane and　Ewan Birney EMBL-EBI, Wellcome Trust Genome Campus, Hinxton,　Cambridgeshire CB10 1SD http://genome.cshlp.org/content/early/2011/01/18/gr.114819.110.full.pdf）
 * 12) *B)生データ保存を旨とするサンガーを抱えているのでやめられない
 * 13) *C)米国データがＥＢＩに登録されても構わんのか（Lipman「ぞうぞどうぞ」）
 * 14) DDBJは：
 * 15) *生データレベルでの共有が習慣化されるまでに中断するとモラル上悪い影響が懸念される
 * 16) *ディスクスペースに上限を設けて継続するつもりである

議論すべきこと

 * 1) *1）もともといつものように世界にあわせる形で開始したアーカイブですので国内での要不要議論はありませんでした
 * 2) *2）圧縮や分散のアイデア競争に入る可能性ありますので　国内の先生からそれらのいいアイデアが出ると少なくともＤＤＢＪはそれを採用し国際化に尽力します. 　現在国内の様子もわかりません
 * 3) *3）一方でもともと塩基あたり配列生産コストの減少がビット当たりのディスク価格減少とマッチしないので１０年続けられない「何でもアーカイブ」です
 * 4) *4）過渡期に完全保存する意義＝現在将来の利用価値を考えなおさねばなりません

ポストＮＣＢＩ体制で国内での新型バンク事業に何を期待されるか改めてお聞かせいただく機会があれば助かります. うかがう相手は　データ生産をしてないバイオインフォーマティックスの人たちかもしれませんが日本の方針を背負わせていただけないと独自に態度を決めるのも気が進みません. 具体的にお考えをうかがう方策を考えたいと思います. メイルでも結構です.