Talk:2010年度 DDBJ事業報告

坂井チームのしてること　（聞き取り　小笠原　大久保　書き取り大久保）　１０月８日　２０１０年

NCBIがメイルでよこす論文リストに従って　未公開を公開　初報の仮名称からの変更　続報の追記をする　連絡する　などを２名のJr.アノテータで実施します. 毎日　少ない多いの変動あり

１．Mail from NCBI 一論文ひとつのメイルです. 間歇的に発送されています. 文面は定型で　論文の書誌情報とそれにふくまれるAcc#のリストで構成されています.

メイルは年間3000通です. 実測値は？

ACCリストは大抵正確ですが　１論文多配列の場合に言及すべきACCが抜けてることがまれにあります. それはテーブルや図中にある番号の場合が多いです. 論文はDDBJから公開済みまたは登録後未公開の配列の親である場合がほとんどで わずかに同じチームからの続報が含まれることがあります. ごくまれにACCについて言及しているが別の著者による「関連論文」のことがあります.

２．メイルのリストは津波にアップされます.

３．Jr.アノテーターが「担当します」というフラグを立てて作業を分担します.

４．メイル中の書誌情報を使いGoogleでジャーナルのサイトにゆき、 論文の書誌情報を読んで　初報、続報、関連　の区別をします. PubMedでも片付く場合も多いのですがPubMedから見えない場合があります. （印象として　１－１０％の間で） pubMedがリストしてないのか？　それともしばらく待てば見えるのか？？

５．初報の場合は津波で仮書誌情報に正しい情報を上書きします. 続報の場合は追記します. 一論文で複数のアクセッションがついていても　津波GT機能があれば　一度に書き換えされます. NCBIメイルにある複数のACCリストにもれがあっても　ＨｉＲで関連付けが済んでいるともれなく検出できます. HiRで関連付けができるのは　1) MSS経由の登録　2) SAKURAの連番登録機能　を使っている場合です. これ以外は　リテラルに論文フィールドを探すやりかたになります. 表記方法はメイルではPubMed形式になっているので手作業でDDBJ形式に変更します. （注）

6. 公開、または修正　したことをコンタクト先にメイルで知らせます. 定型文に適宜加筆して行います. リターンされるとFAXします. 許可を要するのではなくNoticeという態度でＯＫです.

-- お忙しいところ、失礼致します. 構築チームの更新ユニットの 坂井です.

先ほどお尋ねの件ですが、以下のようになります:

1)更新の依頼件数

アクセッション番号発行後の登録内容の更新の依頼・処理件数は、 例年、１年間で約5,000件です.

例えば、2009年の9月から2010年6月の10ヶ月間で約4,100件です.

2)更新の依頼・作業内容としては、主なものに以下があります:

a)公開予定日の延長 b)論文情報の更新 c)登録者の所属情報の更新 d)塩基配列、配列が由来する生物名の更新 e)その他の登録情報の更新(例: gene名、product名の更新)

実際の作業では、登録者からメールで登録内容の依頼を受け、 その依頼に基づいて、アノテーターがデータベースの内容を 更新し、登録者に依頼の作業が完了した旨、メールで報告を 行います.

依頼件数としては、a),b),c)が多く、合わせて、年間で4000件 以上あります.

エントリ数では統計をとっていないのですが、例えば、EST、GSS またはWGSの依頼では、１回の更新で数十万のエントリを更新する こともありますので、この１年でも、200万エントリ以上(MGAを除く) が何らかのかたちで更新されています.

更新専任のアノテーターは、私を含め３人です.

以上、宜しくお願い致します.

坂井