特許配列登録公開の手続き

青野さんの特許サイト　由来　https://sites.google.com/a/g.nig.ac.jp/ddbj-patent/tokkyo-gyoumu/ddbj-gong-kai-ding-chang-ye-wu

=HX= 青野さんの答え

①JPOがデータをおくってくるようになったのはいつからか？
DDBJとJPOと話し合いを行ない合意が成立したため、特許DNAデータを処理している(財)日本特許情報機構から、1993年に約3000件の特許DNAデータが届き、E prefixで DDBJ release 14 (1993年7月)より公開を実施したそうです. DDBJ Patentの以下ページに、まとめてあります. https://sites.google.com/site/ddbjpatent/jpo
 * DDBJとJPOとの合意でデータ受領を開始したのは1993年です.
 * ICM合意の合意を受けて、JPOから正式なデータ送付が開始されたのは1997年6月からです.
 * 1995年6月27日以降に公開されたDNA配列データを、
 * 1997年6月よりJPOからDDBJへ送付が開始されました.

②KOBIC が.....?
過去のメールを確認すると、2007年にKOBICからファイルを受領して、データ修正のやり取りをしている様です. DDBJ Patentの以下ページに、まとめてあります. https://sites.google.com/site/ddbjpatent/kipo/kipodeta-koukai-keii
 * DDBJからの公開は2008年3月3日です.

③いつから　専用線を引いて　何をやってるか　？
--- 2001年 [DDBJ REPORT:00348] データベース運用・開発局会議 議事録(橋本博之) (2) 11/14 特許庁ー遺伝研間専用線に関する打ち合わせ 専用線経由での利用項目 ・特許庁から新規公開データのファイル転送 ・特許庁からDDBJ公開エントリの取得
 * 専用線の使用内容ですが、getentry、書誌情報の取得を行っているときいています.
 * 書誌情報は、DDBJの公開データから、論文情報を取得しているとお聞きしています.
 * 専用線の使用開始ですが、以下の議事録を参照すると2001-2002年の様です.

2002年 [DDBJ REPORT:00372] データベース運用・開発局会議 議事録 2002/2/28(三須) d. 2/18 特許庁の専用線を使用した特許データ自動公開システムの開発と公開 ・アクセッション番号振り替えツール開発(E番号以外をBD番号に変換) ・生物名校正ツールの開発（学名への変換及びリネージ情報を挿入)      ・japioフォーマットチェックツールの新規開発　　　　　(基本フォーマットチェック)       ・サーバ間のファイル転送処理の仕組みを構築　　　    (JPOWS　->　adam/eve　->　generous　->　adam/eve)       ・特許データのLiveList自動構築システムの開発       ・特許番号テーブル自動作成をdaily処理に組み込む ---


 * JPOからは、国内公報、国際公報、公表公報に含まれるデータが送られてくる.

Publication of patent applications
 * 国内公報：

International application published under the Patent Cooperation Treaty (PCT) International application published under the PCT
 * 国際公報：

Japanese translations of PCT international publication for patent applications
 * 公表公報：

=JPO定期公開=

各種調査リスト（除外エントリなど）
 * 頻度:　月1回（2009年7月からの3ヶ月間は、JPOシステム増強のため月2回）
 * 作業トリガ:　JPO赤野様からの依頼メール(月の中旬頃)
 * 作業リミット*　約1週間以内、かつ月末までに公開完了
 * 対象データ *　特許データ（塩基配列およびアミノ酸配列）
 * 作業ファイル配置場所(YYYYMMDD:作業日)　guanine:/DBT/tmp/patent/jpo/YYYYMMDD

作業内容
関連ドキュメント
 * 1) JPOファイル転送サーバからファイル転送にてファイル取得
 * 2) 取得したファイルはEMBLライクな形式の為、DDBJ形式に変換
 * 3) ワイルドカード配列(塩基：nnn・・・、アミノ酸：XXX・・・)のみの場合、そのデータを除外する
 * 4) 塩基配列、かつアミノ酸配列データが混入している場合、そのデータを除外する
 * 5) 除外データはアクセッション番号をリスト化し、JPOに連絡
 * 6) getentry/その他サービスにてデータの取込を行なう. アミノ酸については、getentryのみで公開
 * 7) getentryにて新規データの公開確認後、JPOに公開完了のメールを送付する

特許データ新規公開手順書 特許庁定期送付データ公開作業記録表 =JPO追加公開=

各種調査リスト（除外エントリなど） KIPO
 * 頻度:　　　　　月0回～1回
 * 作業トリガ:　　JPO赤野様からの依頼メール
 * 作業リミット:　約1週間以内、かつ月末までに公開完了
 * 対象データ:　 特許データ（塩基配列およびアミノ酸配列）
 * 作業ファイル配置場所:(YYYYMMDD:作業日) guanine:/DBT/tmp/patent/jpo/YYYYMMDD
 * 作業内容:    定期公開と同様
 * 関連ドキュメント: 定期公開と同様

=KIPO公開=

修正フラットファイルなど ※2009.10.23までにKIPOから提供されたKIPOフラットファイル配置場所 guanine:/DBT/tmp/patent/kipo/kipo_flatfile
 * 頻度　　　　　不定期 2007年度よりKIPOデータの公開を開始
 * 作業トリガ   KOBIC Byungwook LEE先生からの依頼メール
 * 作業リミット　ご相談
 * 対象データ　 特許データ（塩基配列およびアミノ酸配列）
 * 作業ファイル配置場所(YYYYMMDD:作業日) guanine:/DBT/tmp/patent/kipo/YYYYMMDD

作業内容
getentry/その他サービスにてデータの取込を行なう. アミノ酸については、getentryのみで公開 getentryにて新規データの公開確認後、KOBICに公開完了のメールを送付する
 * 1) KIPO FTPサーバからファイルをダウンロード
 * 2) 取得したファイルはEMBLライクな形式の為、DDBJ形式に変換
 * 3) 変換後データにリネージを挿入
 * 4) 変換後データにアクセッション番号を挿入
 * 5) 変換後データに対するフォーマットチェック
 * 6) フォーマットエラーとなったデータを除外する
 * 7) ワイルドカード配列(塩基：nnn・・・、アミノ酸：XXX・・・)のみの場合、そのデータを除外する

KIPO公開手順書(DNA) KIPO公開手順書(PROTEIN)
 * 関連ドキュメント

=JPO, KIPO共通 アミノ酸蓄積データAnonymous FTP公開=

各種調査リスト（除外エントリなど）
 * 頻度　　　　　3ヶ月1回
 * 作業トリガ　　DDBJ定期リリース
 * 作業リミット　DDBJ定期リリース締め日の翌週
 * 対象データ　　特許データ（JPOおよびKIPOアミノ酸配列）
 * 作業ファイル配置場所(YYYYMMDD:作業日) guanine:/DBT/tmp/patent/cumulated/YYYYMMDD

作業内容
特許アミノ酸蓄積データ公開手順書 アミノ酸蓄積配置作業記録表
 * 1) アミノ酸配列データのアクセッション番号一覧を取得
 * 2) getentryからアミノ酸配列データを取得
 * 3) アミノ酸蓄積データLiveList作成
 * 4) 生物名情報を更新 (1年に1回)
 * 5) 前回公開データをバックアップ (バックアップサーバvd02)
 * 6) getentryでデータの取り込みを行う (更新があった場合のみ)
 * 7) Anonymous FTPサイトにデータを公開する
 * 8) collabに公開通知メールを送信する
 * 関連ドキュメント:

作成協力：橋本　竜一(富士通DSS) 文責：佐藤　誠　(富士通DSS)

=特許庁によるＤＤＢＪの利用= 小笠原問答15:50, 6 February 2012 (JST) http://farm8.staticflickr.com/7165/6828267559_35f8f5d6cf_z.jpg 例えば、tpa　は　ddbj　に含まれていないということでしょうか？"<ご回答>	"DDBJ release noteをご覧になると（要約 : http://rgm2.lab.nig.ac.jp/wiki/index.php/87%E3%81%AE%E3%83%AA%E3%83%AA%E3%83%BC%E3%82%B9%E3%83%8E%E3%83%BC%E3%83%88#9._Release_history) TPA(third party annotation)は2006年3月(release 61)に始まり、2010年3月(release 81)からは「releaseとは違う概念だ」という理由でDDBJ releaseからは外されています. ですから別のDBとして扱う予定でした（つまりtpaはddbjには含まれていない運用にする予定でした）が、利用者にとって不便ということでしたら、getentry上では混ぜておく仕様にしても構いません. " 1時間程度サービス断が起こることが予想されます. " 1.買い取りの移行用サーバ上で運用されるのは現行システムか？ 2.買い取りの移行用サーバ上で運用される場合のURLは何か？ 3.2012年2月15日の切替との関係は？ ⇒新getentryに2月15日に切替えられるが、運用は買い取りの移行用サーバ上ということか？ 4.新スーパーコンピュータへの移行はいつか？ 5.新スーパーコンピュータへの移行について停止期間が発生するのか？ 6.新スーパーコンピュータへの移行についてURLの変更は発生するのか？ 等々ありますので、 getentryの移行に関して、サーバ，URL，新getentryの各切替の観点を含むタイムチャートをご提示いただきたくお願いいたします. （サービス停止期間が発生する場合は、それが分かるようにしてください） "<ご回答>	"1. 移行用サーバで運用されるのは新システムです. 2. 移行用サーバで運用される場合のURLは以下の通り. （現在と同じ） http://getentry.ddbj.nig.ac.jp 3.　そのとおりです. 4. 新スーパーコンピュータへの移行については、まだ正確な日付は決めていません. 7月ごろと思われます. 5. 2月15日と同様の操作を行いますので、長時間停止することはないと思います. 6. 発生しません.
 * <区分>新getentry	<質問>"・パラメータ　database　について DNA系に　tpa　がありますが、この意味はなんでしょうか？
 * <区分>新getentry	<質問>"・データベース　PDB　について 新getentryについて、要望により、PDBへ対応の方向であると聞いていますが、パラメータとしては、database　に　pdb　が追加されて対応可能になると考えておいてよいでしょうか？ <ご回答>はい.
 * <区分>切替時期		<質問>"・getentryの切替時期（2012年2月15日・時・分）新getentryに対する影響は調査中ですが、DNA検索システム側の設定ファイル内容を変更することで対応可能ではないかと考えています. その場合、ユーザ影響が最小となるよう、ファイル書き換えタイミンングを設する必要があるので、詳しい切替時期（2012年2月15日○時○分）の提示をお願いいたします. <ご回答>"2月15日18:00ごろDNSの設定を切り替えますので、
 * <区分>切替時期	<質問>"・Anonymous FTP（DDBJ新着）の切替時期（年・月・日・時） 2012年2月15日15時にサービス一時停止ということですが、サービス再開時期（年・月・日・時）はいつでしょうか？また、再開後は新システムでのサイト運用となりますか？ "<ご回答>	"FTPについても2月15日18:00ごろDNSの設定を切り替えますので、getentryと同様1時間程度サービス断が起こることが予想されます. "
 * <区分>	移行	<質問>"・getentryの移行について 「新スーパーコンピュータへの移行が落ち着くまでは買い取りの移行用サーバーの上で運用を継続します」との連絡がありましたが、

タイムチャートについては下記画像ファイル参照

"
 * <区分>その他	<質問>	"・Anonymous FTP再開後のサイト構成は停止前と変更になりますか？もし変更となる場合は、その構成についてご連絡ください. <ご回答>変更ありません.
 * <区分>	運用	<質問>"・Anonymous FTP（DDBJ新着） 休止期間分のDDBJ新着データが、再開後に１日分のファイルにまとめられて、１ファイルの容量およびエントリー数が膨大になりますか？逆に言うと、そのようにならないような運用をお願いいたします. <ご回答> Daily処理は停止しませんので、全くこれまで通りです.
 * <区分>その他	<質問>"現在ダウンロードしているDBに関して、提供されなくなる，データフォーマットが変更される，ファイル名が変更される、など現行と新システムで差分はないと考えておりますが、いかがでしょうか？"<ご回答>	差分はありません.


 * DDBJの小笠原です. たびたびすみません. 下記の件なのですが、特許庁様専用DMZという領域が存在しているので、を使うのがもっと好ましいという意見が内部から出ましたので、