MSSmetadata style

=大量登録システム（MSS）登録者に依頼するメタデータの入力の説明　（大城戸）=

基本的には登録ファイルを見て追加していただく情報を登録者に示していますので実際のところは定型文のようなものは存在せず、個別対応となっています. A) シーケンシング実験に関する概要 ---> structured COMMET  B) 配列のリソースに関する内容  ---> sourceフィーチャへの記載  C) その他の情報 ---> COMMENTに記載 
 * 文献や登録者、コンタクトパーソン情報除いたメタデータと呼ばれる内容は大きく分けて、3つになります.

A) シーケンシング実験に関する内容の入力について
WGSカテゴリデータ並びにcomplete genomeの登録では、structured COMMENTを用いてシーケンシング実験に関する概要を記載してもらっています. 以下はその紹介 ＜紹介文＞ 全ゲノム規模の登録データの場合、シーケンシング実験に関する概要をsturctured COMMENTを用いて記載していただくことをお願いしています. 下記の項目に適切な内容を記載して下さい. 詳しくは「大量登録用データ作成の手引き」内の"5-4 COMMENT"をご覧ください. http://www.ddbj.nig.ac.jp/sub/mss/sample/txt/WGS.txt http://www.ddbj.nig.ac.jp/sub/mss/sample/txt/WGS.pdf http://www.ddbj.nig.ac.jp/sub/mss/sample/txt/WGS_scaffold.txt http://www.ddbj.nig.ac.jp/sub/mss/sample/txt/WGS_scaffold.pdf
 * 「大量登録用データ作成の手引き」 http://www.ddbj.nig.ac.jp/sub/mss/pdfs/MSS_J.pdf
 * サンプルファイルは下記のサイトよりご覧いただくことが可能です.
 * WGS

B) sourceフィーチャへの記載
項目名 qualifier名 organism名 organism 配列の分子種 mol_type
 * (1) organism名と配列の分子種ついて
 * 1-1）organismとmol_type/qualifierの入力必須ですので、その点に関する言及 は省略しています.

項目名 qualifier名 sub_species (亜種名) sub_species variety (変種名) variety
 * 1-2）organism名に以下の名称が含まれている場合には、それぞれのqualifierの入力が必要です.

項目名 qualifier名 栽培品種 cultivar 生育環境に適応した集団 ecotype
 * 1-3）植物の栽培品種や生育環境に適応した生物集団が明確な場合に以下のqualifierを用いて其々の名称を記載して下さい.

項目名 qualifier名 系統名 strain サブ系統名 sub_strain
 * 1-4）系統名、サブ系統名が明確な場合に以下のqualifierを用いて其々の名称を記載して下さい.

(2) organism情報以外で配列のリソースに関する内容のsource フィーチャへの記載
ゲノム配列の由来リソースによって求める情報に、多少違いありますが基本的には求める情報はほぼ同じです. 以下はsingle species並びにメタゲノム配列で共通 項目名 qualifier名 染色体番号 chromosome オルガネラ名 organelle isolate名 isolate 分離源 isolation_source 感染していた宿主名 host 採取地の国名 country 性別 sex or mating 採取者 collected_by 採取日 collectiton_date

次の2つのそれぞれに特有の情報の提供を求めています.

2-1）single speciesのゲノム
由来リソースに関しまして記載可能な情報があれば、以下の情報をそれぞれのqualifierに入力して下さい. 項目名 qualifier名 配列が得られた生物材料(生きている個体・系統)の保管施設と識別子 bio_material ウイルスやバクテリアの培養保存機関名 culture_collection 天然のプラスミド名 plasmid ウイルスやファージのsegment segment ウイルスなどの血清型 serotype 原核生物における血清型 serovar 生物の同定者 identified_by 染色体番号 chromosome

2-2）環境サンプルのゲノム（メタゲノム）
由来リソースに関しまして記載可能な情報があれば、以下の情報をそれぞれのqualifierに入力して下さい. 項目名 qualifier名 採取地の緯度・経度 lat_lon

(3) トランスクリプトーム
EST (Expressed sequence tag) HTC (High Throughput cDNA) TSA (Transcriptiome Shotgun Assembly)

由来リソースに関しまして記載可能な情報があれば、以下の情報をそれぞれのqualifierに入力して下さい. 項目名 qualifier名 細胞のタイプ cell_type 細胞株 cell_line cloneライブラリーの名称 clone_lib 発育ステージ dev_stage matingのtype mating_type 性 sex

記載可能な情報があれば、以下の情報をそれぞれのqualifierに入力して下さい. 項目名 qualifier名 染色体番号 chromosome map 細胞内器官 organelle haplo_type haplo_group tissue_lib

適当なqualifierがなければ、note/を使用して下さい.

C) その他の情報 COMMENTに記載できますので、適切な内容を入力して下さい.

ご参考までにsourceフィーチャで使用可能なqualifer
Optional qualifiers /bio_material="[:[:]]" /cell_line="text" /cell_type="text" /chromosome="text" /citation=[number] /clone="text" /clone_lib="text" /collected_by="text" /collection_date="text" /country="[: ][, ]" /cultivar="text" /culture_collection=":[:]" /db_xref=" : " /dev_stage="text" /ecotype="text" /environmental_sample /germline /haplogroup="text" /haplotype="text" /host="text" /identified_by="text" /isolate="text" /isolation_source="text" /lat_lon="text" /macronuclear /map="text" /mating_type="text" /note="text" /organelle= /plasmid="text" /proviral /segment="text" /serotype="text" /serovar="text" /sex="text" /specimen_voucher="[:[:]]" /strain="text" /sub_clone="text" /sub_species="text" /sub_strain="text" /tissue_lib="text" /tissue_type="text" /transgenic /variety="text"

ゲノム・トランスクリプトームでは不要項目 /focus /frequency="text" /lab_host="text" /PCR_primers="[fwd_name: XXX, ]fwd_seq: xxxxx, [rev_name: YYY, ]rev_seq: yyyyy" /pop_variant="text" /rearranged

///////////////////////////////////////////////////////////////////////////

以上です.

大城戸