マルチプルアラインメントデータセット
2015. 5
|
マルチプルアラインメント
|
347M |
Flat File |
NOTES: "FMULTI" :全H-Invトランスクリプト(HIT)塩基配列とゲノム配列の同一クラスター(HIX)内マルチプルアラインメント
|
マッピング位置情報データセット
2015. 6
|
全エキソンゲノム位置データセット
|
124M |
Flat File |
NOTES: "FMULTIP"; FMULTIP.tar.gz (mALNp/.tbl) 全H-Invトランスクリプト(HIT)のエキソンのヒトゲノム上の位置データ
ファイル形式: 01:HIT (or acc), 02:HIX (or temporally cluster-id), 03:key
(=acc_chr_sno), 04:seq1 ("genome"), 05:seq2 (cDNA_acc), 06:strand,
07:exon_no, 08:type[N:not aligned part of seq1(genome); U:unmapped part
of seq2(cDNA); A:alignment, D:deletion, I:insertion; G:gap due to other
member)], 09:start_seq1 (genome), 10:end_seq1 (genome), 11:start_seq2
(cDNA), 12:end_seq2 (cDNA) (or gap_length if 08:type='G')
|
H-InvDB代表配列(HIT)のエキソンおよびCDS/UTRゲノム位置データセット(GFF3形式)
|
7.6M |
GFF3 File |
H-InvDB全転写産物(HIT)のエキソンおよびCDS/UTRゲノム位置データセット(GFF3形式)
|
25M |
GFF3 File |
NOTES: "h-inv_pub_rep.gff3.gz","h-inv_pub.gff3.gz"; エキソンとCDS/UTRのヒトゲノム上の位置データ(GFF3 format)
Format:01: "seqid (HIT)", 02: "source", 03: "type", 04: "start",
05: "end", 06: "score", 07: "strand", 08: "phase", 09: "attributes"
Attributes (exon):ID=HIX, Name=HIT, Note=HUGO gene symbol
Attributes (CDS):ID=HIT, Parent=HIX, Name=HIT, Alias=definition, Note=HUGO gene symbol, accession
Attributes (UTR):Parent=HIT, Name=HIT
GFF3 format:http://www.sequenceontology.org/gff3.shtml
|
H-ANGELマトリックスデータセット
|
H-ANGEL遺伝子発現マトリックスデータ
|
25M |
Flat File |
"H-ANGEL_matrix.txt.gz": H-ANGEL遺伝子発現マトリックスデータ
ファイル形式: 1: Type of platform, 2: experimental ID added by each
provider, 3: primer/probe ID. e.g. GeneChip Identifier, 4: 10 categories
collapsed by the avarage of 40 categories, 5: 10 categories collapsed
by the maximum value of 40 categories, 6: 40 categories, 7: Acc
corresponding to the primer/probe, 8: start site of the primer/probe on
the genome, 9: end site of the primer/probe on the genome, 10: Absolute
value of the expression data for EST and SAGE only, NaN otherwise, 11:
HIX, 12: UniGene ID, 13: start site of HIX on the genome, 14: end site
of HIX on the genome, 15: strand of the locus, 16: Acc(s) included
within HIX.
|
分子進化アノテーションデータ(Evola)
|
オルソログリスト
|
|
Flat File |
"Evola.txt.gz": Evolaのヒト-他生物オルソログペアのアクセッション番号リスト
|
Inter-species multi-FASTA (Transcript)
|
オルソログ配列(塩基配列)
|
|
Flat File |
NOTES: "NFAS.tar.gz":ヒトと他生物のオルソログの転写産物の塩基配列を、ヒト配列ごとにマルチファスタファイルとしてまとめたもの。
|
Inter-species multi-FASTA (Protein)
|
オルソログ配列(アミノ酸配列)
|
|
Flat File |
NOTES: "PFAS.tar.gz":ヒトと他生物のオルソログのタンパク質のアミノ酸配列を、ヒト配列ごとにマルチファスタファイルとしてまとめたもの。
|
Phylogenetic trees
|
重複遺伝子ファミリー系統樹
|
|
Flat File |
NOTES: "NJ.tar.gz":Neighbor-joining (NJ)法による、重複遺伝子ファミリーアミノ酸配列の系統樹ファイル(phb)
|
Human protein complex database with quality index (PCDq), data set
New!
2015. 11
|
Protein complex list, their subunits (members), and related annotation.
|
1.5M |
TSV Files (tar.gz file) |
NOTES: "complexList.tsv" provides complex ID, name, etc.
"subunitMembers.tsv" provides subunits (members) of each complex and related annotations.
"public_ppi.tsv" provides PPI data used for complex prediction.
File format is described in README file included in download package.
|
H-Invアノテーションデータセットのうち、実験的エビデンスのあるサブセット
2015. 7
|
実験的エビデンスのあるH-Inv遺伝子座(HIX) のサブセット (フラットファイル形式)
|
25M |
Flat File |
実験的エビデンスのあるH-Inv遺伝子座(HIX) のサブセット (XML形式)
|
33M |
XML |
実験的エビデンスのあるH-Inv転写産物(HIT)のサブセット (フラットファイル形式)
|
146M |
Flat File |
実験的エビデンスのあるH-Inv転写産物(HIT)のサブセット (XML形式)
|
178M |
XML |
実験的エビデンスのあるH-Invタンパク質(HIP)のサブセット (フラットファイル形式)
|
57M |
Flat File |
実験的エビデンスのあるH-Invタンパク質(HIP)のサブセット (XML形式)
|
61M |
XML |
NOTES: H-InvDBの遺伝子座(HIX)・転写産物(HIT)・タンパク質(HIP)のうち、網羅的プロテオーム実験による裏付けのあるサブセット。C-HPPにおいて発現量が"protein level"または"transcript level"と分類されたもの。
|
ヒトゲノムにマップされなかった転写産物のデータセット
2015. 5
|
ヒトゲノムにマップされなかった転写産物クラスタのデータセット (フラットファイル形式)
|
2.7M |
Flat File |
ヒトゲノムにマップされなかった転写産物クラスタのデータセット (XML形式)
|
3.0M |
XML |
ヒトゲノムにマップされなかった転写産物のデータセット (フラットファイル形式)
|
14M |
Flat File |
ヒトゲノムにマップされなかった転写産物のデータセット (XML形式)
|
15M |
XML |
NOTES: ヒトゲノムにマッピングされなかった転写産物(HIT)と、そのクラスタ(HIX)の情報。
|