Pdbタンパク質データベースのURL! +30 のタンパク質データベース サイト!

タンパク質データベースとは、特にタンパク質関連の情報を格納するデータベースを指します。彼らは、タンパク質の配列、構造、機能、相互作用関係、発現パターン、疾患との関連性、その他の情報を含む、大量のタンパク質データを収集、整理、保存します。タンパク質データベースは、これらのデータの検索、クエリ、分析機能を提供し、科学研究者、バイオインフォマティシャン、医薬品開発者に重要なリソースを提供します。

タンパク質データベースの内容は、通常、タンパク質配列決定、結晶構造解析、核磁気共鳴、質量分析などの技術によって得られたデータなど、研究室で実際に測定されたタンパク質データから得られます。これらのデータは検証および標準化された後、データベースに統合されるため、研究者はこれらのデータに簡単にアクセスしてさまざまな研究作業に使用できます。

以下は、一般的に使用されるタンパク質データベースと URL であり、参考のために著者がまとめたものです。

⓪BioXFinder: BioXFinder は、中国初で唯一の生物学データベースです。これには、複数のソースからのデータを統合し、手動で注釈が付けられた、500,000 を超える高品質で重複のないタンパク質情報が含まれています。これには、基本的なタンパク質情報、配列、配列特徴、タンパク質に関する情報が含まれます。機能、名前と系統、細胞内局在、疾患と変異、翻訳後修飾、発現、相互作用など。

タンパク質構造ライブラリ: X 線単結晶回折、核磁気共鳴、電子回折およびその他の実験手段によって決定された 190,000 を超えるタンパク質構造データが含まれています。タンパク質の立体構造、基礎情報、実験データ、参考文献などを掲載しています。

BioXFinder:https://bio.bcpmdata.com/

                                                  画像出典: BioXFinder 

①UniProt:UniProtは、多数のタンパク質の配列、構造、機能、相互作用、アノテーション情報を提供する包括的なタンパク質データベースです。Swiss-Prot、TrEMBL、PIR データベースなど、複数のソースからのデータを統合します。

ユニプロト: https://www.uniprot.org/

②タンパク質データバンク(PDB):PDBはタンパク質やその他の生体高分子の構造を保存するデータベースです。構造生物学研究、創薬設計、分子シミュレーションなどの分野で利用できる、実験的に決定されたタンパク質構造の三次元座標データを提供します。

タンパク質データバンク(PDB):https://www.rcsb.org/

③ NCBI Protein: NCBI Protein は、国立生物工学情報センター (NCBI) が提供するタンパク質データベースであり、大量のタンパク質配列データが含まれており、タンパク質の基本情報の照会や比較分析に使用できます。

NCBI プロテイン: https://www.ncbi.nlm.nih.gov/protein/

④ Ensembl: Ensembl は、複数種のゲノム配列、遺伝子構造、転写産物、タンパク質情報を含む包括的なゲノム アノテーション データベースです。研究者がゲノム研究や比較ゲノム解析を行うためのゲノムブラウザと解析ツールを提供します。

一緒に: https://www.ensembl.org/

⑤Swiss-Prot: Swiss-Prot は、高品質のタンパク質配列と注釈情報を提供するヒト注釈付きタンパク質データベースです。タンパク質の機能、ドメイン、修飾、細胞内局在などの詳細な注釈が含まれており、豊富な参考文献が提供されています。

Swiss-Prot: https://www.uniprot.org/uniprot/?query=reviewed:yes

⑥RefSeq: RefSeq は、NCBI が提供する包括的なタンパク質および核酸配列データベースであり、複数種の参照配列が含まれています。高品質の遺伝子およびタンパク質の配列、注釈情報、ゲノミクス、遺伝学、バイオインフォマティクス研究のための参考資料を提供します。

参照配列: https://www.ncbi.nlm.nih.gov/refseq/

⑦STRING: STRINGは、実験的に検証された相互作用、計算によって予測された相互作用、文献で報告された相互作用など、複数のデータソースからのタンパク質相互作用情報を統合するタンパク質相互作用データベースです。タンパク質相互作用ネットワークと機能モジュールを研究するための、タンパク質相互作用ネットワークの視覚化および分析ツールを提供します。

文字列: https://string-db.org/

⑧InterPro: InterPro は、複数のアノテーション リソースからの情報を統合するタンパク質ファミリーおよびドメイン アノテーション データベースです。タンパク質配列の機能およびドメインの注釈を提供し、研究者がタンパク質の機能と構造を理解するのに役立ちます。

インタープロ: https://www.ebi.ac.uk/interpro/

⑨Pfam: Pfamは、複数の種のタンパク質ファミリーとドメインのアノテーション情報を提供するタンパク質ファミリーデータベースです。これは、タンパク質の機能予測とアノテーションのための複数の配列アラインメントと隠れマルコフ モデルに基づいています。

Pfam: https://pfam.xfam.org/

⑩SMART: SMART は、複数の種のタンパク質ドメインのアノテーション情報を提供する、タンパク質の構造および機能ドメインのアノテーション データベースです。研究者がタンパク質の機能とドメインの進化的関係を理解するのに役立ちます。

スマート: http://smart.embl-heidelberg.de/

⑪KEGG: KEGG は、ゲノム、遺伝子、タンパク質、代謝経路、疾患に関する情報を含むバイオインフォマティクス リソースです。生物学的システムや医薬品開発の研究のための、タンパク質配列、機能的注釈、代謝経路、シグナル伝達経路に関する情報を提供します。

KEGG:https://www.genome.jp/kegg/

⑫NCBI GenBank: NCBI GenBank は、さまざまな種のゲノム、mRNA、タンパク質配列を含む包括的な核酸配列データベースです。ゲノミクス、遺伝学、バイオインフォマティクスの研究に使用できる、大量の核酸配列データと関連するアノテーション情報が提供されます。

NCBI GenBank: https://www.ncbi.nlm.nih.gov/genbank/

⑬NCBI RefSeq: NCBI RefSeq は、NCBI が提供する包括的な参照配列データベースであり、複数の種のゲノム、転写物、タンパク質配列が含まれています。高品質の遺伝子およびタンパク質の配列、注釈情報、ゲノミクス、遺伝学、バイオインフォマティクス研究のための参考資料を提供します。

NCBI RefSeq: https://www.ncbi.nlm.nih.gov/refseq/

⑭NCBI 保存ドメイン データベース (CDD): NCBI CDD はタンパク質保存ドメイン データベースであり、タンパク質配列内の保存ドメインと機能モジュールを同定するために使用されます。複数のドメイン データベースからの情報を統合して、ドメイン アノテーションとタンパク質配列の機能予測を提供します。

NCBI 保存ドメイン データベース (CDD): https://www.ncbi.nlm.nih.gov/cdd/

⑮NCBI Protein Clusters: NCBI Protein Clusters は、類似したタンパク質配列をクラスター化してタンパク質ファミリーを形成するタンパク質クラスタリング データベースです。これは、タンパク質ファミリーのアノテーションおよび機能予測のための配列類似性およびクラスタリング アルゴリズムに基づいています。

NCBI タンパク質クラスター: https://www.ncbi.nlm.nih.gov/proteinclusters/

⑯NCBI Structure: NCBI Structure は、NCBI が提供するタンパク質構造データベースであり、実験的に決定されたタンパク質の三次元構造データが含まれています。タンパク質の構造、ドメインの注釈、機能予測の 3 次元座標を提供し、構造生物学の研究や医薬品設計に使用できます。

NCBI の構造: https://www.ncbi.nlm.nih.gov/ Structure/

⑰NCBI COG (Clusters of Orthologous Groups): NCBI COG は、異なる種のオルソロガス グループ (Orthologous Group) を識別するために使用されるタンパク質直交グループ データベースです。これは、種間のタンパク質配列の類似性と機能の保存に基づいており、タンパク質の進化の関係と機能の注釈を研究するために使用されます。

NCBI COG (オルソロガス グループのクラスター): https://www.ncbi.nlm.nih.gov/COG/

⑱NCBI GEO (遺伝子発現オムニバス): NCBI GEO は、さまざまな実験からの遺伝子発現プロファイル データを含む、遺伝子発現データのリポジトリです。遺伝子発現プロファイルの生データと分析結果を提供し、遺伝子制御の発現パターンや生物学的プロセスの研究に使用できます。

NCBI GEO (遺伝子発現オムニバス): https://www.ncbi.nlm.nih.gov/geo/

⑲NCBI SRA (Sequence Read Archive): NCBI SRA は、さまざまな実験からのシーケンス データを含む高スループットのシーケンス データ リポジトリです。ゲノミクス、トランスクリプトミクス、バリアント解析に使用できる、生のシーケンス データと関連するアノテーション情報が提供されます。

NCBI SRA (シーケンス リード アーカイブ): https://www.ncbi.nlm.nih.gov/sra/

⑳NCBI dbSNP (一塩基多型データベース): NCBI dbSNP は、ヒトおよびその他の生物種の一塩基変異情報を収集する一塩基多型データベースです。遺伝的変異および疾患に関連する遺伝的変異の研究のために、一塩基多型の注釈と頻度情報を提供します。

NCBI dbSNP (一塩基多型データベース): https://www.ncbi.nlm.nih.gov/snp/

㉑NCBI ClinVar: NCBI ClinVar は、ヒトの病気に関連する遺伝的変異情報を収集する、臨床的に関連した遺伝的変異データベースです。遺伝的変異、関連疾患の臨床的重要性、および遺伝性疾患の診断と治療の研究に関連する文献を提供します。

NCBI ClinVar: https://www.ncbi.nlm.nih.gov/clinvar/

㉒NCBI dbGaP (遺伝子型および表現型データベース): NCBI dbGaP は、ヒトの遺伝研究のデータを保存および共有するための遺伝子型および表現型データベースです。これには、遺伝子型、表現型、臨床データが含まれており、遺伝的変異や複雑な疾患の遺伝的基盤を研究するために使用できます。

NCBI dbGaP (遺伝子型と表現型のデータベース): https://www.ncbi.nlm.nih.gov/gap/

㉓PANTHER (進化的関係によるタンパク質分析): PANTHER は、種間の進化的関係に基づいてタンパク質の機能を予測する、タンパク質ファミリーおよび機能注釈データベースです。タンパク質の機能と進化を研究するための、タンパク質ファミリー、機能的注釈、進化的関係に関する情報を提供します。

PANTHER (進化的関係によるタンパク質分析): http://www.pantherdb.org/

㉔ SUPERFAMILY: SUPERFAMILY はタンパク質の構造と機能ドメインのデータベースであり、ドメインの構造と機能に基づいてタンパク質を分類し、注釈を付けます。タンパク質の構造と機能を研究するために、タンパク質ドメインの注釈と機能予測を提供します。

スーパーファミリー: http://supfam.org/

㉕ PROSITE: PROSITE は、タンパク質配列内のドメインとモチーフを同定するためのタンパク質ドメインとモチーフのデータベースです。配列パターンと保存されたモチーフに基づいて、タンパク質配列のアノテーションと機能予測を実行します。

質問: https://prosite.expasy.org/

㉖HPRD (ヒトタンパク質参照データベース): HPRD は、ヒトタンパク質の配列、構造、機能、相互作用に関する情報を提供するヒトタンパク質参照データベースです。ヒトタンパク質の機能と相互作用ネットワークを研究するために、複数のデータソースからの情報を統合します。

HPRD (ヒトタンパク質参照データベース): http://www.hprd.org/

㉗ BioGRID: BioGRID は、タンパク質相互作用に関する実験的に検証されたデータを収集する生物学的グリッド データベースです。タンパク質相互作用とシグナル伝達経路を研究するためのタンパク質相互作用ネットワークのデータと分析ツールを提供します。

BioGRID: https://thebiogrid.org/

㉘IntAct: IntAct は、実験的に検証されたタンパク質相互作用データを統合したタンパク質相互作用データベースです。タンパク質相互作用ネットワークと機能モジュールを研究するための、タンパク質相互作用アノテーションおよびネットワーク視覚化ツールを提供します。

IntAct: https://www.ebi.ac.uk/intact/

㉙Reactome: Reactome は、複数の種における生物学的プロセスと分子相互作用に関する情報を提供する代謝経路とシグナル伝達経路のデータベースです。生物学的プロセスと疾患メカニズムを研究するための代謝経路とシグナル伝達経路の詳細な注釈と視覚化ツールを提供します。

リアクトーム:https://reactome.org/

㉚NCBI CDD (Conserved Domain Database) は、タンパク質配列の保存ドメインと機能モジュールを特定し、対応するアノテーションと予測を提供するタンパク質保存ドメイン データベースです。

NCBI CDD (保存ドメインデータベース): https://www.ncbi.nlm.nih.gov/cdd/

タンパク質データベースは、生物学研究、タンパク質の機能予測、タンパク質の構造予測、創薬などの分野で重要な役割を果たしています。タンパク質データベースを利用することで、研究者はタンパク質の基本情報、相互作用関係、構造ドメインの注釈、機能予測などを取得し、タンパク質の生物学的機能や機構を深く理解することができます。

 

おすすめ

転載: blog.csdn.net/Yiyaoshujuku/article/details/131846849