ドキュメント名:ペプチドIdenticationで偽発見率推定を繰り返し、保存デコイデータベース(反復ペプチドの発生を反映するために、データベース・エラー推定値を識別するための餌)

ドキュメント名:繰り返し-プロファイリングはペプチドIdenticationで発見率推定のためのデコイFalseのデータベースを保存(反復ペプチドの発生を反映するために、データベース・エラー推定値を識別するための餌)

雑誌名:プロテオーム研究誌、

出版:(2020年月)

IF 3.78

単位:

  1. コンピュータサイエンスのウォータールー大学の大学
  2. トロント、細胞生物学と生物学SPARCプロジェクトセンター
  3. 分子遺伝学、トロント大学の学部

テクノロジー:ペプチド同定、おとりデータベース構築

 

I. 概要:

この研究は、グラフィカルモデルアルゴリズムを構築・デ・Bruijnグラフ餌に基づいてデータベースを開発しました。主にターゲット・データベースの反復配列構造を維持しながら、このアルゴリズムは、ランダム性を確保するために餌のデータベースを構築しました。結果は、0.01であることがよりペプチドを同定することができ、この高いエラー率(FDR)レベルを取得ショーを比較するために、共通の戦略と他の餌ライブラリーを構築するためのデBruijnグラフ戦略であろう。

 

第二に、背景:

質量分析ベースのプロテオミクスでは、データベース検索方法は、ペプチドを同定するための最も一般的に使用される方法です。まず、制限酵素消化によって原理タンパク質配列は、セグメント配列データベース確立ペプチド、ペプチド理論に変換し、データベース内の実際のスペクトルと理論的なペプチド配列に続くセグメントは、ペプチドセグメントの識別が達成されると一致します。

データベースの検索方法は、FDRの結果を評価する合理的なアプローチを必要とし、ターゲット餌(ターゲット-おとり)メソッドは、最も一般的なものです。得られた人工餌配列/ MSスペクトルマッチングのタンパク質配列および組成を有する標的配列データベースにより、タンデムMSを用いる方法。理想的には、標的配列と餌分布スペクトルマッチの確率は同じです。そのため、餌が誤った一致の数の推定値であることをターゲット・データベースにヒット、FDRは試合やゴールの数との比で餌を推定するために、レポートの数が一致しています。

欠陥の餌ライブラリーを構築するための合理的な餌の客観的な方法の問題の核心は、Bruijnグラフの通りデ使用して餌構築物のライブラリは、共通の抗餌ライブラリライブラリや生成のランダムライブラリを避けるためです。

 

第三に、実験計画:

 

第四に、研究成果:

図1に示すように、生成ペプチドおよびペプチドの合計数の異なる方法で餌とライブラリターゲットライブラリの種類の数。ターゲット・ライブラリーに見られるように、ペプチドの繰り返し数の半分程度です。だから、ランダムペプチドライブラリーは、最終的に高いFDRさんにつながるより生成されたシャッフリング餌と正規化されたシャッフルの種類が含まれています。他の4つの方法は、おとりのシーケンスを生成するこの問題を回避または軽減するために一定のルールを利用しています。

 

 

2、1%のFDRで異なるベイトペプチドライブラリースペクトルの数に一致します。FDR正規化シャッフリング法は、正規化係数算出0.519が乗算されます。図からわかるように餌の最大数は、取得したデbrujinを使用して、ライブラリペプチド。この現象は、以下の観点から説明することができます。

ランダムシャッフル、正規化されたシャッフリングおよびTPP方法については、パフォーマンスの低下は、より多くのターゲットライブラリよりもするおとりデータベースペプチドの一種であるため。ベイトペプチド種が増加するにつれて、より多くの餌ペプチドと質量スペクトルは、ランダムに解消生成される閾値に標的ペプチドに一致する実際のベイトペプチドにおけるいくつかの点につながる可能性スコアをマッチさせました。これは、標的ペプチドの正確な同定に悪影響を与えます。

反転反転方式に対してシフト、その理由は、ターゲットとデコイペプチド及びペプチドフラグメントイオンスペクトルとの間に高い相関があるパフォーマンスの低下であってもよいです。

 

 

3、図の例としてデbrujin原理:実施例(A)は、2つの標的タンパク質配列ライブラリー。(B)kに対応=デBruijnグラフ図。図の経路で対象に対応する各配列。第一の配列、第二の配列との配列は、二つのエッジは、青色、オレンジ色およびブラックである共有します。ラベルの(C)エッジをランダムに別のアミノ酸で置換されます。(D)は、図2に得られた二再マーキング経路中の標的タンパク質を追跡することによりデコイタンパク質配列。

Kからなるアミノ酸のアミノ酸配列を出発物質としてアミノ酸置換がこれを検討する際に簡単に説明すると、シーケンスが反復配列の効果を保護するように、このランダムなアミノ酸同一のアミノ酸置換のために同じです。

 

 

第五に、記事のハイライト(結論ディスカッション):タンパク質の構造を維持しながら、おとりデータベースのデbrujinの方法を実装するために簡単に数学的な厳格この論文は、プレゼント、FDR推定のためのライブラリのライブラリ生成方法を検索し、繰り返しで生成することができますランダム餌シーケンス。この方法は、デBruijnグラフ良い性能の方法を説明した原理と角度データから目標餌ライブラリ両者の類似度の高い問題になり、単純な確率的アプローチは、ターゲット・データベースおよび反復反転法に保持されていないが回避されます。

 

読む人:リュー・ジアウェイ

おすすめ

転載: www.cnblogs.com/ilifeiscience/p/12607158.html