CATH

CATH(リンク)はタンパク質構造分類データベースである。同様なデータベースに SCOP などがある。SCOP はタンパク質を人工的に分類を行っているのに対し、CATH は半自動的に分類を行っている。

CATH ではタンパク質の構造を主に 4 階層で分類している。

階層
Class クラスは二次構造に基づき、次の 4 クラスのうちどれかに分類される。
  • mostly-alpha
  • mostly-beta
  • alpha and beta
  • few secondary structures
Architecture 構造類似度が非常に高いが、ホモロジーが認められないもの。(SCOP の fold 階層に相当)
Topology 構造の一部が似ていることに基づく分類。
Homologous superfamily 配列相同性、構造類似性を考慮し共通祖先の存在が認められるもの。(SCOP の superfamily に相当)

CATH の各階層には CATH code が決められている。例えば、PDB ID が 2EWA のタンパク質の CATH code は 3.30.200.20 となっている。(CATH へのリンク

CATH code の定義

References

  • Greene LH, Lewis TE, Addou S, Cuff A, Dallman T, Dibley M, Redfern O, Pearl F, Nambudiry R, Reid A, Sillitoe I, Yeats C, Thornton JM, Orengo CA. The CATH domain structure database: new protocols and classification levels give a more comprehensive resource for exploring evolution. Nucleic Acids Res. 2007, 35(Database issue):D291-7. PubMed Abstract