Gostaria de saber quantas proteínas humanas têm uma estrutura 3D resolvida. Existe um banco de dados apenas com proteínas humanas? Eu olhei para o pdb, mas não consegui encontrar um filtro.
Gostaria de saber quantas proteínas humanas têm uma estrutura 3D resolvida. Existe um banco de dados apenas com proteínas humanas? Eu olhei para o pdb, mas não consegui encontrar um filtro.
6405 proteínas mapeadas para 5220 genes, de acordo com Ensembl.
No BioMart do Ensembl, você pode selecionar o PDB ID como referência externa. Exporte os resultados e conte as proteínas / genes exclusivos que têm um PDB ID.
PDB é um bom recurso para responder a essas perguntas, pois permitirá que você filtre os resultados por muitos parâmetros adicionais. Para contar e extrair estruturas 3D de proteínas humanas:
Avançada
do site do PDB. Biologia
-> Organismo de origem
no menu. Homo sapiens (humano)
. Remover sequências semelhantes em n% identity
abaixo. Para adicionar mais filtros, clique em Refinar consulta com Pesquisa avançada
. Lá você pode extrair estruturas por data de deposição, qualidade (por exemplo, resolução ou fatores R para estruturas resolvidas por difração de raios-X), ligantes, classificação de enzimas, etc. (marcando Adicionar Critérios de Pesquisa
)
A pesquisa de proteínas humanas com remoção de homólogos com 90% de corte de identidade obtém 7117 estruturas. O número de estruturas de proteína de raio-X de boa qualidade (resolução < 2.5A) é atualmente de 3964 (com o mesmo corte de identidade).
Você pode então baixar a lista obtida ou criar relatórios personalizados (menus abaixo).
Uma boa ferramenta (também usada pelo PDB) para gerar conjuntos de dados de proteínas não redundantes é o cd-hit.
Pelos seus comentários, não parece que você seja avesso a escrever alguns scripts personalizados, então uma opção seria aproveitar as vantagens do banco de dados NCBI Structure. Você pode filtrar por organismo e depois baixar os resultados como um arquivo de texto / XML. Se precisar de acesso aos dados brutos do PDB, você poderá baixar o arquivo PDB e examinar os da sua lista filtrada.
O novo sistema de pesquisa do PDBe foi projetado para responder exatamente a essas perguntas http://www.ebi.ac.uk/pdbe/entry/search/index?organism_synonyms:HUMAN&view=macromolecules
mostra que existem 6964 macromoléculas humanas únicas com dados de estrutura no PDB.
Claro, muitos serão fragmentos de proteínas em vez da molécula inteira.