← Retour au Volume Vol.84 (1-4),
Article Open Access

In silico investigation of intronless rhodopsin-like g-protein coupled receptors (GPCR) in the human genome: features and classification

Alem, K., Louhichi, A., Ladjama, A., Rebai, A.

Archives de l’Institut Pasteur de Tunis (2007) — Vol.84 (1-4), — https://doi.org/04pwyer06voir sur pist.tn

Abstract

"The G-protein coupled receptors (GPCRs) form a large protein family in the human genome that have been widely studied and classified into classes and phylogenetic subfamilies. However, there still exist orphan GPCRs that are not classified in any of the known sub- families and new bioinformatics approaches are still needed to address this issue. One of the interesting features of GPCRs is that a large proportion of these proteins are encoded by intronless genes. In this work, we are interested in the study of Rhodpsin-like GPCRs proteins encoded by this kind of genes. After a manual validation of their gene structure, we studied some of their properties including the number of exons, chromosomal location and protein length. The same trend was found for intronless GPCRs as compared to total GPCRs, particularly the uneven chromosomal distribution with a large number (one third) of GPCRs on chromosomes 1 and 11. The proportion of intronless GPCRs among all Rhdopsin-like GPCRs was estimated to about 26% which is significantly less than previously reported. Significant differences in protein length were found between subfamilies. We then used composition properties of DNA and protein sequences to classify intronless Rhodopsin-like GPCRs. Principal component analysis was used to identify key variable and then a discriminant analysis was used to compute discriminant functions that best separates the phylogenetic subfamilies. We found that the most important features to separates the groups is the proportion of aromatic amino acids in protein sequence and the contrast between (A+T) versus (G+C) in coding sequence. These functions are finally used to classify fourteen putative or unclassified GPCRs."

Keywords: G-protein coupled receptors, Rhodopsin-like GPCRs, intronless genes, classification, bioinformatics

Résumé :

"Les récepteurs couplés aux protéines G (GPCR) for- ment une grande famille du génome humain qui comprend plusieurs classes et sous-familles. L’une des propriétés les plus intéressantes de ces protéines est qu’elles sont codées par des ORF contenus dans un seul exon. Dans ce travail nous-nous intéressons aux protéines GPCR de la class A (Rhodpsin-like) et en particulier à celles qui sont codées par un seul exon. Nous avons trouvé que les GPCR monoexoniques représentent 26% de toutes les GPCR de class A, une proportion nettement plus faible que celles rapportées auparavant (40-90%). Nous avons ensuite étudié quelques propriétés de ces GPCRs comme la localisation chromosomique et nous avons noté leur distribution non uniforme avec près du tiers de ces GPCRs situés sur les chromosomes 1 et 11. Enfin, nous avons classé ces GPCRs sur la base de variables de composition de la séquence ADN et pro- téique. En utilisant l’analyse en composante princi- pale puis l’analyse discriminante nous avons trouvé que 3 des 4 sous-familles pouvaient être distingués principalement par la composition en acides aminés aromatiques des protéines et par la différence entre la fréquence des bases (A+T) contre (G+C) de la séquence codante. Nous avons utilisé les fonctions discriminantes identifiées pour classer 40 GPCR de fonction inconnue. "

REFERENCES :