GM Barcelona | martes, 28 de febrero de 2017 h |

Només una petita fracció del genoma humà (prop del 2 per cent) conté gens que codifiquin per a proteïnes, que són els components bàsics en la cèl·lula. El 98 per cent restant és important per regular l’expressió d’aquests gens, és a dir, està implicat a controlar quan i on s’activen. Aquesta gran proporció del genoma produeix, molècules d’ARN (ARN no codificant), de diferents grandàries, estructures i funcions. Els diferents tipus d’ARN no codificant poden interactuar amb les proteïnes i, aquesta interacció pot ser clau perquè l’engranatge funcioni i cada cèl·lula activi o silenciï els gens que necessiti. Actualment s’estan fent grans esforços per estudiar el paper d’aquests ARN no codificants. Lamentablement, fins avui, no existien eines computacionals que permetessin estudiar seqüències llargues d’ARN i, intentar-ho mitjançant mètodes experimentals en el laboratori és encara un enorme repte perquè suposa anar provant “a cegues”.

En un treball que recentment ha publicat la revista Nature Methods, investigadors del Centre de Regulació Genòmica a Barcelona, en col·laboració amb científics en el Laboratori Europeu de Biologia Molecular en Monterotondo (Itàlia) i l’Institut de Tecnologia de Califòrnia (EUA), proposen una nova eina computacional per predir les interaccions de proteïnes amb ARNs no codificantes llargs, que ells mateixos han validat experimentalment.

“Els ARNs no codificants llargs interactuen amb diverses proteïnes per intervenir funcions cel•lulars importants. Intentar identificar aquestes interaccions pot ser un bon punt de partida per comprendre el paper d’aquestes molècules en el funcionament normal de la cèl·lula, però també per comprendre què passa en la malaltia,” explica Gian Gaetano Tartaglia, professor de recerca ICREA al Centre de Regulació Genòmica (CRG) i investigador principal d’aquest article.

La nova eina computacional, el nom de la qual és Global Score, permet als científics predir, en quin punt de la llarga seqüència d’ARN no codificant podria haver-hi una interacció amb una proteïna. Per aconseguir-ho, aquest algorisme integra no només la propensió d’una proteïna per unir-se a un ARN en particular sinó també compta amb les característiques locals i particularitats d’aquesta unió, incloent l’estructura tridimensional d’ambdues molècules. “L’estructura de l’ARN és absolutament important per predir interaccions amb proteïnes. El nostre principal repte era ser capaços de treballar amb seqüències d’ARN independentment de la seva longitud per poder mantenir una visió completa de les propietats de la seva estructura en buscar possibles proteïnes candidates a interaccionar,” afegeix Davide Cirillo, investigador postdoctoral en el CRG i primer autor del treball. “L’algorisme que hem desenvolupat integra tota aquesta informació i ens permet no només predir què proteïnes podrien interactuar sinó també classificar-les i establir prioritats per a la seva validació experimental”, conclou l’investigador.