19.02.2019 - 13:33
Una investigadora del Barcelona Supercomputing Center-Centre Nacional de Supercomputació (BSC) ha liderat la creació d’un mètode computacional basat en tècniques d’aprenentatge automàtic (‘machine learning’) d’intel·ligència artificial que accelera la identificació de gens relacionats amb el càncer i que n’ha detectat trenta-sis que poden estar-hi relacionats.
L’estudi, publicat a ‘Nature Communications’, ha provat biològicament el mètode i els seus resultats, i fa servir el ‘machine learning’ per relacionar grans quantitats de dades òmiques i les recrea en un prototip computacional – cèl·lula integrada o ‘iCell’ – i que permet avançar a descobrir nous biomarcadors i millorar la predicció de supervivència.
La científica, Natasa Przulj, ha destacat que el mètode ‘permet la identificació de gens alterats en el càncer que no apareixen com alterats en cap altre tipus de dades’, ha explicat el centre en un comunicat avui.
‘Aquest descobriment posa de manifest la importància dels enfocaments integratius per analitzar dades biològiques i aplana el camí cap a anàlisis integratives comparatives de totes les cèl·lules’, ha afegit la investigadora.
L’experimentació que es va fer per validar-lo va revelar, entre d’altres dades, que els pacients amb càncer de mama d’alta expressió d’una proteïna – MRLP3 – que no estava relacionada amb el càncer prèviament, tenen menys supervivència.
Aquesta troballa constitueix un exemple del potencial d’aquest mètode per descobrir gens biomarcadors que poden ser rellevants en l’estratificació i predicció de la supervivència en pacients.
Trenta-sis gens
Els autors de l’article han aplicat aquest mètode per reconstruir cèl·lules de quatre dels tipus més comuns de càncer – de mama, pròstata, pulmó i còlon – i en tots ha demostrat ser útil per localitzar gens relacionats amb aquestes malalties.
El mètode ha assenyalat 63 gens i un procés de validació biològica ha confirmat que almenys 36 d’ells contribueixen al creixement irregular de les cèl·lules.
El prototip creat al BSC fusiona tres xarxes d’interacció molecular específiques de teixit: proteïna-proteïna, coexpressió de gens i xarxes d’interacció genètica, a través d’una tècnica de fusió proposada originalment per a l’agrupació i la reducció de la dimensionalitat que s’ha d’utilitzar recentment per a la integració de dades.