Bibliotecile cu compuși candidați pentru medicamente pot deține potențiale tratamente pentru o varietate de boli, cum ar fi cancerul sau bolile cardiovasculare. În mod ideal, oamenii de știință ar dori să testeze experimental fiecare dintre acești compuși împotriva tuturor țintelor posibile, dar efectuarea unui astfel de tip de screening necesită mult timp.

În ultimii ani, cercetătorii au început să folosească metode computaționale pentru a verifica aceste biblioteci în speranța de a accelera descoperirea medicamentelor. Cu toate acestea, multe dintre aceste metode durează mult timp, deoarece majoritatea calculează structura tridimensională a fiecărei proteine ​​țintă din secvența sa de aminoacizi, apoi folosesc acele structuri pentru a prezice cu care dintre molecule de medicament va interacționa.

Cercetătorii de la MIT și de la Universitatea Tufts au conceput acum o abordare computațională alternativă bazată pe un tip de algoritm de inteligență artificială, cunoscut sub numele de model de limbaj mare. Aceste modele – un exemplu binecunoscut este ChatGPT – pot analiza cantități uriașe de text și pot afla ce cuvinte (sau, în acest caz, aminoacizi) sunt cel mai probabil să apară împreună. Noul model, cunoscut sub numele de ConPLex, poate potrivi proteinele țintă cu potențiale molecule de medicament fără a fi nevoie să efectueze pasul intensiv de calcul al structurilor moleculare.

Folosind această metodă, cercetătorii pot analiza peste 100 de milioane de compuși într-o singură zi – mult mai mult decât orice model existent.

„Această lucrare abordează nevoia de screening in silico eficient și precis al potențialilor candidați pentru medicamente, iar scalabilitatea modelului permite scanarea la scară largă pentru evaluarea efectelor în afara țintei, reutilizarea medicamentelor, etc.”, spune Bonnie Berger, unul dintre autorii principali ai noului studiu.

Predicțiile

În ultimii ani, oamenii de știință au făcut progrese mari în dezvoltarea modelelor care pot prezice structurile proteinelor pe baza secvențelor de aminoacizi. Cu toate acestea, utilizarea acestor modele pentru a prezice modul în care o bibliotecă mare, care conține potențiale medicamente ar putea interacționa cu o proteină canceroasă, de exemplu, s-a dovedit o provocare, în principal pentru că calcularea structurilor tridimensionale ale proteinelor necesită mult timp și putere de calcul.

Un obstacol suplimentar este că aceste tipuri de modele nu au rezultate bune în ceea ce privește eliminarea compușilor cunoscuți sub numele de ”capcană”, care sunt asemănători cu un medicament de succes, dar nu interacționează bine cu ținta.

„Una dintre provocările de lungă durată în domeniu a fost că aceste metode sunt fragile, în sensul că, dacă i-am dat modelului un medicament sau o moleculă mică care arăta aproape la fel, dar era ușor diferită, modelul ar putea prevedea în continuare că vor interacționa, chiar dacă nu ar trebui,” spune Rohit Singh.

Cercetătorii au conceput modele care pot depăși acest tip de fragilitate, dar sunt de obicei adaptate doar unei singure clase de molecule de medicamente și nu sunt potrivite pentru scanarea la scară largă, deoarece calculele durează prea mult.

Echipa MIT a decis să adopte o abordare alternativă, bazată pe un model de proteine ​​pe care l-au dezvoltat pentru prima dată în 2019. Lucrând cu o bază de date de peste 20.000 de proteine, modelul de limbaj codifică aceste informații în reprezentări numerice semnificative ale fiecărei secvențe de aminoacizi care captează asociațiile dintre secvenţă şi structură.

„Cu aceste modele de limbaj, chiar și proteinele care au secvențe foarte diferite, dar care pot avea structuri similare sau funcții similare pot fi reprezentate într-un mod similar în acest spațiu lingvistic și suntem capabili să profităm de asta pentru a realiza predicții”, afirmă Samuel Sledzieski.

În noul lor studiu, cercetătorii au instruit rețeaua neuronală privind interacțiunile dintre proteine ​​​​-medicamente cunoscute, ceea ce i-a permis să învețe să asocieze caracteristicile specifice ale proteinelor cu capacitatea de legătură a medicamentelor, fără a fi nevoie să calculeze structura 3D a vreunei molecule.

„Cu această reprezentare numerică de înaltă calitate, modelul poate scurtcircuita în întregime reprezentarea atomică și, din aceste numere, poate prezice dacă acest medicament va forma sau nu o legătură. Avantajul este reprezentat de faptul că eviți nevoia de a trece printr-o reprezentare atomică, iar numerele au în continuare toate informațiile de care ai nevoie”, spune cercetătorul Rohit Singh.

Un alt avantaj al acestei abordări este că ține cont de flexibilitatea structurilor proteinelor, care pot fi „încărcate” și pot lua forme ușor diferite atunci când interacționează cu o moleculă de medicament.

Afinitatea chimică

Pentru ca modelul lor să fie mai puțin probabil să fie ”păcălit” de moleculele de medicamentele ”capcană ”, cercetătorii au încorporat și o etapă de antrenament bazată pe conceptul de analiză contrastivă. Conform acestei abordări, cercetătorii dau ca exemple modelul de medicamente „adevărate” și ”capcană” și îl învață să facă distincția între ele.

Cercetătorii și-au testat apoi modelul prin screening-ul unei biblioteci de aproximativ 4.700 de molecule candidate pentru medicamente, care au capacitatea de a forma legături cu un set de 51 de enzime, cunoscute sub numele de kinaze.

Din primele rezultate, cercetătorii au ales 19 perechi medicament-proteină pentru a le testa experimental. Experimentele au arătat că dintre cele 19 rezultate, 12 au avut o afinitate ridicată de legătură (în intervalul nanomolar), în timp ce aproape toate celelalte perechi medicament-proteină posibile nu prezintă afinitate. Patru dintre aceste perechi au format legături cu afinitate extrem de mare, subnanomolară (atât de puternică încât o concentrație mică de medicament, de ordinul părților pe miliard, va inhiba proteina).

În timp ce cercetătorii s-au concentrat în principal pe screeningul medicamentelor cu molecule mici în acest studiu, acum lucrează la aplicarea acestei abordări la alte tipuri de medicamente, cum ar fi anticorpii terapeutici. Acest tip de modelare s-ar putea dovedi util pentru rularea screeningului de toxicitate a potențialilor compuși, pentru a elimina efectele secundare nedorite înainte de a le testa pe modele animale.

„O parte din motivul pentru care descoperirea medicamentelor este atât de costisitoare este că are rate mari de eșec. Dacă putem reduce aceste rate de eșec spunând dinainte că medicamentul nu este probabil să funcționeze, asta ar putea contribui în mare măsură la scăderea costului descoperirii medicamentelor”, spune Singh.

Această nouă abordare „reprezintă o descoperire semnificativă în predicția interacțiunii medicament-țintă și deschide oportunități suplimentare privind cercetările viitoare. De exemplu, încorporarea informațiilor structurale în spațiul latent sau explorarea metodelor de generare moleculară a ”capcanelor”, ar putea îmbunătăți și mai mult predicțiile”, spune Eytan Ruppin, șeful Laboratorului de Știință a datelor despre cancer de la Institutul Național al Cancerului.

 

Sursă: news.mit.edu