Apmācītajam neironu tīklam uzdeva dažādus uzdevumus.
Par genomiem, ko izveidojis mākslīgais intelekts, plašsaziņas līdzekļi rakstīja pagājušajā gadā: toreiz runa bija par bakteriofāgu vīrusu genomiem, kuri, neskatoties uz savu mākslīgā intelekta izcelsmi, spēja inficēt baktēriju šūnas.
Nesen tie paši pētnieki publicēja žurnālā Nature rakstu, kurā parādīja, ka tā var radīt ne tikai vīrusu, bet arī baktēriju, mitohondriju un daļēji rauga genomus. Tomēr jaunie genomi līdz šim pastāv tikai digitālā formā; to darbspēja dzīvās šūnās netika pārbaudīta.
Katrā genomā pastāv sarežģīta mijiedarbību un savstarpējas ietekmes sistēma, un tas attiecas ne tikai uz kodējošām secībām, kas satur informāciju par olbaltumvielām (ko parasti saucam par gēniem), bet arī uz daudziem regulējošiem reģioniem. To kopējais apjoms ievērojami pārsniedz pašu olbaltumvielu secību izmēru. Gēni var ietekmēt vienam otru caur tajos kodētajām olbaltumvielām, tie var pakļauties vienam regulēšanas blokam, dažādi regulēšanas bloki var ietekmēt vienu un to pašu secību genomā utt. Mutāciju efekts nozīmīgos genoma apgabalos būs atkarīgs no šādām savstarpējām ietekmēm.
Lai gan genomu lasīšana tagad kļuvusi salīdzinoši vienkārša, DNS reģionu mijiedarbība ne vienmēr ir saprotama. Tajā pašā laikā dažādu organismu genomi ir savstarpēji vairāk vai mazāk radniecīgi, lai gan šis radniecības līmenis var būt ļoti, ļoti attāls. Evolūcijas radniecība izpaužas ne tikai gēnu secībās, bet arī tajā, kā gēni un regulējošie reģioni ir organizēti genomā, kā tie izvietoti vienam attiecībā pret otru. Ja zinām bakteriofāgu vai, piemēram, kādas baktēriju grupas kopējās genomiskās iezīmes, var mēģināt izstrādāt jaunu bakteriofāgu — vai baktēriju — ar kādām jaunas īpašībām, kādu nav tās radiniekiem.
Ko nozīmē «zināt kopīgās iezīmes»? Var noskaidrot, kāpēc šiem organismiem gēni genomā sakārtoti tieši tā un kāds ir bioloģiskais pamatojums novirzēm no vispārējā bakteriofāgu vai baktēriju kārtības. Var rīkoties citādi — nodot genoma datus algoritmiem, līdzīgiem tiem, kas atšifrē olbaltumvielu struktūras vai saliek vārdus teikumos. Tādas modeļi operē ar veseliem genomiem, kā arī ar RNS secībām, uz kurām tiek nokopēta informācija no attiecīgā genoma apgabala, un ar olbaltumvielām, kurās šī informācija gala rezultātā pārvēršas. Ar mākslīgo intelektu var izmantot genomiskās likumsakarības, neiedziļinoties, ko tieši šīs likumsakarības nozīmē.
Tieši tā konstruēja fāgu tajā pētījumā, par ko runājām sākumā, un līdzīgi konstruēja genomas, aprakstītas jaunajā rakstā Nature. Algoritmu ar nosaukumu Evo2, radniecīgu AlphaFold un ChatGPT, trenēja uz pilniem genomiem vairāk nekā 100 tūkstošu sugu no visas dzīvības koka — no vīrusiem un baktērijām līdz cilvēkam; kopējais ģenētisko «burtu» skaits, kas tika izlaists caur Evo2, pārsniedza 9,3 triljonus.
Tālāk apmācītajam neironu tīklam uzdeva dažādus uzdevumus. Piemēram, tam bija jānosaka, kā konkrēta mutācija ietekmēs organismu gan kodējošā, gan nekodējošā genoma reģionā. Viens no kodējošajiem reģioniem, kurā pārbaudīja Evo2, bija BRCA1 gēns, sen pazīstams ar saistību ar krūts vēzi. Mutācijas tajā, kā jebkurā gēnā, var būt gan bīstamas, gan nekaitīgas, un Evo2 tās atšķīra ar 90% precizitāti.
Citās pārbaudēs algoritmam vajadzēja ģenerēt genomu, kas līdzinātos īstam. Pēc darba autoru teiktā, viņiem izdevās radīt baktērijas Mycoplasma genitalium genomu, mitohondrija genomu un vienu no maizes rauga hromosomām. Pēc tam ģenerētos genomus pārbaudīja uz ticamību, un baktērijas genomā gēnu daļa, kas līdzinājās īstajiem, bija aptuveni 70%.
Taču, ja pieņem, ka šāds genoms šūnai ļautu dzīvot un darboties, jādomā par atlikušajiem 30%, jo maz ticams, ka var būt «daļēji dzīvs» — dzīve vai nu ir, vai nav. Turklāt jāņem vērā gēnu izvietojums: pat ja sintētiskajā genomā ir visi nepieciešamie gēni, to nepareizā izvietojuma dēļ tie var darboties nepareizi.
Pat vēl izdevuma sagatavošanas laikā Evo2 radās jautājumi par to, ka algoritma ģenerētie genomi arhitektūrā atšķiras no dabiskajiem. Tas nenozīmē, ka mākslīgā intelekta radītais genoms nedarbosies, taču to tomēr jātestē eksperimentāli. Iespējams, nevajag uzreiz tiekties pēc pilniem genomiem, pat tik relatīvi vienkāršiem kā baktēriju vai mitohondriju genomi. Pašlaik pilnīgi pietiek, ja neironu tīkls spēs ar lielu precizitāti prognozēt mutāciju efektu, atbrīvojot pētniekus no liekas eksperimentālās slodzes.
M. genitalium šajā gadījumā izvēlēts ne velti. Tam ir pavisam 525 gēni, no kuriem 470 kodē olbaltumvielas; no tiem 375 ir dzīvībai svarīgi. Tā genoms ir viens no mazākajiem starp dzīvajiem organismiem (izņemot vīrusus). M. genitalium un citas mikoplazmas jau ilgi izmanto eksperimentos, kad dabiskā šūnu DNS tiek aizstāta ar sintētisku, rediģētu kopiju. Vēl viena iespēja iejaukties genomā ir mainīt pats ģenētiskais kods — koriģēt burta tripletu «vārdnīcu», kas atbilst konkrētai aminoskābei. Genoma projektēšana, izmantojot mākslīgo intelektu, izskatās vēl vērienīgāks pasākums attiecībā uz izmaiņām, ko var veikt ģenētiskajā tekstā. Tomēr — jāatkārto — mākslīgā intelekta sasniegumus vēl nepieciešams pārbaudīt «dzīvos» eksperimentos.
<iframe width="560" height="315" src="https://www.youtube.com/embed/C4VXu8lpBXc?si=ntyH3yqGOFXize7d" title="YouTube video player" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>