Jinsi Kompyuta Zinavyosaidia Wanabiolojia Kupunguza Siri za Maisha

Mara tu genome ya kibinadamu yenye urefu wa herufi tatu ikifuatwa, tulikimbilia kwenye "mpya"Wasiovu”Enzi ya utafiti wa kibaolojia. Wanasayansi sasa wanakimbilia kufuata mlolongo wa jeni (jeni zote) au proteni (protini zote) za viumbe anuwai - na katika mchakato wanakusanya idadi kubwa ya data.

Kwa mfano, mwanasayansi anaweza kutumia zana za "omics" kama vile upangaji wa DNA kuteka ni jeni gani za kibinadamu zinazoathiriwa na maambukizo ya homa ya virusi. Lakini kwa sababu jenomu ya binadamu ina angalau jeni 25,000 kwa jumla, idadi ya jeni iliyobadilishwa hata chini ya hali rahisi inaweza kuwa katika maelfu.

Ingawa upangaji na kutambua jeni na protini huwapa jina na mahali, haituambii wanafanya nini. Tunahitaji kuelewa jinsi jeni hizi, protini na vitu vyote katikati kuingiliana katika michakato tofauti ya kibaolojia.

Leo, hata majaribio ya kimsingi hutoa data kubwa, na moja ya changamoto kubwa ni kutenganisha matokeo yanayofaa kutoka kwa kelele ya nyuma. Kompyuta zinatusaidia kushinda mlima huu wa data; lakini wanaweza hata kwenda hatua zaidi ya hapo, kutusaidia kupata nadharia za kisayansi na kuelezea michakato mpya ya kibaolojia. Sayansi ya data, kwa asili, inawezesha utafiti wa kibaolojia wa kupunguza makali.

Kompyuta kwa kuwaokoa

Kompyuta zina sifa ya kipekee kushughulikia seti kubwa za data kwani zinaweza wakati huo huo kufuatilia hali zote muhimu zinazohitajika kwa uchambuzi.


innerself subscribe mchoro


Ingawa wao inaweza kuonyesha makosa ya kibinadamu zimepangwa na, kompyuta zinaweza kushughulika na data nyingi kwa ufanisi na hazina upendeleo kwa wanaojulikana, kama wachunguzi wa kibinadamu wanaweza kuwa.

Kompyuta zinaweza pia kufundishwa kutafuta mifumo maalum katika seti za data za majaribio - dhana inayoitwa ujifunzaji wa mashine, iliyopendekezwa kwanza katika miaka ya 1950, haswa na mtaalam wa hesabu Alan Turing. Algorithm ambayo imejifunza mifumo kutoka kwa seti za data inaweza kuulizwa kutoa utabiri kulingana na data mpya ambayo haijawahi kukutana hapo awali.

Ujifunzaji wa mashine umebadilisha utafiti wa kibaolojia kwani sasa tunaweza kutumia seti kubwa za data na kuuliza kompyuta kusaidia kuelewa biolojia ya msingi.

Kufundisha Kompyuta Kufikiria Kwa Kuiga Michakato ya Ubongo

Tumetumia aina moja ya kupendeza ya ujifunzaji wa mashine, inayoitwa mtandao bandia wa neva (ANN), katika maabara yetu wenyewe. Wabongo ni mitandao iliyounganishwa sana ya neva, ambayo huwasiliana kwa kutuma kunde za umeme kupitia wiring ya neva. Vivyo hivyo, ANN huiga kwenye kompyuta mtandao wa neva wanapowasha na kuzima kwa kujibu ishara zingine za neuroni.

Kwa kutumia algorithms ambazo zinaiga michakato ya neuroni halisi, tunaweza kufanya mtandao ujifunze kutatua aina nyingi za shida. Google hutumia ANN yenye nguvu kwa maarufu sasa Mradi wa Ndoto ya kina ambapo kompyuta zinaweza kuainisha na hata kuunda picha.

Kikundi chetu kinasoma mfumo wa kinga, kwa lengo la kutafuta tiba mpya za saratani. Tumetumia mifano ya hesabu ya ANN kusoma nambari fupi za protini za uso seli zetu za kinga hutumia kuamua ikiwa kitu ni kigeni kwa mwili wetu na kwa hivyo inapaswa kushambuliwa. Ikiwa tunaelewa zaidi juu ya jinsi seli zetu za kinga (kama T-seli) zinavyotofautisha kati ya seli za kawaida / za kibinafsi na zisizo za kawaida / za kigeni, tunaweza kubuni chanjo bora na tiba.

Tulitafuta katalogi zinazopatikana hadharani za maelfu ya nambari za protini zilizotambuliwa na watafiti zaidi ya miaka. Tuligawanya data hii kubwa iliyowekwa katika mbili: nambari za kawaida za protini zinazotokana na seli za binadamu zilizo na afya, na kanuni zisizo za kawaida za protini zinazotokana na virusi, uvimbe na bakteria. Kisha tukageukia mtandao wa bandia wa neva uliotengenezwa katika maabara yetu.

Mara tu tulipolisha nambari za protini kwenye ANN, algorithm iliweza kutambua tofauti za kimsingi kati ya kanuni za kawaida na zisizo za kawaida za protini. Itakuwa ngumu kwa watu kufuatilia aina hizi za matukio ya kibaolojia - kuna maelfu ya kanuni hizi za protini kuchambua katika seti kubwa ya data. Inachukua mashine kugombana na shida hizi ngumu na kufafanua biolojia mpya.

Utabiri Kupitia Kujifunza kwa Mashine

Matumizi muhimu zaidi ya ujifunzaji wa mashine katika biolojia ni matumizi yake katika kufanya utabiri kulingana na data kubwa. Utabiri unaotegemea kompyuta unaweza kuwa na maana ya data kubwa, jaribu nadharia na uhifadhi wakati na rasilimali muhimu.

Kwa mfano, katika uwanja wetu wa biolojia ya T-seli, kujua ni kanuni gani za protini za virusi zinazolenga ni muhimu katika kukuza chanjo na matibabu. Lakini kuna kanuni nyingi za protini kutoka kwa virusi vyovyote ambavyo ni ghali sana na ni ngumu kujaribu kila jaribio.

Badala yake, tulifundisha mtandao bandia wa neva kusaidia mashine kujifunza sifa zote muhimu za biokemikali za aina mbili za kanuni za protini - kawaida dhidi ya isiyo ya kawaida. Kisha tukauliza mfano "kutabiri" ni kanuni gani mpya za protini za virusi zinafanana na jamii "isiyo ya kawaida" na inaweza kuonekana na seli za T na kwa hivyo mfumo wa kinga. Tulijaribu mfano wa ANN kwenye protini tofauti za virusi ambazo hazijawahi kusomwa hapo awali.

Kwa kweli, kama mwanafunzi mwenye bidii anayetamani kumpendeza mwalimu, mtandao wa neva uliweza kutambua kwa usahihi idadi kubwa ya nambari za protini zinazoamilisha T ndani ya virusi hivi. Tulijaribu pia majaribio ya protini ambayo iliripoti kuthibitisha usahihi wa utabiri wa ANN. Kutumia mtindo huu wa mtandao wa neva, mwanasayansi anaweza hivyo kutabiri haraka kanuni zote fupi muhimu za protini kutoka kwa virusi hatari na ujaribu ili kupata matibabu au chanjo, badala ya kubashiri na kupima moja kwa moja.

Kutekeleza Ujifunzaji wa Mashine kwa Hekima

Shukrani kwa usafishaji wa kila wakati, sayansi kubwa ya data na ujifunzaji wa mashine zinazidi kuwa muhimu kwa aina yoyote ya utafiti wa kisayansi. Uwezekano wa kutumia kompyuta kufundisha na kutabiri katika biolojia ni karibu kutokuwa na mwisho. Kutoka kwa kugundua ni mchanganyiko gani wa biomarkers ni bora kwa kugundua ugonjwa kuelewa ni kwanini tu wagonjwa wengine hufaidika na matibabu fulani ya saratani, kuchimba seti kubwa za data kwa kutumia kompyuta imekuwa njia muhimu ya utafiti.

Kwa kweli, kuna mapungufu. Shida kubwa na sayansi kubwa ya data ni data yenyewe. Ikiwa data iliyopatikana na masomo ya -omics ina makosa kuanza na, au kulingana na sayansi isiyo na ujinga, mashine zitapewa mafunzo juu ya data mbaya - na kusababisha utabiri mbaya. Mwanafunzi ni mzuri tu kama mwalimu.

Kwa sababu kompyuta sio za kupendeza (bado), wanaweza katika harakati zao za mwelekeo kuja nao hata wakati hakuna yoyote, ikitoa kuongezeka tena, kwa data mbaya na sayansi isiyoweza kuzalishwa.

Na watafiti wengine wameelezea wasiwasi juu ya kompyuta kuwa sanduku nyeusi za data kwa wanasayansi ambao hawaelewi wazi ujanja na hila wanazofanya kwa niaba yao.

Licha ya shida hizi, faida za data kubwa na mashine zitaendelea kuwafanya washirika muhimu katika utafiti wa kisayansi. Kwa kuzingatia mapango, tumejiandaa kipekee kuelewa biolojia kupitia macho ya mashine.

Kuhusu MwandishiMazungumzo

Sri Krishna, Mgombea wa PhD, Ubuni wa Baiolojia, Shule ya Uhandisi wa Mifumo ya Baiolojia na Afya, Chuo Kikuu cha Arizona State na Diego Chowell, Mwanafunzi wa PhD katika Hisabati Iliyotumiwa, Chuo Kikuu cha Arizona State

Makala hii ilichapishwa awali Mazungumzo. Soma awali ya makala.


Kurasa Kitabu:

at InnerSelf Market na Amazon