Je! Ni Video Zipi Za Deepfake Na Kuzigundua Kupepesa Jicho

Njia mpya ya habari potofu iko tayari kuenea kupitia jamii za mkondoni wakati kampeni za uchaguzi wa katikati ya mwaka wa 2018 zinawaka. Inaitwa "kina" baada ya akaunti isiyojulikana ya mkondoni ambayo ilifahamisha mbinu hiyo - ambayo inaweza kuwa imechagua jina lake kwa sababu mchakato hutumia njia ya kiufundi inayoitwa "ujifunzaji wa kina" - video hizi bandia zinaonekana kweli.

Hadi sasa, watu wametumia video za kina ndani ponografia na satire kuifanya ionekane kwamba watu mashuhuri wanafanya mambo ambayo kwa kawaida hawatendi.

Lakini ni karibu hakika kina kinaonekana wakati wa msimu wa kampeni, inayoashiria kuonyesha wagombea kusema mambo au kwenda mahali mgombea halisi hangefanya.

Ni Barack Obama - au ni hivyo?

{youtube}cQ54GDm1eL0{/youtube}

Kwa sababu mbinu hizi ni mpya sana, watu wanapata shida kusema tofauti kati ya video halisi na video za kina. Kazi yangu, na mwenzangu Ming-Ching Chang na Ph.D. mwanafunzi Yuezun Li, amepata njia ya sema kwa uaminifu video halisi kutoka kwa video za kina. Sio suluhisho la kudumu, kwa sababu teknolojia itaboresha. Lakini ni mwanzo, na inatoa matumaini kwamba kompyuta zitaweza kusaidia watu kusema ukweli kutoka kwa hadithi za uwongo.


innerself subscribe mchoro


Je! Ni nini 'kina,' hata hivyo?

Kufanya video ya kina ni kama kutafsiri kati ya lugha. Huduma kama Google Tafsiri tumia ujifunzaji wa mashine - uchambuzi wa kompyuta ya makumi ya maelfu ya maandishi kwa lugha nyingi - kwa gundua mifumo ya matumizi ya maneno ambayo hutumia kuunda tafsiri.

Njia za kina za kufanya kazi kwa njia ile ile: Wanatumia aina ya mfumo wa kujifunza mashine uitwao mtandao wa kina wa neva kuchunguza nyuso za uso wa mtu mmoja. Kisha huunganisha picha za uso wa mtu mwingine akifanya harakati zinazofanana. Kufanya hivyo kwa ufanisi hutengeneza video ya mlengwa anayeonekana kufanya au kusema vitu ambavyo mtu wa chanzo alifanya.

Jinsi video za kina zinafanywa.

{youtube}8LhI-e2B8Lg{/youtube}

Kabla ya kufanya kazi vizuri, mitandao ya kina ya neva inahitaji habari nyingi za chanzo, kama picha za watu kuwa chanzo au lengo la kuiga. Picha zaidi zinazotumiwa kufundisha algorithm ya kina, ndivyo uigaji wa dijiti utakavyokuwa wa kweli zaidi.

Kugundua kupepesa

Bado kuna makosa katika aina hii mpya ya algorithm. Mmoja wao anahusiana na jinsi nyuso za kuiga zinaangaza - au sivyo. Wanadamu wazima wenye afya wanapepesa mahali fulani kati ya kila sekunde 2 hadi 10, na kupepesa moja huchukua kati ya moja ya kumi na nne ya kumi ya sekunde. Hiyo ndio itakuwa kawaida kuona kwenye video ya mtu anayezungumza. Lakini sio kinachotokea kwenye video nyingi za kina.

Mtu halisi huangaza huku akiongea.

{youtube}https://www.youtube.com/watch?v=-MMXXEA3UaM{/youtube}

Uso ulioiga hauangazi jinsi mtu halisi anavyofanya.

{youtube}EttSA9-YIuI{/youtube}

Wakati algorithm ya kuzamisha imefunzwa kwenye picha za uso za mtu, inategemea picha ambazo zinapatikana kwenye wavuti ambazo zinaweza kutumiwa kama data ya mafunzo. Hata kwa watu ambao hupigwa picha mara nyingi, picha chache zinapatikana mkondoni kuonyesha macho yao yamefungwa. Sio tu kwamba picha kama hizo ni nadra - kwa sababu macho ya watu huwa wazi wakati mwingi - lakini wapiga picha huwa hawachapishi picha ambazo macho kuu hufungwa.

Bila mafunzo ya picha za watu wanaopepesa macho, algorithms za kina za ndani zina uwezekano mdogo wa kuunda nyuso ambazo zinaangaza kawaida. Tunapohesabu kiwango cha jumla cha kupepesa, na kulinganisha hiyo na anuwai ya asili, tuligundua kuwa wahusika kwenye video za kina huangaza mara kwa mara ikilinganishwa na watu halisi. Utafiti wetu unatumia ujifunzaji wa mashine kwa chunguza kufungua macho na kufunga kwenye video.

Hii inatupa msukumo wa kugundua video za kina. Baadaye, tunaunda njia ya kugundua wakati mtu kwenye video anaangaza. Ili kubainisha zaidi, inatafuta kila fremu ya video inayohusika, hugundua sura zilizo ndani yake na kisha huweka macho moja kwa moja. Halafu hutumia mtandao mwingine wa kina wa neva kuamua ikiwa jicho lililogunduliwa limefunguliwa au limefungwa, kwa kutumia mwonekano wa jicho, huduma za jiometri na harakati.

Tunajua kwamba kazi yetu inachukua faida ya kasoro katika aina ya data inayopatikana kufundisha algorithms ya kina. Ili kuepuka kudhoofika kwa kasoro kama hiyo, tumefundisha mfumo wetu kwenye maktaba kubwa ya picha za macho wazi na yaliyofungwa. Njia hii inaonekana kufanya kazi vizuri, na kwa sababu hiyo, tumepata kiwango cha kugundua zaidi ya asilimia 95.

Hili sio neno la mwisho la kugundua undani, kwa kweli. Teknolojia ni inaboresha haraka, na ushindani kati ya kutengeneza na kugundua video bandia ni sawa na mchezo wa chess. Hasa, kupepesa kunaweza kuongezwa kwenye video za kina kwa kujumuisha picha za uso na macho yaliyofungwa au kutumia mfuatano wa video kwa mafunzo. Watu ambao wanataka kuchanganya umma watakuwa bora katika kutengeneza video za uwongo - na sisi na wengine katika jamii ya teknolojia tutahitaji kuendelea kutafuta njia za kuzigundua.Mazungumzo

Kuhusu Mwandishi

Siwei Lyu, Profesa Mshirika wa Sayansi ya Kompyuta; Mkurugenzi, Maono ya Kompyuta na Maabara ya Kujifunza Mashine, Chuo Kikuu cha Albany, Chuo Kikuu cha Jimbo cha New York

Makala hii ilichapishwa awali Mazungumzo. Soma awali ya makala.

Vitabu kuhusiana

at InnerSelf Market na Amazon