Jinsi Marafiki Wako Kwenye Twitter Wanavyoweza Kukupa Kutokujulikana kwako

Unapovinjari mtandao, watangazaji mkondoni hufuatilia karibu kila tovuti unayotembelea, kukusanya taarifa nyingi juu ya tabia na matakwa yako. Unapotembelea wavuti ya habari, wanaweza kukuona wewe ni shabiki wa mpira wa kikapu, opera na riwaya za siri, na ipasavyo chagua matangazo yanayolingana na ladha yako.

Watangazaji hutumia habari hii kuunda uzoefu wa kibinafsi, lakini kwa kawaida hawajui wewe ni nani. Wanachunguza tu njia yako ya dijiti, sio kitambulisho chako yenyewe, na kwa hivyo unaweza kuhisi kuwa umehifadhi kiwango cha kutokujulikana.

Lakini, kwenye jarida nilishirikiana na Ansh Shukla, Sharad Goel na Arvind Narayanan, tunaonyesha kuwa rekodi hizi za kuvinjari zisizojulikana bila shaka zinaweza mara nyingi kushikamana na vitambulisho vya ulimwengu halisi.

Ili kujaribu njia yetu, tulijenga Tovuti ambapo watu wangeweza kuchangia historia yao ya kuvinjari kwa madhumuni ya utafiti huu. Tulijaribu kujaribu kuona ikiwa tunaweza kuunganisha historia zao kwenye wasifu wao wa Twitter kwa kutumia data inayopatikana tu hadharani. Asilimia sabini na mbili ya watu ambao tulijaribu kutaja jina lao walitambuliwa kwa usahihi kama mgombea wa juu katika matokeo ya utaftaji, na asilimia 81 walikuwa kati ya watahiniwa 15 bora.

faragha2 2 8Viwambo vya wavuti ya kuondoa jina.

Hii ni, kwa ufahamu wetu, onyesho kubwa zaidi la kutokujulikana hadi sasa, kwani inachukua mtumiaji sahihi kati ya mamia ya mamilioni ya watumiaji wa Twitter. Kwa kuongezea, njia yetu inahitaji tu kwamba mtu abonyeze kwenye viungo vinavyoonekana kwenye milisho yao ya media ya kijamii, sio kwamba wanachapisha yaliyomo yoyote - kwa hivyo hata watu ambao wako makini juu ya kile wanachoshiriki kwenye mtandao bado wana hatari ya shambulio hili.


innerself subscribe mchoro


Jinsi inavyofanya kazi

Katika kiwango cha juu, njia yetu inategemea uchunguzi rahisi. Kila mtu ana mtandao tofauti wa kijamii, unaojumuisha familia na marafiki kutoka shule, kazi na hatua anuwai za maisha. Kama matokeo, seti ya viungo kwenye milisho yako ya Facebook na Twitter ni tofauti sana. Kubofya kwenye viungo hivi huacha alama ya hadithi katika historia yako ya kuvinjari.

Kwa kuangalia seti ya kurasa za wavuti ambazo mtu ametembelea, tuliweza kuchagua milisho sawa ya media ya kijamii, ikitoa orodha ya wagombea ambao labda walitengeneza historia hiyo ya kuvinjari wavuti. Kwa njia hii, tunaweza kufunga kitambulisho cha ulimwengu halisi kwa seti ya viungo kamili ambavyo wametembelea, pamoja na viungo ambavyo havikuwekwa kwenye tovuti yoyote ya media ya kijamii.

Kufanya mkakati huu kunahusisha changamoto mbili muhimu. Ya kwanza ni ya kinadharia: Je! Unabainishaje jinsi malisho maalum ya media ya kijamii yanavyofanana na historia ya kuvinjari wavuti? Njia moja rahisi ni kupima sehemu ya viungo kwenye historia ya kuvinjari ambayo pia huonekana kwenye malisho. Hii inafanya kazi vizuri katika mazoezi, lakini inazidisha kufanana kwa milisho kubwa, kwani zile zina viungo zaidi. Badala yake tunachukua njia mbadala. Tunatoa mfano wa stylized, uwezekano wa tabia ya kuvinjari wavuti, na kisha tunahesabu uwezekano wa mtumiaji na malisho ya media ya kijamii yaliyotengeneza historia ya kuvinjari. Kisha tunachagua malisho ya media ya kijamii ambayo inawezekana.

Changamoto ya pili inajumuisha kutambua milisho inayofanana zaidi kwa wakati halisi. Hapa tunageukia Twitter, kwani milisho ya Twitter (tofauti na Facebook) ni ya umma. Walakini, ingawa milisho iko kwa umma, hatuwezi tu kuunda nakala ya ndani ya Twitter dhidi ya ambayo tunaweza kuendesha maswali yetu. Badala yake tunatumia anuwai ya mbinu za kupunguza sana nafasi ya utaftaji. Kisha tunachanganya mbinu za kuhifadhi akiba na utambazaji wa mtandao unaohitajika kujenga milisho ya wagombea wanaoahidi zaidi. Kwenye seti hii ya mgombea aliyepunguzwa, tunatumia kipimo chetu cha kufanana ili kutoa matokeo ya mwisho. Kwa kuzingatia historia ya kuvinjari, kwa kawaida tunaweza kutekeleza mchakato huu wote chini ya sekunde 60.

Njia yetu ni sahihi zaidi kwa watu wanaovinjari Twitter kwa bidii zaidi. Asilimia tisini ya washiriki ambao walibonyeza viungo 100 au zaidi kwenye Twitter wanaweza kuendana na utambulisho wao.

Kampuni nyingi zina rasilimali za kufuatilia kutekeleza shambulio kama hili, hata bila idhini ya mshiriki. Tulijaribu kutofautisha kila mmoja wa washiriki wetu wa majaribio akitumia sehemu tu za historia zao za kuvinjari ambazo zilionekana kwa kampuni maalum za ufuatiliaji (kwa sababu kampuni zina wafuatiliaji kwenye kurasa hizo). Tuligundua kuwa kampuni kadhaa zilikuwa na rasilimali za kutambua kwa usahihi washiriki.

faragha 2 8Masomo mengine ya kuondoa jina

Masomo mengine kadhaa yametumia nyayo zinazopatikana hadharani kutofautisha data nyeti.

Labda utafiti maarufu zaidi kwenye mistari hii ulifanywa na Latanya sweeney katika Chuo Kikuu cha Harvard mnamo 2002. Aligundua hilo Asilimia 87 ya Wamarekani walikuwa wanajulikana kipekee kulingana na mchanganyiko wa nambari yao ya eneo, jinsia na tarehe ya kuzaliwa. Sifa hizo tatu zilipatikana katika data ya usajili wa wapigakura wa umma (ambayo alinunua kwa Dola za Kimarekani 20) na data ya matibabu isiyojulikana (ambayo ilisambazwa sana, kwa sababu watu walidhani data hiyo haijulikani). Kwa kuunganisha vyanzo hivi vya data, alipata rekodi za matibabu za gavana wa Massachusetts.

Katika 2006, Netflix iliendesha mashindano kuboresha ubora wa mapendekezo yake ya sinema. Walitoa daftari lisilojulikana la upimaji wa sinema za watu, na wakapea $ 1 milioni kwa timu ambayo inaweza kuboresha algorithm ya mapendekezo yao kwa asilimia 10. Wanasayansi wa kompyuta Arvind Narayanan na Vitaly Shmatikov niligundua kuwa sinema ambazo watu walitazama zilikuwa tofauti sana, na watu wengi kwenye mkusanyiko wa data walikuwa wanajulikana kipekee kulingana na seti ndogo ya sinema zao. Kwa maneno mengine, kulingana na chaguzi za sinema za Netflix na hakiki za IMDB, watafiti waliweza kubaini ni nani watumiaji wa Netflix walikuwa.

Pamoja na kuongezeka kwa media ya kijamii, watu zaidi na zaidi wanashiriki habari ambayo inaonekana haina hatia, lakini kwa kweli inafunua habari nyingi za kibinafsi. Utafiti ulioongozwa na Michal Kosinski katika Chuo Kikuu cha Cambridge walitumia kupenda Facebook kutabiri watu mwelekeo wa kijinsia, maoni ya kisiasa na tabia za utu.

Timu nyingine, ikiongozwa na Gilbert Wondracek katika Chuo Kikuu cha Teknolojia cha Vienna, iliunda "mashine ya kutofautisha" ambayo iligundua ni vikundi gani vya watu walikuwa kwenye mtandao wa kijamii wa Xing, na walitumia hiyo kugundua ni akina nani - kwani vikundi ambavyo wewe ni sehemu yao mara nyingi vinatosha kutambua kipekee wewe.

Unaweza kufanya nini

Wengi wa mashambulio haya ni ngumu kutetea, isipokuwa ukiacha kutumia mtandao au kushiriki katika maisha ya umma.

Hata ukiacha kutumia mtandao, kampuni bado zinaweza kukusanya data kwako. Ikiwa marafiki wako kadhaa wanapakia anwani zao za simu kwenye Facebook, na nambari yako iko kwenye orodha zao zote za mawasiliano, basi Facebook inaweza kutabiri juu yako, hata ikiwa hutumii huduma yao.

Njia bora ya kutetea dhidi ya kuondoa jina kama vile yetu ni kupunguza seti ya watu ambao wanapata data yako ya kuvinjari isiyojulikana. Viendelezi vya Kivinjari kama Ghostery kuzuia wafuatiliaji wa tatu. Hiyo inamaanisha kuwa, ingawa kampuni ambayo tovuti unayotembelea itajua kuwa unawatembelea, kampuni za matangazo ambazo zinaonyesha matangazo kwenye ukurasa wao hazitaweza kukusanya data yako ya kuvinjari na kuijumlisha katika tovuti nyingi.

Ikiwa wewe ni msimamizi wa wavuti, unaweza kusaidia kulinda watumiaji wako kwa kuwaacha wavinjari tovuti yako kwa kutumia HTTPS. Kuvinjari kwa kutumia HTTP huruhusu washambuliaji kupata historia yako ya kuvinjari kwa kunusa trafiki ya mtandao, ambayo inawaruhusu kutekeleza shambulio hili. Tovuti nyingi tayari zimebadilisha kuwa HTTPS; wakati tulirudia jaribio letu la kujiondoa kwa jina kutoka kwa mtazamo wa mkorofi wa trafiki wa mtandao, ni asilimia 31 tu ya washiriki wangeweza kutambuliwa.

Walakini, kuna kidogo sana unaweza kufanya ili kujilinda dhidi ya mashambulio ya kuondoa jina kwa ujumla, na labda hatua bora zaidi ni kurekebisha matarajio ya mtu. Hakuna cha faragha katika zama hizi za dijiti.

Kuhusu Mwandishi

Jessica Su, Ph.D. Mwanafunzi huko Stanford, Chuo Kikuu cha Stanford

Makala hii ilichapishwa awali Mazungumzo. Soma awali ya makala.

Vitabu kuhusiana

at InnerSelf Market na Amazon