V článku se dozvíte něco o shromažďování informací o pohybu uživatelů na internetu např. firmou Google. Je zde také malý test, jak si vede prohlížeč Opera nebo Firefox co se týče tichého odesílání dat.
Úvodem
Je až neuvěřitelné, s jakou snadností Google shromažďuje zdánlivě nevyužitelné informace o pohybu lidí na internetu. Uživatelé internetu tyto informace mnohdy sami dobrovolně poskytují. Stačí se podívat na množství aplikací vyvinutých firmou Google. Pak už se informace odesílané Google nemusí omezovat pouze na pohyb po internetu, ale obecně na informace, které vypovídají o tom co na počítači děláte. Mezi takové aplikace, které si na svůj PC dobrovolně lidé instalují patří např. Picasa, Google Desktop nebo Google Earth. Mezi webovými aplikacemi je to pak především Google Toolbar, Google Analytics nebo Google Mail. O tom, že tyto aplikace shromažďují o svých uživatelích data a následně je odesílají Google není pochyb, stačí si nainstalovat nějaký software na odposlech sítě (tedy sniffer).
Já jsem použil Linuxový program Wireshark, který poskytuje opravdu hodně možností. Mě však stačilo kontrolovat kontrolovat spojení s DNS serverem a HTTP požadavky typu GET popř. POST.
Ještě bych rád podotknul, že nejsem žádný objevitel - inovátor. O spolupráci Google a CIA se diskutuje už dlouho. Zajímavé odkazy jsou zde:
http://www.abclinuxu.cz/blog/Vaclavuv_blog/2006/3/9/123953 (Zde se rozpoutala docela zajímavá diskuze)
http://www.disgrunt.com/blog/2006/10/27/former-intelligence-agent-says-google-in-bed-with-cia/ (Prohlášení v angličtině)
Slovník
DNS
DNS je zkratka pro Domain Name System. Jedná se o servery, obsahující seznam domén a jím příslušících IP adres. Pokud by neexistoval nic takového jako je DNS, museli bychom po internetu brouzdat vyťukáváním do adresového řádku nám nic neříkajících IP adres. Můžete se např. podívat na stránku 212.80.76.3 - není to nic jiného něž adresa známého českého serveru Seznam. Sledovat spojení s DNS serverem je důležité, dá se pak snadno zjistit s jakými servery můj počítač komunikuje.
GET
GET je jednou z forem, jak odesílat data na webu (přes protokol HTTP). Pokud napíšete do adresového řádku adresu a stisknete enter - odeslali jste data metodou GET, pokud kliknete na webu na hypertextový odkaz - odeslali jste data metodou GET.
POST
POST je další velice často používaná metoda pro odesílání dat. POST data se často odesílají pomocí internetových formulářů (avšak dá se pomocí nich využívat i metoda GET). Jejich výhodou je větší bezpečnost (nejsou vidět v adresové řádce, nedají se libovolně změnit editováním adresy).
Malá ukázka
Google však není jediná společnost, zajímající se o informace. Zdá se např., že Firefox má smlouvu s BBC (Není pak divu, že vznikají takovéto statistiky - http://www.czilla.cz/zpravicky/firefox-ma-na-homepage-bbc-9,7-procent/ - i když je to dost stará zpráva). Podívejme se na výsledky mého testu. Sniffoval jsem svojí síťovou kartu. Přitom jsem postupoval tak, že jsem vždy celý internetový prohlížeč zavřel a zkusil vstoupit na nějaký internetový server. Modré tabulky představují požadavky na DNS server, zelené dala odeslané metodou GET. Obrázek si můžete otevřít přes celé okno, v případě že je obsah na Vašem rozlišení nečitelný (pravé tlačítko myši na obrázek + otevřít obrázek (zobrazit obrázek).
Prohlížeč - Firefox; server - antonindanek.cz; Google Bar - ne

Jak je vidět, Firefox se kromě serveru o který žádáme připojuje také k serveru newsrss.bbc.co.uk .

První řádka: Data odeslaná do mých osobních statistik.
Druhá řádka: Data odeslaná do statistik Toplist.
Třetí řádka: Vyžádání obrázku ze serveru galerie.antonindanek.cz
Čtvrtá řádka: Data odeslaná serveru newsrss.bbc.co.uk.
Prohlížeč - Firefox; server - antonindanek.cz; Google Bar - ano

Pokud používáme Google Toolbar, Firefox navíc přistupuje ještě k doménám http://sb.google.com/ a http://toolbarqueries.google.cz/.

První dva řádky reprezentují data odeslané Google Barem.
Prohlížeč - Firefox; server - google.com; Google Bar - ano


Prohlížeč - Firefox; server - krepelky-mm.kx.cz; Google Bar - ano

Toto je galerie mé třídy na SPŠ - je umístěná na freehostingovém serveru ic.cz. Zde je vidě že používají Google Analytics, a proto pokud budete procházet libovolné stránky umístěné na ic.cz, budete také odposloucháváni Googlem. Reklamní lišta ic.cz se bez Vaše vědomí spojuje s doménou http://google-analytics.com/

Třetí řádek - GET /count.asp?id=269715&logo=mc HTTP/1.1 je pro statistiky Toplist a předposlední řádek je pro jednoduché statistiky galerie AD advanced picture gallery zbylé řádky představují data odeslané cizím serverům bez Vašeho vědomí.
Prohlížeč - Firefox; server - seznam.cz; Google Bar - ano

Jak je vidět, při přístupu na seznam.cz se kromě Seznamu spojujete taky s několika reklamními partnery Seznamu.

Prohlížeč - Opera; server - antonindanek.cz; Google Bar - ne

Zde je vidět, že při přístupu na server antonindanek.cz není Váš pobyt zaznamenán u žádného externího serveru - kromě Toplistu (který mám ovšem uzamčený pro veřejnost). Pak jsou tu pouze mé soukromé statistiky, domén pop3.seznam.cz a mail.antonindanek.cz si všímat nemusíte, to pouze Opera kontrolovala přítomnost nových emailů.

Prohlížeč - Opera; server - krepelky-mm.kx.cz; Google Bar - ne

I když budete používat prohlížeč, který o Vás žádné data neodesílá (Opera), nepomůže Vám to v případě návštěvy serverů, které spolupracují např. s Google.

Prohlížeč - Opera; server - seznam.cz; Google Bar - ne


Závěrem
Zkrátka vyhnout se odesílání dat třetí straně, je téměř nemožné. Je dobré používat kvalitní prohlížeč - tedy Operu. Ještě musím dodat, že jsem odposlouchával odchozí HTTP požadavky, když jsem dal v Google vyhledat ,,how to make a bomb". Čekal jsem, že se vyskytne ještě nějaký další zajímavý řádek mezi GET daty, ale nestalo se tak ... dokonce mi ještě před domem nestojí černá dodávka s kouřovými skly .
Možná si říkáte - co to může být za data a jakou mají váhu. Jsou to zkrátka informace o pohybu a chování uživatelů internetu, které mají nulovou váhu, pokud by se jednalo o jednotlivce. V případě, že jsou ale shromažďovány takto hromadně, mají velkou hodnotu pro podnikatele na internetu. Má to ale i své výhody - když se potom pomocí těchto dat dají dohledat pedofilové navštěvující jisté stránky apod.
Nevim proc byl smazanej komentar od Frdly, kterej stejne odesel diky RSS... Ale jinak nevim co ti prijde divny, ze statistiky od Googlu ziskavaji informace pri navsteve stranek, stejne tak jako Toplist? A to, ze je do prohlizece Firefox implementovany zpravodajstvi od CNN (pokud vim, tak je defaultne v RSS pridano...), neni nic divnyho...
danek<zavináč>antonindanek
cz
Toto je odpověď na příspěvek: 1#
.
To že je v RSS neznamená, že musí strašit tady
Jenže tady nejde jen o Google Analytics, jde o to že 9/10 přistupů na web je monitorováno Googlem.
To připojování Firefoxe na "newsrss.bbc.co.uk" je načítání RSS zpráv a nechá se toho snadno zbavit, pokud ti to tak vadí.
A statistiky Google Analytics umí zase blokovat rozšíření Adblock Plus, které používám a mam vyzkoušeno, že mě do statistik nezapočítává.
danek<zavináč>antonindanek
cz
Toto je odpověď na příspěvek: 3#

.
Jo, to s tou RSS čtečkou integrovanou ve Firefoxu je muj kiks - nevěděl jsem že tam vůbec nějaká je
FireFox sam o sobe zadne udaje o svem uzivateli *nikomu* neodesila, pri pouziti google toolbar bych doporucil precist licenci, ve ktere je jasne popsano, co se googlu odesiila. Jsou to v podstate jen neskodne informace slouzici pro ostatni projekty korporace google, zadna osobni citliva data.
Mnohem horsi je, ze se odposlouchavaji (minimalne v CR) elektronicke hovory (VoIP), asi nejznamejsi je SKYPE, ktery take umoznuje provadet odposlechy (na zaklade kterych uz byl zatcen nejeden clovek) a ono je levnejsi cist elektronickou postu / odposlouchavat elektronicke hovory, nez provadet to same u beznych dopisu ci beznych (treba mobilnich) telefonu. Je tedy potreba sifrovat a uzivat OpenSource. Kdyby u nas sifrovala vetsina lidi, tak to vlada ucini ilegalnim...
Filtrovani a analyza dat je docela slusne popsana v
http://airdump.net/cz/sniff...lyza-dat