Co je lepší a co používat? Už dlouho jsem tady nezveřejňoval žádné skripty, v tomto článku naleznete zdrojové kódy pro AutoTrackback.
Ano, po funkci pro zkracování odkazů v PHP přichází další, tentokrát trochu složitější skript. Viz. níže.
Trackback
Jaký je jeho problém?
- V ČR ho používá jen hrstka IT pracovníků, ale většinou ani ti ne.
- Většina blogerů vůbec neví, jak trackback funguje, a jak ho použít.
Co je to trackback a jak ho mám použít ve Wordpressu?
Trackback slouží blogerům a obecně publicistům na webu k tvoření vazeb mezi souvisejícími informacemi. Pokud např. najdete článek na téma, ke kterému máte hodně co říct a rozhodnete se napsat vlastní článek, měli byste použít trackback (ostatně jste to vy, kdo dostane relevantní zpětný odkaz). Ve výsledku to potom vypadá tak, že na obou webech se objeví odkaz na ten druhý.
Narychlo jsem prolétnul WordPress Trackback Tutorial(EN). Nejdříve je třeba získat trackback URL, které by mělo být (např.) pod článkem, na který chcete reagovat. Ve Wordpressu pak při psaní článku nakoukněte do pokročilých voleb, a tam by pro něj měla být kolonka. Nevím, Wordpress nepoužívám, kdyžtak nakoukněte do výše odkazovaného článku nebo googlete dál.
Pokud vás zajímá technická stránka trackbacku, přečtěte si např. článek na Mirin webspace.
AutoTrackback
Jaký je jeho problém?
- V případě velkého počtu zpětných odkazů je náročný na server. Toto ale kompenzuje CRON a noční spouštění.
- Musíte mít databázi webů (obvykle vyhledávačů), ze kterých nechcete přejímat zpětné odkazy. I to není nic hrozného, po nějaké době máte klid.
- V případě špatné struktury webu, který na vás odkazuje, může dojít k objevování se duplicitních odkazů. Mluvím tady o webech, který mají různé verze (např. verzi pouze v plain-text) stránek s různými URL. Tzn. k jednomu jejich (např.) článku vede více URL. (Ano, Google to nemá rád ... a nemají to rádi ani provozovatelé AutoTrackbacků .)
Dalo by se to vyřešit nastavením, že na jeden váš článek může jeden host odkazovat pouze z jedné stránky. Nic těžkého na dopsání.
Nebudu dál chodit kolem horké kaše. Rozhodl jsem se používat onen AutoTrackback. Název AutoTrackback je umělý, zakladatelem je patrně Patrick Zandl, který jej údajně nějakou dobu provozoval na svém blogu. (Mimochodem v odkazovaném článku rony v komentářích bojuje proti použití tohoto slova, tak si můžete přečíst něco proti AutoTrackbacku. Většinou s ním nesouhlasím.)
AutoTrackback - vysvětlení
Požadavky
Předtím než vůbec budete číst dále, si zjistěte, zda váš server podporuje funkci fopen nebo curl - stačí jedna z nich. Také je vhodné mít CRON, abyste nemuseli bota pouštět manuálně.
Co to tedy vlastně tento skript dělá? Ukládá do databáze všechny weby, ze kterých k nám někdo přišel, kromě těch které zakážeme. Přitom to dělá pouze na těch stránkách, kam vložíme soubor zaznamenavani.php. Takže je jasné, že např. na titulní stránku ho nedáme.
Žádné takto uložené odkazující weby však nejsou autorizované - žádný odkaz není zobrazen. K tomu aby se odkazy autorizovaly, je třeba spustit bota kontrolni-bot.php. Tento skript projde všechny (s určitými limity - viz. komentáře) neautorizované weby a zjistí, jestli se na nich odkaz opravdu nachází. Je to nutné, protože mnoho spam botů falšuje referery.
Kromě toho také prochází staré, autorizované odkazovače a zjišťuje, jestli ještě stále odkazují. Je to nutné z toho důvodu, protože jsou různé dynamické indexy s odkazem na vás, které ale časem zmizí. Stáří odkazů, které je třeba znovu zkontrolovat, si můžete nastavit v souboru nastaveni.php, stejně jako ostatní věci.
Soubor kontrolni-bot.php je vhodné dát do CRONu, takže se pak už nemusíte o autorizace zpětných odkazů starat. Vždy vám akorát přijde mail s výsledky. Tady se můžete podívat, jak takové hlášení vypadá. Zrovna se zde nachází vyhledávač, který toho času ještě nebyl zahrnut do mé databáze.
AutoTrackback - zdrojové kódy
AutoTrackback jsem rozdělil do 5 souborů, přičemž výkonné jsou především dvě části. Všechny soubory si můžete stáhnout v tomto archivu (5,6 KB).
tabulka.sql
Jak už asi tušíte, jedná se o strukturu tabulky databáze. Vytvořte si databázi a nad ní spusťte tento dotaz.
- CREATE TABLE `zpetne_odkazy` (
- `id` INT(11) NOT NULL AUTO_INCREMENT,
- `adresa` VARCHAR(255) COLLATE utf8_czech_ci,
- `http_referer` VARCHAR(255) COLLATE utf8_czech_ci DEFAULT NULL,
- `host` VARCHAR(255) COLLATE utf8_czech_ci DEFAULT NULL,
- `pocet_pristupu` INT(11) DEFAULT NULL,
- `autorizace` INT(11) DEFAULT NULL,
- `last_mod` DATETIME DEFAULT NULL,
- PRIMARY KEY (`id`)
- ) COLLATE=utf8_czech_ci;
nastaveni.php
Není co dodat, čtěte komentáře.
- <?php
- $server = "http://blog.antonindanek.cz"; // Vložte adresu vašeho serveru, NEZAKONČUJTE LOMÍTKEM
- // Do tohoto pole vložte servery, ze kterých nechcete zaznamenávat zpětné odkazy. Minimálně by zde neměl chybět váš web, aby se nezaznamenávaly přechody v rámci vašeho serveru (proměnná $server). Budou použity jako regulární výrazy!
- $nezaznamenavej = array ("127.0.0.1", "search.seznam.cz", "google.cz", "google.sk", "google.com", "google.co.uk", "google.de", "search.icq.com", "search.live.com", "centrum.cz", "atlas.cz", "linkuj.cz", "vybralisme.cz", "topclanky.cz", "jyxo.1188.cz","nova.cz/search/");
- $interval = 7; // Sem zadejte počet dní, po jejichž uplynutí chcete kontrolovat staré odkazy, zda se zde ještě stále nacházejí.
- /* NASTAVENÍ PRO DATABÁZI */
- $db_server = "127.0.0.1";
- $uzivatel = "root";
- $heslo = "";
- $databaze = "autotrackback";
- /* NASTAVENÍ PRO DATABÁZI konec */
- ?>
zaznamenavani.php
Dostáváme se k prvnímu výkonnému skriptu, který ukládá do databáze weby, které na vás odkazují. Tento soubor vložte na všechny stránky, na kterých chcete zaznamenávat zpětné odkazy. Tedy např. na všechny stránky, kde se zobrazují články.
- <?php
- require_once "nastaveni.php";
- if(isset($_SERVER['HTTP_REFERER'])) { // Pokud nebyla adresa manuálně zadána do adresního řádku, podíváme se na vstupní web.
- $format= "Y-m-d H:i:s";
- $adresa = $server.$_SERVER['REQUEST_URI']; // Cílový web (váš).
- // Projdeme pole serverů, které nechceme zaznamenávat a porovnáme je s aktuálním webem. První argument funkce ereg je regulární výraz, proto je třeba vstup poslat nejdříve do fce. preg_quote jsme, aby byla brána např. tečka jen jako tečka a né jako jakýkoliv znak.
- for($i=0 ; $i<$pocet ; $i++) if (ereg(preg_quote($nezaznamenavej[$i]), $http_referer) or $http_referer=="") {$nebrat = 1; break;} // Pokud dojde ke shodě, nastavíme indikátor $nebrat a ukončíme cyklus.
- if ($nebrat == false){ // Pokud byl nastaven indikátor $nebrat, zbytek skriptu se neprovede.
- // Připojíme se k databázi.
- $pripojeninaDB = mysql_connect ("$db_server","$uzivatel","$heslo") or die ("Nepovedlo se připojit na databázový server");
- mysql_query("SET CHARACTER SET utf8") or die ("Dotaz se nepodařilo provést."); // Nastavení znakové sady přenosu.
- $query = mysql_query("SELECT id FROM zpetne_odkazy WHERE http_referer = \"$http_referer\" AND adresa=\"$adresa\"");
- if ($vysledky = mysql_fetch_array($query)) { // Je stránka v databázi ? (pokud ano, přidáme přístup z této url) (pokud ne, přidáme ji)
- $dotaz = "UPDATE zpetne_odkazy SET pocet_pristupu=pocet_pristupu+1 WHERE http_referer = \"$http_referer\" AND adresa=\"$adresa\"";
- } else {
- $dotaz = "INSERT INTO zpetne_odkazy VALUES (0, \"$adresa\", \"$http_referer\", \"$host\", \"1\", \"0\", \"$datum\")";
- }
- }}
- ?>
zobrazeni.php
Po implementaci zaznamenávání nějakou dobu počkejte, než se vám do databáze nachytají nějací odkazovatelé. Poté můžete spustit následující soubor.
- <?php
- require_once "nastaveni.php";
- $adresa = $server.$_SERVER['REQUEST_URI'];
- function zkrat_anchor_odkazu ($odkaz,$maximalni_delka = 20) {
- if(strlen($odkaz) > $maximalni_delka) { // pokud je délka odkazu větší než $maximalni_delka, zkrátíme ho
- $zacatek = substr($odkaz,0,$maximalni_delka-5); // použijeme jen tak dlouhý začátek, aby nám 5 znaků zbylo na zakončení
- return $zacatek."...".$konec;
- } else return $odkaz; }
- // Připojíme se k databázi.
- $pripojeninaDB = mysql_connect ("$db_server","$uzivatel","$heslo") or die ("Nepovedlo se připojit na databázový server");
- mysql_query("SET CHARACTER SET utf8") or die ("Dotaz se nepodařilo provést."); // Nastavení znakové sady přenosu.
- $dotaz = "SELECT http_referer,host FROM zpetne_odkazy WHERE autorizace=\"1\" ORDER BY pocet_pristupu DESC, last_mod ASC";
- ?>
Ejhle! V databázi není žádný autorizovaný odkaz. Přesně tak, ještě vás čeká spuštění autorizačního bota.
kontrolni-bot.php
- <?php
- require_once "nastaveni.php";
- function najdi_url($web,$hledane_url) // vrátí 1 v případě, že nalezne URL ($hledane_url) na $web
- {
- elseif($drzak = curl_init($web)) $curl=1; // Vyzkoušíme funkčnost funkce curl.
- if($fopen) { // Pokud funguje fopen, projdeme řádek po řádku HTML kód a hledáme naše URL. Pokud ho nalezneme, nastavíme indikátor a ukončíme cyklus.
- while($radek = fgets($drzak)){if(ereg("href=\"".preg_quote($hledane_url), $radek)) {$indikator = 1; break;}}
- return $indikator;
- }
- elseif($curl and !$fopen){ // Pokud funguje curl (ale neproběhlo předtím už fopen), načteme celý HTML kód a hledáme naše URL. Pokud ho nalezneme, nastavíme indikátor.
- curl_setopt ($drzak, CURLOPT_RETURNTRANSFER, 1); // Nastavení curl, tak aby se HTML zdroj nevypisoval.
- $stranka = curl_exec ($drzak); // Provedení curl fce.
- if(ereg(preg_quote($hledane_url), $stranka)) $indikator = 1; // Projdeme HTML kód a hledáme naše URL. Pokud ho nalezneme, nastavíme indikátor.
- curl_close($drzak);
- return $indikator;
- }
- else return "Obávám se, že váš server nepodporuje ani fci. fopen() ani curl(). Můžete si to autorizovat ručně v databázi :o) (sloupec autorizace nastavit na 1).";
- }
- ?>
- <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
- <html xmlns="http://www.w3.org/1999/xhtml" lang="cs">
- <head>
- <meta http-equiv="content-type" content="text/html; charset=ISO-8859-2" /> <!-- Používáme znakovou sadu ISO-8859-2, kvůli následnému odeslání na mail. (UTF8 dělá problémy)-->
- <meta http-equiv="Content-Language" content="cs" />
- <meta name="Language" content="czech" />
- <title>Validátor zpětných odkazů</title>
- <meta name="title" content="Validátor zpětných odkazů" />
- <meta name="description" content="Validátor zpětných odkazů." />
- <meta http-equiv="cache-control" content="no-cache" />
- <meta name="author" content="Antonín Daněk" />
- <style type="text/css">
- a {text-decoration: none; color: #5701C1;}
- .ano {color: #1CC117;}
- .ne {color: #C1120F;}
- </style>
- </head>
- <body>
- <?php
- $format= "Y-m-d H:i:s";
- $hlaseni[] = "<h1>Nové zpětné odkazy</h1>"; // Do proměnné hlášení průběžně ukládáme výstup.
- $pripojeninaDB = mysql_connect ("$db_server","$uzivatel","$heslo") or die ("Nepovedlo se připojit na databázový server");
- mysql_query("SET CHARACTER SET utf8") or die ("Dotaz se nepodařilo provést."); // Nastavení znakové sady přenosu.
- $dotaz ="SELECT http_referer,adresa FROM zpetne_odkazy WHERE autorizace=\"0\" ORDER BY id LIMIT 0,10"; // Vybere pouze 10 položek. Existuje-li jich více, budou vybrány při dalším spuštění skriptu. Jedná se o bezpečnostní limit - můžete ho zvětšit, pokud máte na serveru nastavenou dlouhou dobu provádění skriptu.
- if(mysql_num_rows($query)) while($radek=mysql_fetch_array($query)){ // Pokud existuje alespoň jeden záznam, provedeme cyklus.
- $nalezeno = najdi_url($radek[http_referer],$radek[adresa]); // Zavoláme funkci, která se pokusí na webu nalézt naši adresu.
- if($nalezeno) { // Pokud byl odkaz nalezen, autorizujeme ho a podáme o tom hlášení.
- $dotaz2 ="UPDATE zpetne_odkazy SET autorizace=\"1\" WHERE http_referer=\"$radek[http_referer]\" AND adresa=\"$radek[adresa]\"";
- $hlaseni[] = "<p>Zjistil jsem, že na stránku <a href=\"$radek[adresa]\">$radek[adresa]</a> odkazuje: <strong><a href=\"$radek[http_referer]\">$radek[http_referer]</a></strong> - zpětný odkaz <span class=\"ano\">autorizován</span>.</p>";
- } else { // Pokud nebyl odkaz nalezen, smažeme ho z databáze a podáme o tom hlášení.
- $dotaz2 ="DELETE FROM zpetne_odkazy WHERE http_referer=\"$radek[http_referer]\" AND adresa=\"$radek[adresa]\"";
- $hlaseni[] = "<p>Zjistil jsem, že na stránku <a href=\"$radek[adresa]\">$radek[adresa]</a> odkazuje: <strong><a href=\"$radek[http_referer]\">$radek[http_referer]</a></strong>, avšak odkaz jsem NENALEZL - zpětný odkaz <span class=\"ne\">smazán</span>.</p>";
- }
- } else $hlaseni[] ="<p>Žádné nové zpětné odkazy.</p>";
- $hlaseni[] = "<hr /><h1>Kontrola starých ($interval) odkazů</h1>";
- $dotaz ="SELECT http_referer,adresa FROM zpetne_odkazy WHERE last_mod < date_sub(\"$datum\", INTERVAL $interval DAY) LIMIT 0,10"; // Vybere ty odkazy, které jsou více jak $interval dní staré. Opět je zde bezpečnostní limit, který můžete změnit.
- if(mysql_num_rows($query)) while($radek=mysql_fetch_array($query)){ // Pokud existuje alespoň jeden záznam, provedeme cyklus.
- $nalezeno = najdi_url($radek[http_referer],$radek[adresa]); // Zavoláme funkci, která se pokusí na webu nalézt naši adresu.
- if($nalezeno) { // Pokud byl odkaz nalezen, autorizujeme ho a podáme o tom hlášení.
- $dotaz2 ="UPDATE zpetne_odkazy SET autorizace=\"1\", last_mod=\"$datum\" WHERE http_referer=\"$radek[http_referer]\" AND adresa=\"$radek[adresa]\"";
- $hlaseni[] = "<p>Zjistil jsem, že na stránku <a href=\"$radek[adresa]\">$radek[adresa]</a> odkazuje: <strong>$radek[http_referer]</strong> - zpětný odkaz <span class=\"ano\">autorizován</span>.</p>";
- } else { // Pokud nebyl odkaz nalezen, smažeme ho z databáze a podáme o tom hlášení.
- $dotaz2 ="DELETE FROM zpetne_odkazy WHERE http_referer=\"$radek[http_referer]\" AND adresa=\"$radek[adresa]\"";
- $hlaseni[] = "<p>Zjistil jsem, že na stránku <a href=\"$radek[adresa]\">$radek[adresa]</a> odkazuje: <strong>$radek[http_referer]</strong>, avšak odkaz jsem NENALEZL - zpětný odkaz <span class=\"ne\">smazán</span>.</p>";
- }
- } else $hlaseni[] ="<p>Žádné staré zpětné odkazy.</p>";
- ?>
- </body>
- </html>
danek<zavináč>antonindanekcz
Ukončil jsem AutoTrackbac na tomto blogu. Je to poměrně dobrá věc, ale stále vyžaduje jistou míru administrace (zakazovat některé URL, mazat duplicitní (jiná URL, stejný obsah)).