Famaritana ny "Spidering and Web Crawlers"

Spiders & Web Crawlers: Inona no Tokony ho Fantatrao Mba Hiarovana ny Tranonkala Website

Ny Spiders dia programa (na scripts automatique) izay 'mikapoka' amin'ny alalan'ny tranonkala mitady data. Mandeha mandeha amin'ny URL an'ny tranonkala ny Spiders ary afaka misintona ireo angona avy amin'ny tranonkala toy ny adiresy mailaka. Ireo Spiders koa dia ampiasaina hamahana ny fampahalalana hita ao amin'ny tranonkala mba hikaroka motera.

Ireo Spiders, izay antsoina koa hoe 'crawler amin'ny Internet' dia mikaroka ao amin'ny tranonkala fa tsy ny rehetra no mifanaraka amin'ny tanjon'izy ireo.

Spammers Spider Web Sites Hanangona Vaovao

Google, Yahoo!

Ary ny fitaovam-pitadiavana hafa dia tsy ireo ihany no liana amin'ny fitadiavana vohikala - toy izany koa ireo scammers sy spammers.

Ireo spider sy ireo fitaovana maoderina hafa dia ampiasain'ireo spammers hahitana adiresy mailaka (ao amin'ny aterineto io fombafomba io dia antsoina matetika hoe 'mijinja') ao amin'ny tranokala ary mampiasa azy ireo hamorona lisitra spam.

Spiders koa dia fitaovana ampiasaina amin'ny milina fikarohana mba hahafantarana misimisy kokoa momba ny tranonkalanao saingy tsy navela hivoaka, tranonkala iray tsy misy torolàlana (na 'autorisations') momba ny fomba hitsikerana ny tranokalanao dia afaka mampiseho loza mety hitranga amin'ny fiarovana vaovao. Ny Spiders dia mandeha amin'ny rohy manaraka, ary tena miezaka ny mahita rohy amin'ny tahiry, tahiry fandaharana, ary fampahalalana hafa izay mety tsy tianao ho azy ireo ny fidirana.

Ny webmasters dia afaka mijery ireo logs mba hahitana hoe iza ireo mpitsikilo sy robots hafa no nitsidika ny tranokalany. Ity fampahalalana ity dia manampy ny webmaster hahafantatra hoe iza no mandanjalanja ny tranokalany, ary impiry.

Tena ilaina ity fampahalalana ity satria ahafahan'ireo webmasters hanatsara ny feony SEO sy hampivelatra ny rakitra robot.txt hanakana ireo robots sasany tsy hikirakira ny tranokalany amin'ny ho avy.

Torohevitra momba ny fiarovana ny tranonkalanao amin'ireo mpanafika robots tsy mila

Misy fomba tsotra entina manakana ny mpilalao tsy mendrika amin'ny tranonkalanao. Na dia tsy sahiran-tsaina aza ianao mikasika ireo andiam-pandrosoana miparitaka amin'ny tranonkalanao (manakana ny adiresy mailaka dia tsy hiaro anao amin'ny ankamaroan'ny mpitsikilo), tokony mbola mila manome milina fikarohana miaraka amin'ny torolàlana manan-danja ianao.

Ny tranonkala rehetra dia tokony hanana rakitra hita ao amin'ny lahatahiry fototra antsoina hoe robots.txt. Ity rakitra ity dia ahafahanao mampianatra mpitsikera tranonkala izay tianao hijerena ireo pejy index (raha tsy misy filazalazana momba ny meta manokana ao anaty pejy iray) raha motera fikarohana izy ireo.

Tahaka ny azonao atao amin'ny filazanao amin'ny mpilatsaka an-tsarimihitsy izay tianao homanina azy ireo, dia azonao atao koa ny milaza amin'izy ireo hoe aiza izy ireo no tsy mandeha ary manakana mihitsy aza ny mpikirakira ny tranokala manontolo.

Zava-dehibe ny mitadidy fa ny filalaovana tsara amin'ny robots.txt dia hanana safidy lehibe ho an'ny fitaovam-pitadiavana ary mety ho singa manan-danja amin'ny fampivoarana ny fahombiazan'ny tranonkalanao, fa ny mpilalao robot sasany dia mbola tsy miraharaha ny torolalanao. Noho izany antony izany dia zava-dehibe ny mitazona ny rindrambaiko rehetra, plugins ary apps amin'ny fotoana rehetra.

Articles and Information Related Articles

Noho ny fakana an-kolaka momba ny fijinjana vaovao izay nampiasaina tamin'ny tanjona kendreny (spam) dia nekena ny lalàna tamin'ny taona 2003 mba hanaovana fombafomba tsy ara-dalàna. Ireo lalàna momba ny fiarovana ireo mpanjifa dia latsaka ao amin'ny Lalàna CAN-SPAM tamin'ny taona 2003.

Zava-dehibe ny handraisanao ny fotoana hamakiana ny Lalàna CAN-SPAM raha toa ka misy orinasam-barotra amin'ny orinasam-panjakana na orinasam-baovao.

Afaka mahafantatra bebe kokoa momba ny lalàna manohitra ny spam ianao sy ny fomba hiatrehana ireo mpitsikilo, ary ny zavatra mety tsy hataonao amin'ny tompona orinasa, amin'ny famakiana ireto lahatsoratra manaraka ireto: