Come rendere INVISIBILE Drupal ai Motori di Ricerca

11 contenuti / 0 new
Ultimo contenuto
Come rendere INVISIBILE Drupal ai Motori di Ricerca

Ciao a tutti!
...ho in mente di realizzare un nuovo progetto e vorrei pubblicizzarlo soltanto tramite l'invio periodico di Newsletters agli iscritti della mia lista contatti...

Ho visto che, inevitabilmente, in un modo o nell'altro, i motori di ricerca indicizzalizzano i contenuti di ogni sito Drupal (e non solo, evidentemente...) - non di rado trovo nei risultati di Google dei riferimenti a pagine di qualche mio sito senza aver fatto nulla dal punto di vista SEO!

Il motivo di questa mia esigenza è semplice:
Il nuovo sito avrà un meccanismo pubblicitario che ritengo sia abbastanza innovativo e, per diffonderlo (inizialmente... tramite newsletters - come dicevo prima...), preferisco procedere a circuito chiuso e a macchia d'olio... praticamente il più "piombato" possibile...

Perchè questa richiesta?
Per non far vedere (tramite gli inevitabli risultati di Google etc...) quello che sto facendo alla concorrenza sempre pronta a "raccogliere" e sfruttare le idee altrui!

Quindi:
Come rendere INVISIBILE Drupal ai Motori di Ricerca - Almeno il più possibile perchè non credo si possa ottenere tutto ciò al 100%???

Grazie

Ciao
Kipper

<meta name="ROBOTS" content="NOINDEX,NOFOLLOW">

Su ogni pagina ;)

SRC: http://www.robotstxt.org/meta.html

Ciao Psicomante!

Grazie Mille!

Kipper

Oppure sostituendo quello che c'è nel robot.txt con

User-agent: *
Disallow: /

krima wrote:
Oppure sostituendo quello che c'è nel robot.txt con
User-agent: *
Disallow: /

Anche meglio! Me n'ero dimenticato.

ok grazie di nuovo a tutti

nel robot.txt ho una cosa di questo tipo (tralasciando le stringhe commentate...):

User-agent: *
Crawl-delay: 10
# Directories
Disallow: /includes/
Disallow: /misc/
Disallow: /modules/
Disallow: /profiles/
Disallow: /scripts/
Disallow: /sites/
Disallow: /themes/
# Files
Disallow: /CHANGELOG.txt
Disallow: /cron.php
Disallow: /INSTALL.mysql.txt
Disallow: /INSTALL.pgsql.txt
Disallow: /install.php
Disallow: /INSTALL.txt
Disallow: /LICENSE.txt
Disallow: /MAINTAINERS.txt
Disallow: /update.php
Disallow: /UPGRADE.txt
Disallow: /xmlrpc.php
# Paths (clean URLs)
Disallow: /admin/
Disallow: /comment/reply/
Disallow: /contact/
Disallow: /logout/
Disallow: /node/add/
Disallow: /search/
Disallow: /user/register/
Disallow: /user/password/
Disallow: /user/login/
# Paths (no clean URLs)
Disallow: /?q=admin/
Disallow: /?q=comment/reply/
Disallow: /?q=contact/
Disallow: /?q=logout/
Disallow: /?q=node/add/
Disallow: /?q=search/
Disallow: /?q=user/password/
Disallow: /?q=user/register/
Disallow: /?q=user/login/

quindi faccio un replace con:

User-agent: *
Disallow: /

...cambio solo le prime 2 stringhe, il resto lo lascio giusto?

Grazie

Ciao
Kipper

No, elimina tutto e rimpiazzalo. Quelle due righe significano:

User-agent: * a tutti i robot
Disallow: / blocca tutto il dominio

In questo modo i motori di ricerca non indicizzeranno nulla. I Disalow che ci sono nel robot.txt di default bloccano cartelle e path del sito.

OK, solo quelle 2 righe...

E questa stringa nell'"head" di page.tpl.php la metto ugualmente?

<meta name="ROBOTS" content="NOINDEX,NOFOLLOW">

Ciao
Kipper

Stando a quello che puoi leggere qui http://www.messaggiamo.com/it/internet-tips/64279-nofollow-and-noindex-o... io li userei entrambi.

infine se hai accesso alle impostazioni di apache puoi rendere accessibile una locazione solo attraverso una data porta come ad esempio domain.it:2287 in questo modo solo chi conosce la porta poatà accedere

Oppure semplicemente una password in .htaccess... ovviamente sono soluzioni più invasive delle precedenti ma dipende dagli scopi. La prima è spesso utilizzata in ambito universitario la seconda per cosa più private...

Slice2Theme Servizio per la conversione di Design in markup HTML e/o temi.

WeBrain Solution | Pillsofbits Of Bits

ok kiuz,

grazie a tutti

ciao
kipper