Ciao a tutti!
...ho in mente di realizzare un nuovo progetto e vorrei pubblicizzarlo soltanto tramite l'invio periodico di Newsletters agli iscritti della mia lista contatti...
Ho visto che, inevitabilmente, in un modo o nell'altro, i motori di ricerca indicizzalizzano i contenuti di ogni sito Drupal (e non solo, evidentemente...) - non di rado trovo nei risultati di Google dei riferimenti a pagine di qualche mio sito senza aver fatto nulla dal punto di vista SEO!
Il motivo di questa mia esigenza è semplice:
Il nuovo sito avrà un meccanismo pubblicitario che ritengo sia abbastanza innovativo e, per diffonderlo (inizialmente... tramite newsletters - come dicevo prima...), preferisco procedere a circuito chiuso e a macchia d'olio... praticamente il più "piombato" possibile...
Perchè questa richiesta?
Per non far vedere (tramite gli inevitabli risultati di Google etc...) quello che sto facendo alla concorrenza sempre pronta a "raccogliere" e sfruttare le idee altrui!
Quindi:
Come rendere INVISIBILE Drupal ai Motori di Ricerca - Almeno il più possibile perchè non credo si possa ottenere tutto ciò al 100%???
Grazie
Ciao
Kipper
<meta name="ROBOTS" content="NOINDEX,NOFOLLOW">
Su ogni pagina ;)
SRC: http://www.robotstxt.org/meta.html
--
Drupal e Siti Web Torino
Blog: Computer Graphics
Ciao Psicomante!
Grazie Mille!
Kipper
Oppure sostituendo quello che c'è nel robot.txt con
User-agent: *
Disallow: /
Anche meglio! Me n'ero dimenticato.
--
Drupal e Siti Web Torino
Blog: Computer Graphics
ok grazie di nuovo a tutti
nel robot.txt ho una cosa di questo tipo (tralasciando le stringhe commentate...):
User-agent: *
Crawl-delay: 10
# Directories
Disallow: /includes/
Disallow: /misc/
Disallow: /modules/
Disallow: /profiles/
Disallow: /scripts/
Disallow: /sites/
Disallow: /themes/
# Files
Disallow: /CHANGELOG.txt
Disallow: /cron.php
Disallow: /INSTALL.mysql.txt
Disallow: /INSTALL.pgsql.txt
Disallow: /install.php
Disallow: /INSTALL.txt
Disallow: /LICENSE.txt
Disallow: /MAINTAINERS.txt
Disallow: /update.php
Disallow: /UPGRADE.txt
Disallow: /xmlrpc.php
# Paths (clean URLs)
Disallow: /admin/
Disallow: /comment/reply/
Disallow: /contact/
Disallow: /logout/
Disallow: /node/add/
Disallow: /search/
Disallow: /user/register/
Disallow: /user/password/
Disallow: /user/login/
# Paths (no clean URLs)
Disallow: /?q=admin/
Disallow: /?q=comment/reply/
Disallow: /?q=contact/
Disallow: /?q=logout/
Disallow: /?q=node/add/
Disallow: /?q=search/
Disallow: /?q=user/password/
Disallow: /?q=user/register/
Disallow: /?q=user/login/
quindi faccio un replace con:
User-agent: *
Disallow: /
...cambio solo le prime 2 stringhe, il resto lo lascio giusto?
Grazie
Ciao
Kipper
No, elimina tutto e rimpiazzalo. Quelle due righe significano:
User-agent: * a tutti i robot
Disallow: / blocca tutto il dominio
In questo modo i motori di ricerca non indicizzeranno nulla. I Disalow che ci sono nel robot.txt di default bloccano cartelle e path del sito.
OK, solo quelle 2 righe...
E questa stringa nell'"head" di page.tpl.php la metto ugualmente?
<meta name="ROBOTS" content="NOINDEX,NOFOLLOW">
Ciao
Kipper
Stando a quello che puoi leggere qui http://www.messaggiamo.com/it/internet-tips/64279-nofollow-and-noindex-o... io li userei entrambi.
infine se hai accesso alle impostazioni di apache puoi rendere accessibile una locazione solo attraverso una data porta come ad esempio domain.it:2287 in questo modo solo chi conosce la porta poatà accedere
Oppure semplicemente una password in .htaccess... ovviamente sono soluzioni più invasive delle precedenti ma dipende dagli scopi. La prima è spesso utilizzata in ambito universitario la seconda per cosa più private...
Slice2Theme Servizio per la conversione di Design in markup HTML e/o temi.
WeBrain Solution | Pillsofbits Of Bits
ok kiuz,
grazie a tutti
ciao
kipper