Google semble suivre les urls au format texte (sans a href)

  • Auteur de la discussion xescorp
  • Date de début
X
xescorp
Guest
Je viens de pré-lancer mon blog sur le référencement, c'est à dire que depuis hier je commence à le communiquer légèrement (notamment sur ce site en tant que WWW), mais auparavant aucun lien.

Par curiosité, j'ai cherché à voir s'il était déjà référencé, mais je ne pensais pas qu'il puisse l'être : https://www.google.com/search?q=www.refe ... t-blog.net

Là donc 2 surprise :
- un site d'annonce "parle" du blog et d'une page bidon (qui n'a jamais existé).
- mon site est référencé mais les articles référencés sont des tests qui date d'avant hier

Or le premier site n'a que des urls textes et pas de <a href> , je ne comprends donc pas comment mon blog peut déjà être référencé.

Du coup j'ai l'impression que Google a suivi le lien du premier site, avez-vous une autre explication ?

Autre question que fais mon site sur ce premier site, qui est un site de rencontre ???
 
X
xescorp
Guest
Oui salva, mais le post parle d'autre chose, et il n'y a pas l'air d'avoir grand monde à vouloir te répondre, tu ne penses pas que cela vaut le cout de conserver celui-ci :)
 
WRInaute impliqué
une autre explication en effet est la présence de la barre google :wink:

par le passé, il m'est arrivé en phase de développement de mettre du latin (lorem ipsum...) pour combler et simuler les contenus texte... et quelques jours après (sans liens externes ni autres), ces pages avec du latin étaient bien indéxées dans google en lieu et place du contenu définitif... elles ont changé depuis :wink:
 
X
xescorp
Guest
Je n'ai pas la barre Google, mais seulement Firefox.

C'est assez étonnant qu'en même, comment il récupère l'information? cela s'apparente à du spyware...
 
WRInaute impliqué
FF est équipé d'un champ de recherche google en natif chez moi... spyware, non... le but d'un moteur de recherche, c'est de faire remonter un max d'infos sur les pages web visitées :wink:
 
X
xescorp
Guest
Oui oui Firefox a le champ de recherche Google.

Mais, je suis désolé, mais je n'ai jamais autorisé expressément Google à suivre les sites sur lequel je navigue, donc pour moi cela s'apparente à du spyware.
 
WRInaute impliqué
attends un peu ! :lol:
ma parole n'est pas d'or et je peux me tromper. il y a peut-être encore une autre explication :wink:
 
WRInaute accro
xescorp a dit:
Oui oui Firefox a le champ de recherche Google.

Mais, je suis désolé, mais je n'ai jamais autorisé expressément Google à suivre les sites sur lequel je navigue, donc pour moi cela s'apparente à du spyware.
Cela s'apparente surtout à de l'ingratitude de ta part :)
Déjà indexé et pas content !

Un site en développement, ça se protège des robots par un robots.txt ou un .htaccess.
 
WRInaute accro
La question reste posée.

D’autant plus qu’il doit être aisé pour Google d’extraire l’url texte et de la suivre sans avoir recours à un quelconque artifice (google barre, gmail ou autre).
 
WRInaute accro
salva a dit:
La question reste posée.

D’autant plus qu’il doit être aisé pour Google d’extraire l’url texte et de la suivre sans avoir recours à un quelconque artifice (google barre, gmail ou autre).
Un navigateur ne le fait pas mais un lecteur de mails transforme automatiquement un texte formaté comme URL en un lien cliquable, donc oui, c'est techniquement facile.
Mais GG le fait-il ? Peut-être uniquement pour vérifier l'existence de la cible et l'engranger dans sa BDD s'il ne l'a pas déjà en stock mais sûrement pas au niveau des références, ce serait une trop grande porte ouverte au spam.
 
WRInaute accro
Szarah a dit:
salva a dit:
La question reste posée.

D’autant plus qu’il doit être aisé pour Google d’extraire l’url texte et de la suivre sans avoir recours à un quelconque artifice (google barre, gmail ou autre).
Un navigateur ne le fait pas mais un lecteur de mails transforme automatiquement un texte formaté comme URL en un lien cliquable, donc oui, c'est techniquement facile.
Mais GG le fait-il ? Peut-être uniquement pour vérifier l'existence de la cible et l'engranger dans sa BDD s'il ne l'a pas déjà en stock mais sûrement pas au niveau des références, ce serait une trop grande porte ouverte au spam.
Fort probable.
 
Nouveau WRInaute
Ping?

As-tu désactivé les pings dans Dotclear ?
Peut-être que ton Dotclear envoie des ping à Google (blogsearch.google.com), ce qui pourrait expliquer que quelques pages soient déjà indexées sur GG.
 
WRInaute passionné
Intéressant ce sujet... savoir s'il peut le faire, la réponse est tout vue d'avance : bien sûr rien de plus simple... ce qui compte c'est de savoir s'il le fait, et pourquoi ne le ferait-il pas ?

(En parallèle, j'ai des liens nofollow qui pointent vers mon site et ils apparaissent bien dans mes bl.)
 
WRInaute passionné
xescorp a dit:
Oui oui Firefox a le champ de recherche Google.

Mais, je suis désolé, mais je n'ai jamais autorisé expressément Google à suivre les sites sur lequel je navigue, donc pour moi cela s'apparente à du spyware.

Si le seul champ de recherche permettait d'envoyer des infos à un moteur de recherche, cela aurait déjà été découvert dans le code de Firefox, non ? Ces moteurs sont passifs il me semble à priori ?
L'explication est plus à chercher du côté de la Google bar ou autre (adsense ? ping de la page, etc)...
 
X
xescorp
Guest
As-tu désactivé les pings dans Dotclear ?
Peut-être que ton Dotclear envoie des ping à Google (blogsearch.google.com), ce qui pourrait expliquer que quelques pages soient déjà indexées sur GG.
Par défaut Dotclear ping GG ? C un plugin non ? Rq : je n'ai pas la version 2.


En parallèle, j'ai des liens nofollow qui pointent vers mon site et ils apparaissent bien dans mes bl.

Ca aussi c'est étrange, ces liens ils ont toujours été nofollow?
 
WRInaute accro
J'ai déjà vu un post évoquant le fait que Google suivrait les urls sans a href, je ne sais plus si j'avais vérifié ou non, à faire :p.

Mais ça ne serait pas étonnant, par contre le poids transmis en terme de référencement est probablement nul ou quasiment nul.
 
WRInaute passionné
xescorp a dit:
As-tu désactivé les pings dans Dotclear ?
Peut-être que ton Dotclear envoie des ping à Google (blogsearch.google.com), ce qui pourrait expliquer que quelques pages soient déjà indexées sur GG.
Par défaut Dotclear ping GG ? C un plugin non ? Rq : je n'ai pas la version 2.

Sur DC2 il y a un outil de ping pour les billets, mais ce n'est pas activé par défaut quand tu postes un billet. Pour DC1 rien de ce genre (sauf un plugin éventuellement, mais si tu ne l'as pas installé...).

xescorp a dit:
En parallèle, j'ai des liens nofollow qui pointent vers mon site et ils apparaissent bien dans mes bl.

Ca aussi c'est étrange, ces liens ils ont toujours été nofollow?

Personnellement j'ai toujours eu un doute sur l'exploitation réelle et surtout entièrement effective du nofollow.
 
Discussions similaires
Haut