Quand Google met-il à jour Google-image ? (oct 2003)

WRInaute impliqué
Bonjour,

1 - Quelqu'un a-t-il une idée du temps depuis lequel Google n'a pas actualisé son index d'images ?

2 - Je cherche à caser les images de h**p://membres.lycos.fr/cledencapsizun mais Google n'en veut pas ou ne les connait pas. Pour quelle(s) raison(s) ?

Merci d'avance,
Loïc.
 
WRInaute accro
Google fait une sélection... comment ? ça j'en sais rien :roll:

J'ai testé pour savoir quelles images de mon site il référençait... et je me suis rendu compte que des images publiées à la même date n'y étaient pas

Pour tester dans la recherche image... on va dire sur le mot pomme si tu publies des pommes :wink:

tu tapes pomme site:www.tonsite.com
 
Nouveau WRInaute
Americas a dit:
Google fait une sélection... comment ? ça j'en sais rien :roll:

J'ai testé pour savoir quelles images de mon site il référençait... et je me suis rendu compte que des images publiées à la même date n'y étaient pas

Pour tester dans la recherche image... on va dire sur le mot pomme si tu publies des pommes :wink:

tu tapes pomme site:www.tonsite.com

Bonjour,
Google Images est passé récemment sur mon site.
Extrait fichier log :
64.68.88.48 web2 - [20/Oct/2003:08:11:21 +0200] "GET /venise/vignettes/palais_des_doges.jpg HTTP/1.0" 302 297 "-" "Googlebot-Image/1.0 (+http://www.googlebot.com/bot.html)"
Un passage et 3 images le 20 Octobre
Ces images ne sont pas encore dans les pages résultats. C'est facile à voir avec une recherche du type :
"site:www.blabla.com -ddjfsdj"

Par contre, aucune idée pour la date de mise à jour !
 
WRInaute occasionnel
Je confirme également, Google m'amène toujours des visiteurs sur des images que j'ai supprimées en janvier.

Cependant chose rarissime, aujourd'hui il m'a crawlé moins d'une dizaine de pages mais des centaines d'images :

Code:
crawl32.googlebot.com - - [23/Oct/2003:19:43:33 +0200] "GET /pic/big/1-origine.jpg HTTP/1.0" 200 46825 "-" "Googlebot-Image/1.0 (+http://www.googlebot.com/bot.html)"

Ca doit leur consommer un max de bande passante, c'est peut-être pour cela qu'ils ont freiné le crawl des pages.

Signe annonciateur d'une mise à jour des images ?
 
WRInaute discret
Dites-moi si je me trompe mais l'impression que Google a enfin mis son directory images à jour ! J'avais 4 images repertoriées depuis quasi deux ans et en voici 642 d'un coup ... de quoi amener des visiteurs supplémentaires mais aussi de quoi augmenter le risque de se faire piquer des photos :?
 
Nouveau WRInaute
De nombreuses visites de Googlebot-Image il y à environ 3 mois et cette semaine 239 images sont repertoriées chez google d'un seul coup!Impressionnant 8O !
 
WRInaute occasionnel
moi c'est comme si google avait boycotté mon site...

Aucune photo de mon site dans google images et pourtant j'en ait plus de 1200 et elles ont toutes un ALT avec description de l'image !

De plus, j'suis désormais en 43è page alors qu'il y a 2 jours, j'étais page 1 en troisieme position pour la requete .
Ca m'écoeure ....
 
WRInaute accro
Alors la...je viens de découvrir qu on pouvait savoir le nombre d´images indexées sur google image...

A ma grande surprise, je n en ai que deux (images indexées correctement) et je constate le commentaire assez connu, à savoir :

Pour limiter les résultats aux pages les plus pertinentes (total : 2), Google a ignoré certaines pages à contenu similaire.
Si vous le souhaitez, vous pouvez relancer la recherche en incluant les pages ignorées.

pour les 79 autres.....


Ma question : dans google image, sur quels critères se base google pour déterminer que des résulats sont similaires ? le ALT ou TITLE des images en question ? Le code des pages contenant ces images ?

comment connaitre la version de la page servant de base à l indexation des images sur google image ? en gros, y a t il une sorte de "version cache" sur google image ?

a+
 
WRInaute impliqué
J'ai un bon paquet d'images et comme j'en ajoute très régulièrement, je peux voir qu'en ce qui me concerne, cela s'arrête à fin février environ.
 
WRInaute accro
je vois que j ai des images indexées et quand je clique sur l image en question, google me mène vers la page "actuelle" (ou presque) qui contient (qui contenait) l´image au moment du passage du bit.

Cela arrive donc que l image indéxee ne soit plus du tout sur la page présentée.... par exemple si on a modifier la apge depuis..!!

par contre, une idée pour les images "ignorées" mais indexées ?
 
WRInaute accro
a mon avis il doit se baser sur le ALT ... mais toi qui en a d'ignorées, tu pourrais peut être le vérifier ?
 
WRInaute occasionnel
-http://images.google.fr/images?q=site%3Atondomaine.com&ie=UTF-8&hl=fr

Tu tapes sous google-images "site:tondomaine.com"
 
WRInaute accro
Cendrillon a dit:
a mon avis il doit se baser sur le ALT ... mais toi qui en a d'ignorées, tu pourrais peut être le vérifier ?

Petit test :

- j'ai 81 images indexées aujourd'hui
http://images.google.fr/images?hl=fr&lr ... itiers.com

- seule 2 ne sont pas ignorées
http://images.google.fr/images?hl=fr&lr ... itiers.com

- prenons la premiere. le ALT est "l0cation 86"

- recherche sur ce terme donne l'image en 12eme place
http://images.google.fr/images?hl=fr&lr ... ocation+86

- recherche sur une partie du nom de fichier "l0cation Vienne" . l'image arrive en premiere place ! ahhhhh a-t-o trouvé la solution ? non.... (voir la suite....)
http://images.google.fr/images?hl=fr&lr ... Rechercher

- la deuxieme image sur la requete précédente m'appartient également. bizarre, elle ne fait pas partie des deux photos "non ignorées" !!

>> cela veut dire que les images (ou pages) ignorées ne le sont que par la commande NDD dans google image. sur une requete, l'image peut ressortir en résultat. cela ressemble au mechanisme des pages ignorées sur google web. :wink:

A ce moment là, tout le monde croit que c est le nom du fichier qui est important...

- observez l'image numero 13. celle de l'internet facile. c est une image que j'ai mis a disposition lors de mon inscription. observez le nom de fichier : aucun des mots de la requete. et le ALT ? il n'y en a pas !

>> Cette image ressort donc sans l'aide du nom de fichier ni du ALT. pas non plus par l'URL (ni NDD, ni repertoire) un des termes dans le title.... et directement au dessus de l'image dans le contenu.

pas facile alors.....!! Observons de plus pres les premieres images sur la requete "l0cation vienne" (J'ai remplacé le o par le 0 pour éviter des effets non voulus ici).

- Image numero 3 >> aucun terme de la requete dans le nom de fichier. ALT absent. Seul indice : le terme location dans l'URL et..... la balise title de la page contenant l'image en question !! il contient en effet la requete exacte !! coincidence ?

- Image numéro 4 : meme constatation, mais bon, c est me meme site. facile.

on poursuit :

- Image numéro 5 (on passe le fait que la page soit blindée à fond de techniques "ref" plus ou moins respectables.... je tombe dessus par hasard et on est pas là pour ça... :evil: )

Nom de fichier ne contient pas la requete. le ALT non plus. l'URL (NDD et repertoire) non plus. un terme de la requete présent dans le title et dans le contenu (plusieurs fois). l'autre absent du title mais présent dans le contenu.

- Image numéro 6 : les deux termes sont présent dans le ALT et un terme dans le title. URL contient également un des deux termes.

j'arrete là. conclusion ? pas de conclusion !! :) les critères qui sont envisageables :

- nom de fichier de l'image
- ALT de l'image
- Title de la page contenant l'image
- contenu textuel de la page contenant l'image
- URL de la page contenant l'image.

Un point commun en passant : toutes les premieres images "toutes tailles confondues" sont des "moyennes".

pour pondérer tout ca...heu.... je sais pas.....

En tout cas, il semblerait que le title de la page contenant l'image ait un role à jouer...tout comme l'URL...le nom de fichier....et le ALT aussi... :wink:

bon, allez, je vais me coucher moi.
a+

ps : et pour finir de semer le trouble, voici le top de l'ananlyse :

la requete : Futur0sc0pe"
http://images.google.fr/images?hl=fr&lr ... uturoscope

- Les 16 premieres ont le mot dans le nom de fichier. enfin presque...vous noterez que le undescore ne fait pas apparaitre le terme en gras contrairement au tiret.... :wink:

- cherchons le premiers resulats ou le terme n est pas present dans le nom de fichier. c est la numero 17 (nom du fichier 1557)

- pour cette image, la requete est donc absente du nom du fichier, absente du ALT. non présente dans l'URL et pas présente non plus dans le title de la page.

En observant le code, le terme n'apparait qu'une seule fois. dans le contenu en H4 juste au dessus de la série de photos......!

Mais pourquoi cette photo ressort si c'est grace a ce terme en H4 juste au dessus et pas les autres ? Est-ce parce que c est la premiere en partant de la gauche suivant ce terme ? possible....

bonne méditation....!! :)
 
WRInaute accro
En tout cas, il semblerait que le title de la page contenant l'image ait un role à jouer...tout comme l'URL...le nom de fichier....et le ALT aussi...


pas si sûr, à la première page sur gendarmerie (entre autre) sur un petit site de village avec des pages contenant beaucoup de photos (trop :lol: ). Pour le terme gendarmerie, elle est reprise sous une page "week-end ...", pas de balise ALT pour ne pasd encore allourdir la page. Le terme gendarmerie apparaît 2 ou 3 fois dans la page mais est noyé dans le reste du texte de la page. Je pense que GG analyse le texte au-tour de l'image.
 
WRInaute impliqué
Google/image analyse le texte avant et après l'image, jusqu'à rencontrer une autre image (c'est pourquoi par exemple, dans une suite d'image, seule la première sort).
 
WRInaute accro
Remi L. a dit:
Google/image analyse le texte avant et après l'image, jusqu'à rencontrer une autre image (c'est pourquoi par exemple, dans une suite d'image, seule la première sort).

Test en cours...(mais ca va durer pour les résultats vu la fréquence du passage du bit et de la mise a jour..... pffff!!)

la premiere image ? la premiere en partant de la droite si c est uns érie de photo sans texte intermédiaire ?
 
WRInaute impliqué
La première dans l'ordre du contenu html de la page...
Mais cela est valable que dans le cas où seul le texte environnant a compté (si le mot est dans l'url, l'image sortira de toutes façons) et, comme d'habitude, il doit être facile de trouver des contre-exemples... ;-)

J'ai notamment l'impression qu'il assimile les images avec des numéros d'ordre (image01, image02, ...) : quand il en prend une pour une recherche, il fait sortir aussi les autres.
 
WRInaute discret
Hem, j'ai une question bête :
je n'ai jamais vu passer le bot pour les images ... :eek:( aucune de mes images n'est indéxée, et pourtant j'en ai un petit nombre ...
Comment invite t'on 'Imagebot' a venir prendre un verre ;o)
 
WRInaute passionné
Il n'y a pas d' "ImageBot" à ma connaissance. C'est GoogleBot qui se charge de tout.
 
WRInaute impliqué
Si si, il y a un googlebot/image.
Il ne passe pas souvent mais quand il passe, c'est de façon assez massive.

Il n'y a rien à faire de spécial pour le faire venir, il finit par venir au bout... d'un certain temps (rarement avant 1 an d'existence du site me semble-t-il).
 
WRInaute passionné
uh !? sérieux ?

et il est identifié différement ? Parce que le seul USER_AGENT que j'ai vu passer sur mon site c'est le GoogleBot normal... arf, si c'est le "GoogleBot/image", je suppose qu'il ne consulte que les images, en se basant sur la liste que lui fourni son grand frère ;)
 
WRInaute impliqué
Code:
64.68.88.4x (ou 5x)  Googlebot-Image/1.0
D'après mes stats, je ne l'ai pas revu depuis fin mars.
... et la fois précédente c'était en octobre et novembre 2003.
 
WRInaute discret
Bah ben il m'm pas car rien et mon site existe depuis plus de 2 ans ... et est pas mal positionné .. bref ... on verra ...
merci!
 
Discussions similaires
Haut