Référencement d'Images et Guid

Nemesis25

WRInaute discret
Bonjour à tous,
C'est mon premier message ici et je débute en référencement du coup je m'excuse d'avance si ma question est "bête", mais je souhaite faire référencer l'ensemble des images postés sur mon site www.colleconline.com.

Le problème, le contenu est dynamique (géré par les membres), et par conséquent le nom des images sont des Guid, images stockées dans un répertoire ayant également pour nom un Guid:

<a id="single_image" href="http://portalvhdscmdsz1pfqd1gq.blob.core.windows.net/artefactimg/6af56e9d6ebf4508bbdce9cb427e0069/a2d26759e41b437abc199cb00ed9b914.jpg"><img class="imgGallery img-responsive img-thumbnail" src="http://portalvhdscmdsz1pfqd1gq.blob.core.windows.net/artefactimg/6af56e9d6ebf4508bbdce9cb427e0069/a2d26759e41b437abc199cb00ed9b914.jpg" alt="Seconde R&#233;publique - 1 centime Dupr&#233; - 1848 Paris" /></a>

Un lien vers une fiche objet: http://www.colleconline.com/Artefact/Viewer/cc202a66-e027-4b6a-ab8c-73af7f23406a

Est-ce que le fait d'avoir un nom qui n'est pas parlant peut bloquer le référencement?

J'ai ajouté dans le sitemap du site les images, elles sont visibles dans l'outil Google Webmaster Tools, mais aucune des 5300 images ne sont pour l'heure indexées (le site est lancer depuis plus de 2 mois).

gwt10.png


D'ailleurs j'ai un problème également sur le nombre de pages indexées mais c'est un autre problème..

Merci d'avance
 

HawkEye

WRInaute accro
Le sitemap ne suffit généralement pas à lui seul pour faire indexer correctement un site.
A première vue, concernant le tiens, il me semble que le problème est inhérent au fait que tes contenus ne sont pas accessibles par une navigation "classique". Il ne semble pas y avoir d'arborescence permettant la découverte naturelle des pages par le robot.
 

Nemesis25

WRInaute discret
Merci pour ta réponse. Outre le sitemap, nous avons créé une page nous permettant d'être crawlé. (page non visible par l'utilisateur). Nous pouvons observer dans nos logs que les robots passent bien par cette page. Cela n'est pas non plus suffisant et nous devons créer une page "visible" à tous permettant d'accéder à l'ensemble du contenu du site? Merci d'avance!
 

HawkEye

WRInaute accro
Ta page "non visible" va par définition obtenir peu (voir pas du tout) de liens. Elle aura donc très peu de potentiel à transmettre aux autres pages de ton site.

A contrario, la page la plus "forte" de ton site est par définition la page d'accueil: c'est depuis cette page qu'il faut déployer une arborescence complète permettant non seulement la visibilité par les robots d'indexation, mais également (et surtout) la transmission de potentiel au sein de ton site.

Exemples en vitesse:

- liens vers les types de collections (si existant, ou s'il est possible d'ajouter cette information), ie: collections de timbres, collections de pièces, collections de jeux, whatsoever...

- liens vers les dernières collections mises à jour ou créées

- liens vers les derniers "items" ajoutés aux collections

En marge de ça, un maillage "horizontal" au coeur du site permettra de concentrer la thématisation du potentiel (lier entre elles les collections de même type, par exemple).

++
 

Nemesis25

WRInaute discret
Merci une nouvelle fois, c'est cool d'avoir jeter un coup d'oeil au site pour donner un exemple concret. Je vais partir sur ta première solution du coup à savoir un lien vers une page listant l'intégralité des collections regroupées par thématiques, page sans vu qu'il risque d'y avoir un peu de volumétrie. Ca devrait pas être trop compliqué à faire :)

Je vous tiendrais au courant de l'impacte en vous postant un nouveau graphique d'ici quelques jours semaines en espérant que ça soit mieux. Deux petites questions après je vous embêtes plus. Je n'ai pas réussi à trouver d'explication clair entre ces 2 notions GWT:
Index Google => Etat de l'indexation => Nombre total de pages indexées: 720
Exploration => Sitemap => 136 dans l'index
Ca serait d'un côté le résultat de l'indexation naturelle et de l'autre celle via le sitemap? Et ces résultats doivent s'additionner ou peuvent se confondre?

Pour la 2e question, est-ce que notre petit problème d'arborescence qui fait qu'on ne peut pas accéder à l'ensemble des pages du site depuis la page d'accueil suffit à expliquer que l'on ait aucune image indexée? (alors qu'on a une image par page, et 720 pages indexées)
 

baud74

WRInaute impliqué
je pense que google ne donne des infos que sur les urls du site vérifié, là les images sont sur un autre domaine.
 

Nemesis25

WRInaute discret
Bonsoir,
Nous avons mis en place un correctif sur le nom de domaine pour les images, et l'intégralité des pages du site sont maintenant accessibles via une navigation naturelle. Le résultat s'est fait sentir, nous sommes à un peu plus de 2950 pages indexés lorsque l'on tape "site:www.colleconline.com". Par contre toujours pas l'ombre d'une image indexée mise à part quelques miniatures d'une taille 150*150 situés sur d'autres pages.

Ci-dessous un exemple de page finale bien indexé (excepté l'image):
http://www.colleconline.com/Artefact/Viewer/2b6e10cd-ee25-4258-aae2-ed9e49babed5

Si je peux me permettre de vous déranger encore un peu, quelqu'un aurait une idée de ce qui pourrait clocher à présent? Est-ce que le fait d'utiliser une lightbox (fancybox) pourrait influencer sur l'indexation de l'image? Et est-ce que l'indexation d'une page et de son image sont fait en même temps?

Merci d'avance!
 

zeb

WRInaute accro
Nemesis25 a dit:
Ci-dessous un exemple de page finale bien indexé (excepté l'image):
Tes images doivent pas renvoyer un entête standard chez moi elle provoque l'ouverture du logiciel de traitement photo (gimp), mais elle ne s'affichent pas dans le navigateur (clic droit "afficher l'image").
Qui plus est un regard sur le fichier en mode texte me semble donner un entête de fichier non conforme a du Jpeg.
 

zeb

WRInaute accro
voir ici > https://www.webrankinfo.com/outils/header.php?url=http%3A%2F%2Fimg.coll ... internaute

HTTP/1.1 200 OK
Content-Length: 203746
Content-Type: application/octet-stream
Content-MD5: KlrB12FXHPPQxGZ3a0MJpg==
Last-Modified: Sat, 29 Nov 2014 21:38:14 GMT
ETag: 0x8D1DA33EA1F7C8F
Server: Windows-Azure-Blob/1.0 Microsoft-HTTPAPI/2.0
x-ms-request-id: 6400fe88-0001-0049-47a5-477e1f000000
x-ms-version: 2009-09-19
x-ms-lease-status: unlocked
x-ms-blob-type: BlockBlob
Date: Fri, 05 Dec 2014 06:51:57 GMT

C'est ça ton souci.
 

Nemesis25

WRInaute discret
Bonjour,
Comme promis je viens donner des nouvelles, et malheureusement elles ne sont pas bonnes les images ne s'indexent toujours pas malgré une correction sur le content-type apporté il y a une dizaine de jours :?

Voici un exemple de fiche déjà indexée par google:
http://www.colleconline.com/Artefact/Viewer/17c90c31-b00d-4e89-9674-ebd95aa1d50a

Le lien vers l'image:
http://img.colleconline.com/artefactimg/b37f9521fd6f4ad5b4d7c50d46e3da ... 360eb8.jpg

Son passage à la moulinette :
HTTP/1.1 200 OK
Content-Length: 101872
Content-Type: image/jpeg
Content-MD5: LZyx6WjhhBXStLUiCuzEZQ==
Last-Modified: Fri, 12 Dec 2014 19:44:33 GMT
ETag: 0x8D1E45B303FB8BB
Server: Windows-Azure-Blob/1.0 Microsoft-HTTPAPI/2.0
x-ms-request-id: 9226a971-0001-0042-0618-699d66000000
x-ms-version: 2009-09-19
x-ms-lease-status: unlocked
x-ms-blob-type: BlockBlob
Date: Wed, 17 Dec 2014 13:11:05 GMT

Avez-vous une idée d'un autre point qui pourrait bloquer?

Pour reprendre les points qui me passent par la tête:
- Est-ce que le blocage peut provenir du serveur Blob Windows Azure en lui même?
- Est-ce possible que l'url soit trop longue ou incompréhensible? (composée de deux Guid)
- Est-ce que le nom de l'image en lui même peut poser problème? (un Guid également)
- Est-ce que l'utilisation d'une LightBox (Fancybox) pourrait perturber Google ?

Désolé pour toutes ces questions et merci d'avance,
 

zeb

WRInaute accro
Nemesis25 a dit:
- Est-ce que le blocage peut provenir du serveur Blob Windows Azure en lui même?
aucune idée
Nemesis25 a dit:
- Est-ce possible que l'url soit trop longue ou incompréhensible? (composée de deux Guid)
ça je ne pense pas
Nemesis25 a dit:
- Est-ce que le nom de l'image en lui même peut poser problème? (un Guid également)
ça je suis sur que non car j'utilise que ça et je n'ai pas de souci
Nemesis25 a dit:
- Est-ce que l'utilisation d'une LightBox (Fancybox) pourrait perturber Google ?
je pense que le souci serait déjà remonté.

Sinon la commande "site" sur GG image renvoie quelques images (5/6) il faut peut être attendre et dans tous les cas faire une comparaison entre les pages avec image indexée et celles qui ne passent pas.

Autre piste la mise en place du non référencement du contenu caché ... est ce que justement avec cette nouvelle disposition (qques semaines) google ne cacherait pas tes images fancytruc. ???
 

Nemesis25

WRInaute discret
Merci beaucoup pour ces précisions. Les images référencées ne sont pas des images créées et uploader par nos soins mais des images statiques du design, elles ne proviennent pas des utilisateurs. Je vais donc attendre quelques semaines pour voir ce que ça donne :eek:
 

zeb

WRInaute accro
UsagiYojimbo a dit:
le sous-domaine img ...
J'ai pas soulevé ce point car j'ai des images indexées en sous domaine aussi ... et ça passe en revanche c'est pas con cette idée pour avoir des infos en plus ... (va de ce pas faire de même par curiosité)
 

Nemesis25

WRInaute discret
Je viens de l'ajouter également pour voir ce que ça donne, par contre question bête, j'ai ajouté le sous-domaine mais il y manière d'indiquer à GWT la liaison entre domaine et sous-domaine ou bien ça sera considéré comme deux domaines différents pour GWT?
 

Nemesis25

WRInaute discret
Je viens d'être pris d'une vieille angoisse, mes pages contenant les images sont en nofollow alors que les images sont hébergés sur un serveur blob Azure... Est-ce que ça expliquerait pas très simplement le problème? :roll:
 

Nemesis25

WRInaute discret
Bonjour,
J'ai laissé du temps au temps après avoir mis en place les conseils que vous m'avez remonté ici mais le fait est que j'ai toujours uniquement 25 images de référencées sur les 10 000 que compte à présent le site.

Ci-dessous voici un extrait du code récupéré sur GWT via la fonction explorer comme google pour cette page:

<a class="grouped_elements" rel="group1" href="http://img.colleconline.com/artefactimg/db9204fc7513466eb17124dcf1a1f1c7/bfce56e1862b4c3db3ae34667125654a.jpg">
<img src="http://img.colleconline.com/artefactimg/db9204fc7513466eb17124dcf1a1f1c7/bfce56e1862b4c3db3ae34667125654a.jpg" alt="CGKL 470 - Louis XIII - Double tournois 1638 E Tours 0" class="imgGallery img-responsive img-thumbnail" width="1000" height="1000" title="CGKL 470 - Louis XIII - Double tournois 1638 E Tours" />
</a>

Est-ce que quelque chose cloche ? Le fait que l'image soit dans une balise a href peut-il poser un soucis?

A noter qu'on a aussi réalisé un sitemap image en plus d'avoir ajouter un maximum d'informations (alt, title, size,...).
La seule optimisation non réalisée à ma connaissance consiste consisterait à optimiser le nom de l'image (remplacer le Guid par un titre du genre "CGKL-470-Louis-XIII-Double-tournois-1638-E-Tour" mais c'est un travail trop lourd pour qu'on se lance dedans)

Merci d'avance
 

Nemesis25

WRInaute discret
C'est corrigé Zeb normalement j'avais suivi votre conseil :wink: Nous ne sommes pas passé sur les premières images créées mais toutes les nouvelles un content-type convenable maintenant, enfin j'espère:

https://www.webrankinfo.com/outils/header.php?url=http%3A%2F%2Fimg.coll ... internaute

HTTP/1.1 200 OK
Cache-Control: max-age=86400, must-revalidate
Content-Length: 218119
Content-Type: image/jpeg
Content-MD5: R1MlhXGUUNUhrQ81C3wPEA==
Last-Modified: Thu, 22 Jan 2015 20:14:47 GMT
ETag: 0x8D2049734076548
Server: Windows-Azure-Blob/1.0 Microsoft-HTTPAPI/2.0
x-ms-request-id: 9a746deb-0001-0034-689a-63abb4000000
x-ms-version: 2009-09-19
x-ms-lease-status: unlocked
x-ms-blob-type: BlockBlob
Date: Fri, 23 Jan 2015 20:41:16 GMT

A moins qu'on ait fait fausse route et qu'il n'y ait pas que le Content-Type qui n'était pas bon? :?
 

UsagiYojimbo

WRInaute accro
Tu as essayé, sur GWT, de faire un test de crawl sur l'url d'une image avec le bon content-type, de façon à voir si quelque chose d'autre bloque ?
 

Nemesis25

WRInaute discret
Oui, voici la réponse http de Google si je fais un exploré comme Google:

HTTP/1.1 200 OK
Cache-Control: max-age=86400, must-revalidate
Content-Length: 218119
Content-Type: image/jpeg
Content-MD5: R1MlhXGUUNUhrQ81C3wPEA==
Last-Modified: Thu, 22 Jan 2015 20:14:47 GMT
ETag: 0x8D2049734076548
Server: Windows-Azure-Blob/1.0 Microsoft-HTTPAPI/2.0
x-ms-request-id: 9d1e5dae-0001-0028-7e72-e1ddb0000000
x-ms-version: 2009-09-19
x-ms-lease-status: unlocked
x-ms-blob-type: BlockBlob
Date: Fri, 23 Jan 2015 20:49:40 GMT

Si je fais exploré et affiché dans GWT je visualise bien mon image.

Histoire de préciser, on a quand même 26 images indexés, ce n'est pas un blocage total, mais vu que c'est le coeur de notre site on espère un peu mieux que ça :mrgreen:
 

zeb

WRInaute accro
Nemesis25 a dit:
on a quand même 26 images indexés, ...
don certaine avec l'entête "octet stream" (j'avais vérifié) ce qui semble indiquer que ce n'est pas le fond du problème d'ailleurs. Je suis perplexe du coup.

Faudrait essayer de bricoler une redirection du domaine principal sur une ou deux images afin de masquer le domaine "photo" histoire de voir si ça facilite la prise en compte mais là encore je suis dubitatif car j'ai aussi ce genre de config et ce n'est pas problématique (photos en sous domaine avec hash md5 comme nom)
 

zeb

WRInaute accro
A tout hasard pour comparer voici un entête pour une photo qui est dans le même genre de contexte que le tiens (s-domaine et hash) et qui est indexées :

HTTP/1.1 200 OK
Date: Sat, 24 Jan 2015 06:28:21 GMT
Content-Type: image/jpeg
Connection: keep-alive
Set-Cookie: __cfduid=d9599fd7de85baeaebbddbed61130ce2d1422080900; expires=Sun, 24-Jan-16 06:28:20 GMT; path=/; domain=.--------------------------.com; HttpOnly
X-Powered-By: PHP/5.5.20
Cache-Control: public, max-age=290304000
expires: Sat, 06 Apr 2024 06:28:21 GMT
Last-Modified: Sat, 24 Jan 2015 06:27:39 GMT
CF-Cache-Status: HIT
Server: cloudflare-nginx
CF-RAY: 1ada2b9e9585049d-CDG
 

Nemesis25

WRInaute discret
On va chercher de ce côté là, merci de nous consacrer un peu de temps en tout cas, c'est frustrant de voir le coeur de notre site non pris en compte depuis quasiment 6 mois qu'on s'est lancé..

Cela n'a surement rien à voir mais je vous soumet du coup un problème "PageSpeed Insights" de Google. Etant donné que je ne sais plus où chercher, peut-être qu'un problème semblerait rien avoir à voir pourrait bloquer l'indexation des images? :oops:

L'erreur n'a vraiment pas l'air connu, peu de résultats sur google si on recherche:

Attempting to load the page reached the limit of 3 client redirects. The last URL fetched was http://www.colleconline.com/. This may indicate the page is redirecting to itself, or has a loop of redirects

 

Nemesis25

WRInaute discret
Et si ça peut aider, il semblerait que les images postées directement par les membres sur leurs pages via des liens img aient toujours été bien indexées.

Le plus probable c'est que le problème provient de l'encodage de nos images que nous faisons à la main ou de notre serveur de stockage Azure.
 

Discussions similaires

Haut