Google SiteMaps : comment guider Google dans son site

WRInaute passionné
non "readdir" est autorisé sur free voila une version qui marche

Code:
<html>

<head>
<title>Générateur de fichier sitemap</title>
<meta http-equiv="content-type" content="text/html; charset=iso-8859-1" />
<meta name="generator" content="HAPedit 3.1">
</head>
<body bgcolor="#FFFFFF">
<h2>Génération du fichier sitemap.xml... </h2>
<?
// générateur de fichiers sitemap.xml pour google
// 1- éditer $racine
// 2- uploadez le fichier sur votre compte et lancez à partir d'un navigateur
$racine= "http://topflood.free.fr";

$DossiersInterdits = array("includes","modules","sessions","images","pnadodb");
$FichiersInterdits = array("config.php");

$toutXml ="<?xml version=\"1.0\" encoding=\"UTF-8\"?>\r\n<urlset xmlns=\"https://www.google.com/schemas/sitemap/0.84\">\r\n";

$myfiles=GetDirContents(".");

/**
function Dossier_Autorisé
param : $DossierCourant 
return : vrai si dossier autorisé faux sinon
*/

function Dossier_Autorisé($DossierCourant)
{
global $DossiersInterdits;
 return Est_Autorisé($DossierCourant, $DossiersInterdits);               
}

/**
function Dossier_Autorisé
param : $DossierCourant 
return : vrai si dossier autorisé faux sinon
*/

function Fichier_Autorisé($DossierCourant)
{
global $FichiersInterdits;
 return Est_Autorisé($DossierCourant, $FichiersInterdits);               
}

/**
permet de réaliser les deux fonctions précédentes
*/
function Est_Autorisé($DossierCourant,$Interdits)
{

$drapeau = true;
 while ($drapeau && list(,$Dossier)=each($Interdits)  )
 {  
 if ($DossierCourant == $Dossier)$drapeau = false;
}
 reset($Interdits);
 return $drapeau;               
}


/**
fonction GetDirContents
param : $dir dossier racine (le test est récursif)
return : liste des urlsDossier_Autorisé
*/
function GetDirContents($dir){
global $racine;

 ini_set("max_execution_time",10);
   if (!is_dir($dir)){die ("PROBLEME: $dir!");}


   if ($root=@opendir($dir)){
       while ($file=readdir($root)){
           if($file=="." || $file==".."){continue;}
           if(is_dir($dir."/".$file)  && Dossier_Autorisé($file)){

                  $files=array_merge($files,GetDirContents($dir."/".$file));

           }else{

           $extension=substr($file,-3);

           if ($extension=="php" or $extension=="htm")
           {
	echo "<b>$dir</b>/$file<bR>";
           $files[]=$racine.substr($dir,1)."/".$file;
	  
           }
           }
       }
   }

   return $files;
}


foreach($myfiles as $url)
{
  $toutXml.=
  "<url> \r\n   <loc>$url</loc>  \r\n </url>     \r\n";

}

$toutXml.="</urlset>";



$fp = fopen("sitemap1.xml", "w+");
fwrite($fp, $toutXml);
fclose($fp);
?>
<center><a href=http://topflood.free.fr>Top flood</a></center>
</body>

</html>

Je l'ai testé ce matin salut ;)

en fait c'est parce que t'es trop remonté dans l'arborescense des fichiers de free il me semble ...
 
WRInaute passionné
ww.timesplittersgames.tk

c'est pas une redirection javascript ?? est ce que google va arriver a indexer ca ?
 
WRInaute impliqué
Bon je viens de soumettre le sitemap de mon forum phpbb.
J'ai fait quelques modifications du mod spécifique phpbb afin qu'il prenne en compte mon url_rewriting (avec le titre du post dedans), et ca me génère bien un fichier qui a une bonne gueule.
On va bien voir ce que ca donne.
 
K
kloh
Guest
Mumuri a dit:
non "readdir" est autorisé sur free voila une version qui marche
[...]
Je l'ai testé ce matin salut ;)

en fait c'est parce que t'es trop remonté dans l'arborescense des fichiers de free il me semble ...
Ok merci j'essaierai ça demain^^

Foxus a dit:
KLOH TU A laisser le : <loc>https://www.google.com/BUILD</loc> ?
non^^

Mumuri a dit:
ww.timesplittersgames.tk

c'est pas une redirection javascript ?? est ce que google va arriver a indexer ca ?
Alors là j'en sais rien mais avec ce nom de domaine mon site est en première page en tapant "timesplitters" juste après les sites officiels, donc bon..^^
 
WRInaute passionné
ce que je disais Kloh c'est que si tu mets des liens du type
http://ww.timesplittersgames.tk/ts3/personnages.php

ca passera pas pour googlebot (ca marche déja pas avec firefox)
de plus ca m étonnerai que tu sois pas premier sur ta requete avec un nom de domaine comme çà ;).
http://timesplittersgames.free.fr

aprés ca dépend si tu veux avoir qu'une seule page référencé sur ton site
https://www.google.fr/search?num=100&hl= ... cher&meta=

ou plusieurs comme çà
https://www.google.fr/search?num=100&hl= ... cher&meta=
 
K
kloh
Guest
Ok I see^^ you're right, je vais changer ça

J'ai essayé le script que tu as donné hier et il marche super^^. Le seul truc qui serait bien c'est qu'on puisse exclure le contenu des dossiers qu'on ne veut pas afficher en indiquant leur chemin ou quelque chose du genre, notament si j'ai un dossier où je stocke des pages qui n'ont rien à voir avec le site (par exemple sur le serveur de mon site j'ai un dossier contenant un site de quelques pages, mais qui n'a rien à voir avec mon "gros" site, et donc j'aimerais qu'il ne prenne pas en compte ce dossier). Je suis pas du tout callé en programmation donc je sais pas comment faire mais je pense pas que ça soit extrêmement compliqué

EDIT : ou même si on pouvait exclure des fichiers "solitaires" ce serait parfait^^. Je viens de me souvenir que j'avais quelques fichiers en include de-ci de-là qui servent à rien seuls
 
WRInaute discret
ca y est mon beau petit fichier sitemap.xml est en ligne :)
me suis fait un chtit script php avec de jolie date et tout
esperons que google me crawlera bientot
 
WRInaute passionné
Voila Kloh j'ai fait ce que t'as demandé, tu peux exclure des fichiers seuls ou des dossiers complets (ainsi que leur descendant direct)

si tu as

./image/
./image/ete
./image/hiver

ca te s'arrete à image et ca va pas plus loin (pas dans ete et pas dans hiver donc)

générateur de sitemap en xml
 
WRInaute discret
C'est dingue ce truc, j'y comprends rien ! Ce n'est pas fait pour n'importe qui !
Quelqu'un pourrait m'indiquer en clair ce qu'il faut faire svp ? J'ai téléchargé leur truc, mis l'adresse de mon site dans le fichier config.xml que j'ai envoyé sur le serveur avec le sitemap_gen.py .. Je veux essayer la commande "$ python sitemap_gen.py --config=/path/config.xml --testing" et là, je ne sais même pas comment on fait :cry:

Je dois me mettre où pour lancer cette commande ?

Merci mille fois par avance
 
K
kloh
Guest
Parfait Mumuri! Je vais m'essayer ça!^^

monclar pour le fichier .py ça marche pas sur tous les serveurs.. genre Free ça marche pas^^..
Si tu veux pour comprendre j'ai un site sympa qui explique comment faut faire (manuellement) ton sitemap en .xml à envoyer à google (le fichier .py de google sert à générer ce fichier, ici ils te disent comment le faire toi même,et de façon simple^^) : http://www.seolizer.com/archive-20.html
Sinon le fichier de Mumuri est très pratique si tu comprend un minimum de php^^

EDIT : Mumuri, pour un sous-dossier on indique le chemin complet (/dossier/sous-dossier) ou juste le nom du dossier (/sous-dossier) ?
 
Nouveau WRInaute
Bonjour,

Je viens de soumettre mon site dans mon profil de google est celui ci me marque "pending" alors que le bot est bien passer.
Que veut dire ce "pending" (en attente en français) ?

merci de votre aide
 
WRInaute passionné
kloh a dit:
EDIT : Mumuri, pour un sous-dossier on indique le chemin complet (/dossier/sous-dossier) ou juste le nom du dossier (/sous-dossier) ?

seulement le sous dossier sans / ;) et il ne faut pas mettre les /

version avec les dates grace au script d'orvinfait
http://topflood.free.fr/generateur_de_sitemap.html


une exemple ici
http://topflood.free.fr/test.php

résultat
http://topflood.free.fr/sitemap.xml

Comme vous voyez ca marche, et c'est vite fait ;)
Le script scrute récursivement tous les dossiers (que vous avez autorisés) sur votre site
voila ;)
 
WRInaute discret
Ok, merci Kloh ! En fait, je n'ai pas un gros site, donc il me suffit de mettre les URL dans ce fichier et de l'uploader sur google ??
Merci encore
 
K
kloh
Guest
Mumuri a dit:
seulement le sous dossier sans / et il ne faut pas mettre les /
Ok merci^^. Je venais de faire le test du sous-dossier et ça marchait pas alors je me suis dis que ça devait pas être ça lol

monclar82 a dit:
Ok, merci Kloh ! En fait, je n'ai pas un gros site, donc il me suffit de mettre les URL dans ce fichier et de l'uploader sur google ??
Merci encore
Voilà^^.. tu mes toutes les url que tu veux qui soient prises en compte suivant le modèle et tu envoies ça à google après comme c'est dit^^
 
Nouveau WRInaute
ça veut dire qu'il n'a pas encore été pris en considération

Bah justement il vient de le crawler
Code:
crawl-66-249-65-202.googlebot.com www.vr-architecte.net - [15/Jun/2005:15:53:58 +0200] "GET /sitemap.xml HTTP/1.1" 200 3534 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +https://www.google.com/bot.html)"
 
K
kloh
Guest
Je sais pas.. peut-être qu'il y'a un temps de latence entre le passage du bot et l'affichage OK dans le profil..
 
WRInaute discret
salut,

quel est l'interet des sitemaps pour des petits sites (vitrine), dont le contenu est statique et le contenu jamais mis à jour (ou seulement quelques retouches pour optimiser le référencement) ?

Quel est l'interet de proposer plusieurs sitemaps ?

pour le moment, je trouve ça curieux comme technique, mais pourquoi pas...
 
Nouveau WRInaute
cela ne viendrai pas de mon fichier xml par hazard ?
si tu pouvais checker ça, stp, ça me rassureré.

merci d'avance.
 
WRInaute passionné
gdourel a dit:
salut,

quel est l'interet des sitemaps pour des petits sites (vitrine), dont le contenu est statique et le contenu jamais mis à jour (ou seulement quelques retouches pour optimiser le référencement) ?

tu peux préciser le poids des pages pour un site de vitrine, le poids des pages devra être fort sur les listes de produits par exemple.
https://www.google.com/webmasters/sitem ... tocol.html

autrement le sitemap te permet de faire un référencement plus propre sur les site de vitrine y'a toujours un lien "webmaster" ou "contact" qui sert par forcément. tu le mets pas dans ton sitemap a ce moment la et c'est bon.

gdourel a dit:
Quel est l'interet de proposer plusieurs sitemaps ?
aucun pour les petits sites, pour les gros sites c'est une obligation car ils sont limité à 1000 urls par fichiers (et 50000 en tout). Ca t'apporte plus de problémes qu'autre chose, au passage fo faire un Sitemap index file si vous avez plusieurs fichiers (mon script ne le gére pas)
 
WRInaute passionné
par sécurité il vaudrait mieux l'appeler sitemap.xml( au cas ou d'autres moteurs le prendrez en considération à l'avernir), ceci dit dans la mesure ou tu le soumets a google ca pose pas de problémes
 
WRInaute discret
Ca y est, je l'ai fait pour mes 3 sites hier soir, Google l'avait pris en compte ce matin !
Concrètement, est-ce que cela a changé quelque chose pour ceux qui l'on envoyé depuis quelques jours ???
 
K
kloh
Guest
Hum j'ai essayé le script avec un dossier racine de type http://www.site.com et le fichier .xml ne peut pas ête généré : http://www.cbi-multimedia.com/sitemap-cbi.php
C'est le nom de domaine qui pose problème?

EDIT : en fait il semblerait que je ne puisse pas modifier/créer de fichier sur le serveur :wink: (si quelqu'un peut confirmer au cas où^^) donc ça n'est pas le nom de domaine
 
WRInaute passionné
au pire si t'arrive pas a obtenir les autorisations
tu remplaces les

Code:
fwrite($fp,"<?xml version=\"1.0\" encoding=\"UTF-8\"?>\r\n");

par des

Code:
echo "<?xml version=\"1.0\" encoding=\"UTF-8\"?>\r\n";

et tu fais un copier coller dans un fichier xml.
 
K
kloh
Guest
Perfecto!
J'ai modifier ce morceau :
Code:
<!-- FICHIER XML Start -->
<!-- A copier dans bloc-note et enregistrer sous sitemap.xml -->

<xml version="1.0" encoding="UTF-8"> 
<urlset xmlns="https://www.google.com/schemas/sitemap/0.84">
<?
foreach($myfiles as $file)
{
?>
<url>
<loc><?=$file['lien']?></loc>
<lastmod><?=$file['date']?></lastmod>
<changefreq>monthly</changefreq>
<priority>0.5</priority>
</url>
<?
}
?>
</urlset>

<!-- FICHIER XML End -->

Et ça donne ça : http://www.cbi-multimedia.com/sitemap-cbi.php
Il suffit d'afficher la source et on a le bloc tout prêt à copier/coller^^
J'ai rajouter aussi les <changefreq> et <priority> si on veut affecter une valeur par défaut sur l'ensemble des pages, et y'a qu'à modifier celles qu'on veut après^^
 
WRInaute passionné
mais ca dans un textarea
ca marchez bien avec ces valeurs :)
<textarea rows=100 cols=100>

ca évitera d'avoir a afficher la source
 
K
kloh
Guest
Et voilà c'est fait^^. Tout beau tout propre lol:
http://timesplittersgames.free.fr/sitemap.php
On a la liste des fichiers dans un premier temps, qui permet de vérifier si y'a pas des fichiers ou dossiers non souhaités. Puis dans un second temps on a le code du fichier .xml à copier/coller ;)
J'ai rajouté un petit code pour sélectionner tout le code d'un coup.. Pour ceux qui ont un site un peu imposant c'est plus pratique^^

EDIT = j'ai fait une autre petite modification. dans le textarea pour la première ligne il manquait les '?' dans la balise et ça causait l'affichage d'un message d'erreur lors de l'affichage du fichier .xml. J'ai réglé ce petit souci en créant une variable $bip reprennant le première ligne et l'affichant à la place souhaitée. (parce qu'en plaçant les ? dans le textarea il les prennait pour une balise php alors qu'avec la variable c'est bon^^)
Code:
<?
$bip=("<?xml version=\"1.0\" encoding=\"UTF-8\"?>");
?>

<!-- CODE FICHIER XML Start -->
<a href="javascript:action(0)"><font color="#ff0000"><b>Cliquez ici pour sélectionner le code du fichier .xml</b></font></a>
<form><textarea rows=30 cols=100>
<?=$bip?>
<urlset xmlns="https://www.google.com/schemas/sitemap/0.84">

Mumuri si tu pouvais ré-éditer ton fichier http://topflood.free.fr/generateur_de_sitemap.html où le code est visible (je sais pas comment faire :wink: ) avec les modifications du textarea ce serait cool, je peux t'envoyer mon fichier modifié (j'ai aussi rajouté et/ou modifié quelques commentaires à certains endroits)
 
Nouveau WRInaute
Ma reflexion, va un peu diversifier (hors sujet?) le fil de la discussion. mais j'ai l'habitude me faire engueuler par les babies de l'informatique, que je renvoie à leur pelle et seau (les petites annonces d'emplois. je suis dur, la vie aussi).

N'ai-t-on pas en train d'en faire trop ? Alors que Google, c'est l'interface super simple. Fini la densité pertinente des mots, que le moteur va chercher sans que vous vous doutiez de quoi que ce soit (ca fait danser la gigue, chez Google d'accord) ?

Imaginez que chaque moteur fasse leur fichier technique, selon leur invention (formules de codes) ?

Voilà peut être l'avenir ! Enfin un boulot de profesionnel prouvant la fourniture du travail du "référenceur".

J'attends toiujours le fichier ou le protocole pour la localisation géographique. Etc, etc. par information de classifications. On revient au meta tags, sous forme de fichiers ?

C'est à dire, qu'on informatise, l'enregistrement d'information, que les moteurs n'auront plus besoin de chercher dans le plein texte...ou dans quoique que ce soit d'objet, de supports.

Alors ca sert à quoi un moteur aujourd'hui ? à nous guider, en cluster, etc. Le cluster fait ressembler les résultats "moteur" à un annuaire. Moteur = annuaire ? Pourquoi pas.

L'internaute par son intervention humaine, son clic, transforme le moteur en son annuaire près à consommer, customisé à son skin, et à réinverter, comme un jeu vidéo, à chaque pénétration. Ben voyons.

Pas de mal, pas de bien. Ce que veux le client, c'est avoir envie de consommer. Objectif rempli. Le consommateur apprend. puis continue à utiliser les outils de recherche qui changent afin qu'il ne se lasse pas. Mais où il se reconnaît.

Pas très interactif, d'écrire, bla-bla, comme ça. Sorry.
 
K
kloh
Guest
Ok merci pour le programme^^. Je ferai ça sur mon fichier avec le <textarea> si y'en a qui rencontrent le même problème que moi avec leur serveur.
Sinon c'est une bonne idée pour les extensions :D et en ce qui concerne les images je sais pas, mais en même temps ça ne sert pas non plus à grand chose les images seules..

EDIT : et merci pour le lien :)

EDIT2 : Lool.. autant pour moi j'avais pas vu le else if.. j'aurai pas besoin de faire mon fichier^^ :mrgreen:
 
Nouveau WRInaute
Sitemaps

J'ai mis en place le fichier le 13/06. Vous avez constaté un changement de positionnement de votre site ?
Mon fichier à bien été pris en compte, mais rien de neuf pour l'instant.
 
WRInaute passionné
Re: Sitemaps

cederig a dit:
J'ai mis en place le fichier le 13/06. Vous avez constaté un changement de positionnement de votre site ?
Mon fichier à bien été pris en compte, mais rien de neuf pour l'instant.

le sitemap n'influe pas sur le positionnement de ton site, mais te permet juste de mieux référencer tes liens, c'est à dire que tu pourras jouer plus facilement sur les liens que tu veux faire indexer à google.



Autrement voila la derniére version du script
- scan récursif des répertoires de votre site avec des options de filtrages
- génération multiples de sitemap avec sitemapindexfile si nécéssaire
- compression au format gz
- filtrage par expressions réguliéres, comparaison standard ou mot présent dans le fichier
http://topflood.free.fr/generateur_de_sitemap.html

Utilisation
// générateur de fichiers sitemap.xml pour google
// 1- éditer les fichiers, extensions et dossiers interdits ainsi que leur mode de fonctionnement (0 par défaut) ( sans /)
// 2- éditez la variable $compressionGZ pour avoir ou non une compression sur vos fichiers (valable uniquement si vous avez plus de 1000 liens)
// 3- uploadez le fichier sur votre compte et lancez à partir d'un navigateur
 
K
kloh
Guest
ça se perfectionne Mumuri ton script dis moi^^! (hum je chipote mais à la prochaine édition s'il y a tu pourrais mettre le 'k' de mon pseudo en minuscule? :mrgreen: lol)
Sinon j'allais demandé la même chose que Lentreprenaute lol.. en ce qui concerne les url rewrité? y'aurat pas un moyen de les récupérer aussi?
 
WRInaute accro
bon, tous les sitemappés sont bien inscrits ? comme ça Google va se retrouver avec un bel annuaire de site d' "optimiseurs" à surveiller de près ... :lol:
 
WRInaute discret
Voila, j'ai fini le mien avec 1600 liens et il en manque quelques uns que je rajouterais plus tard, j'espère que cela va porter ces fruits et que ca restera en plus sans remplacer les "vrais" robots de google ;)
 
K
kloh
Guest
moi j' a dit:
Sinon j'allais demandé la même chose que Lentreprenaute lol.. en ce qui concerne les url rewrité? y'aurat pas un moyen de les récupérer aussi?

J'avais trouvé cette page qui est pratique car elle récupère tous les liens se trouvant sur une page, y compris rewrités et de générer le fichier xml après: http://www.sitemapbuilder.net/Default.aspx . Mais son problème c'était que ça ne générait les liens que d'une seule page. Il faudrait un croisement du script de Mumuri et de cette page en fait..

EDIT: Petit souci avec ton nouveau script Mumuri^^. Le textarea se répète autant de fois qu'il y a d'erreurs (par rapport à la génération impossible du fichier xml) : http://www.cbi-technologies.com/sitemap_last.php
 
WRInaute passionné
j'ai un Parsing error dans le status !!!!

j'ai mi QUE les url rien d'autre, pourkoi ca me fait ça ?
 
WRInaute passionné
pour ton probléme kloh c'est arrangé, ;)


URL REWRITING METHODE ??
-------------------------------------


Piste 1
une petite question est ce qu'il est possible d'écrire des regles apaches qui écrivent les fichiers virtuels rewrités dans un fichier ???

ca va etre difficile autrement, faudrait carrément faire un mini aspirateur de site, avec un rechargement de page de temps en temps pour éviter la limite de temps de php. (si ca se trouve on peut faire plus simple, on prend un aspirateur de site, on aspire notre site, on récupére les logs et on génére le fichier)

Une possibilité par exemple serait de modifier l'aspirateur open source http://www.httrack.com/ pour qu'il génere le fichier sitemap.xml , j'ai été leur demander si c'était possible sur leur forum http://forum.httrack.com/readmsg/11592/index.html


Piste 2
Autrement dans la mesure ou vous utilisez l'url rewriting, on doit pouvoir s'arranger de facon plus simple d'un point de vue programmation. Normalement un url est rewrité par rapport à une base de donnée.

A ce moment là, il faut
recréer chaque nom de fichier a partir de l'expression réguliére de votre regle et de la base de donnée et ensuite générer le sitemap
Code:
Si on part de là
https://www.webrankinfo.com/dossiers/techniques/tutoriel-url-rewriting
on a le vrai lien
article.php?id=12&page=2&rubrique=5.
et celui là
article_12_2_5.html
que sera notre pattern, on pourra le coder comme çà
$pattern = "article_%d_%d_%d.html"


Ensuite il faut générer un tableau de 3 cases par n enregistrements dans la base. (case 1 pour l'id , case 2 pour la page et case 3 pour la rubrique).Et aprés cela on génere le site map avec une boucle tant que sur le tableau récupéré

Pour id et rubrique c'est facile, ca va faire une requete du style
SELECT `id`, `rubrique` FROM `articles`

on aura un tableau
id   rubrique
1      1
2      1
3      2
4      2
5      1
6      1
7      2
8      2
 
MAIS pour les pages là je me pose des questions :
on peut a priori pas le faire en sql

il faudrait le tableau suivant pour 4 articles par pages
id   rubrique page
1      1            1
2      1            1
3      2            1
4      2            1
5      1            2
6      1            2
7      2            2
8      2            2

donc un compteur qui s'incrémente de 1 chaque fois que on arrive à une limite de page $limitPage serai possible

au final on aurai donc les paramétres suivants
$pattern = "article_%d_%d_%d.html"
$requeteSQL="SELECT `id`, `rubrique` FROM `articles`"
$LimitPage = 4 voir $LimitPage =  {4,8,12} si on veut faire plusieurs options d'articles par pages


Ensuite pour plusieurs tables et plusieurs patterns, on peut faire une systeme de profil $profil= array($pattern, $requeteSQL, $LimitPage); 

Systéme de profils ensuite stocké dans un tableau $profils[]

le probléme est de savoir si ce modéle est assez générique (faudrai peut etre rajouter dse variables pour les WHERE par exemple)

Au final on aurait un formulaire a remplir au début pour stocker nos profils (dans des fichiers texts par exemple), ensuite un générateur de sitemap charge le fichier texte et créer le sitemap.xml
 
WRInaute passionné
merci la j'ai resoumis le sitemap sans le "è" qui bloqué tous, il me met ke ca a était osumis il y a 1 heure, ce ki est vrais mais tjs aprsing error, il y a un laps de temps a attendre pour voir le status changer ?
 
Nouveau WRInaute
bon, tous les sitemappés sont bien inscrits ? comme ça Google va se retrouver avec un bel annuaire de site d' "optimiseurs" à surveiller de près ...
+1
Tout ce developpement pour finalement aider google et faire une partie de son job sans contrepartie 8O
 
Nouveau WRInaute
Pb google Maps

Bonjour,

Je viens des créer mes premiers pages sitesmaps et l'affichage me donne une erreur


Code:
La page XML ne peut pas être affichée 
Impossible d'afficher l'entrée XML en utilisant la feuille de style XSL. Corrigez l'erreur, puis cliquez sur le bouton Actualiser ou réessayez ultérieurement. 


--------------------------------------------------------------------------------

Le symbole point-virgule était attendu. Erreur de traitement de la ressource http://www.mistersport.com/site/sitemaps/psg.x...

<loc>http://www.mistersport.com/boutique/liste_produits.cfm?type=30&code_lg=lg_fr&pag=1&num=2</loc>
...


http://www.mistersport.com/site/sitemaps/psg.xml

Avez vous une idée du problème

Merci

Niky
 
WRInaute discret
Oui ca viens de ca ;) ou alors du nom du fichier :x ... désolé mdr.

Le mien était OK hier soir, Parsing error ce matin alors qu'il ne me met pas d'erreur avec firefox. J'espère que ca va pas le refaire
 
Nouveau WRInaute
Bonjour.

J'ai créé un SiteMapIndex, je l'ai ajouté sur le site de Google, et il est passé en OK au bout de 6 heures. Dois-je ajouter chaque sitemap inclus dans l'index ? Google viendra-t-il les relire lorsque je les aurais remis à jour ?

Merci d'avance.

@+
Rémi
 
WRInaute impliqué
L'index a bien le rôle d'un index, sinon ça ne servirait à rien d'en faire ;)
Pas la peine de soumettre chaque url contenues dans l'index.
 
Nouveau WRInaute
Est-ce que quelqu'un qui a implémenté le sitemap a vu du changement de referencement de son site par google depuis ?
 
WRInaute discret
Sur un de mes mots clefs j’ai deux sites. Pour l’instant c’est toujours celui sans le sitemap qui sorte en 1 et celui avec le sitemap en 2 chez GG
Le sitemap a été mis en place le 5 juin.
 
WRInaute discret
Bonjour
j'utilise le script de "orvinfait"
http://www.orvinfait.fr/script_sitemap_cree.txt

sans pb pour version 0.0.1, mais avec la nouvelle 0.0.2 il n'y a que 3 fichiers de crées: ***index.xml, ***1.xml et 1 repertoire seulement.
Alors que la précedente il y avait 1 fichier par répertoire
quelqu'un a t'il le meme pb avec ce script ?
merci
casa
 
K
kloh
Guest
okaz77 a dit:
Est-ce que quelqu'un qui a implémenté le sitemap a vu du changement de referencement de son site par google depuis ?
J'ai proposé mon sitemap le 20 juin et je n'ai pas remarqué de changement particulier de place de mon site dans Google, mais en revanche les pages sont effectivement plus efficacement référencées.
Avec cette commande https://www.google.fr/search?biw=995&hl= ... e.fr&meta= Google liste désormais 10 pages de liens contre 3 avant que je leur propose mon sitemap.
 
WRInaute accro
kloh a dit:
okaz77 a dit:
Est-ce que quelqu'un qui a implémenté le sitemap a vu du changement de referencement de son site par google depuis ?
J'ai proposé mon sitemap le 20 juin et je n'ai pas remarqué de changement particulier de place de mon site dans Google, mais en revanche les pages sont effectivement plus efficacement référencées.
Avec cette commande https://www.google.fr/search?biw=995&hl= ... e.fr&meta= Google liste désormais 10 pages de liens contre 3 avant que je leur propose mon sitemap.

T as du pain sur la planche pour référencer plus efficacement tes pages par ce que pour línstant, tu as une grande partie sans titre ni description. Si tes pages sont en ligne depuis peu, c est normal et ca va bientot rentrer dans l´ordre mais si elle sont en ligne depuis un moment, tu dois avoir un probleme de similitude (contenu trop proche, ou/et titre et/ou description identique sur ces pages....
 
WRInaute accro
ok, j ai vérifié : tu as les meme titre et description sur toutes tes pasge. il faut absolument changer tout ca. tu vas y voir une nette différence dans ton positionnement et ton nombre de visiteurs. a toi de jouer !
 
K
kloh
Guest
Effectivement jusque là je m'étais pas trop préoccupé par le référencement de mon site donc voilà.. mais je commence à m'y mettre et j'ai déjà plein de travail de prévu pour optimiser au mieux mon site.. d'ici fin juillet ça devrait être grandement mieux^^
 
Nouveau WRInaute
script non utilisable

Boujours à tous,

Mon site est hebergé sur une page perso tisc*** et je ne peux pas generer de site map avec du php :cry:
Je voulai savoir si il étai possible de faire ses sitemap manuellement :?:
Mon site ne contient qu'une vingtaine de pages :!:

Si quelqu'un veut bien m'aider à la faire ça serai encore mieu :lol:

Je vous passe mon url
 
WRInaute discret
Nouveau WRInaute
creer un fichier xml

j'ai essayé en laissant txt (ça n'a rien donné) puis avec php, placé à la racine de mon site et je l'ai lancé ça m'a donné un xml en indiquant l'erreur suivante :
Warning: readdir(): supplied argument is not a valid Directory resource in /var/www/free.fr/9/d/montblancsciences/script_sitemap_cree.php on line 697

termine

le fichier xml obtenu est le suivant :
<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="https://www.google.com/schemas/sitemap/0.84">
</sitemapindex>
ça n'a aucun intéret !
merci à casa de son aide
 
Nouveau WRInaute
créer un fichier sitemap xml

j'ai essayé une seconde fois pour voir. ça change ...
Les erreurs sont :
Warning: readdir(): supplied argument is not a valid Directory resource in /var/www/free.fr/9/d/montblancsciences/script_sitemap_cree.php on line 253

Warning: array_search(): Wrong datatype for second argument in /var/www/free.fr/9/d/montblancsciences/script_sitemap_cree.php on line 665

et le fichier sitemap_index.xml devient :
<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="https://www.google.com/schemas/sitemap/0.84">
<sitemap>
<loc>http://montblancsciences.free.fr/sitemap_a_orvinfait.xml</loc>
<lastmod>2005-07-02T23:00:59+02:00</lastmod>
</sitemap>
</sitemapindex>
mais aucun fichier sitemap_a_orvinfait.xml n'a été créé à la racine ???
help me please
 
WRInaute discret
La variable $rep_deb doit être $rep_deb=""; et non $rep_deb="../www/"; Je pense que le problème vient de là.

Je vais mettre en ligne aujourd'hui ou demain une nouvelle version créant des fichiers compressés (gz). Dans ton cas il vaut donc mieux attendre la mise en ligne de la nouvelle version.

ATTENTION : Pour le fichier que je fournis, je ne donne pas de nom mais il faut le mettre à la fin .php. Si je ne donne pas de nom c'est pour éviter que tout le monde prenne le même. Reprendre script_sitemap_cree.php n'est donc pas une bonne idée. S'il y avait un problème de protection dans mon script des personnes mal intentionnées pourraient le rechercher pour détériorer les sites qui l'utilisent comme cela est arrivé pour certains forums utilisant PHPBB. Je vais préciser cela sur mon site.
 
WRInaute discret
Pour Kerrigan
(et ceux qui souhaitent faire un sitemap manuellement)

Ce sujet a déjà été abordé dans ce forum de plus en bas de page dans autre sujet de discussion tu as [Google SiteMaps] SitemapsPal crée un sitemap pour vous. Cela mène au lien https://www.webrankinfo.com/forum/t/google-sitemaps-sitemapspal-cree-un-sitemap-pour-vous.30635/ où il y a un lien vers
http://code.google.com/sm_thirdparty.html qui donne une liste de programmes et d'utilitaires pour faire des sitemaps.

L'exemple de fichier sitemap est à https://www.google.com/webmasters/sitem ... tocol.html
Vu le nombre de pages que tu as tu peux faire un fichier texte de la forme suivante :
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="https://www.google.com/schemas/sitemap/0.84">
<url>
<loc>http://www.monsite/page1</loc>
<lastmod>2004-12-23</lastmod>
</url>
<url>
<loc>http://www.monsite/page2</loc>
<lastmod>2004-12-23</lastmod>
</url>
</urlset>

Entre <lastmod> et </lastmod> tu mets la date de dernière modification de tes pages si tu ne la connais pas tu mets la date d'aujourd'hui. Lorsque tu changes une page tu changes la date de la page concernée dans ton sitemap. Si tu crée une nouvelle page tu l'enregistre dans ton sitemap.
Tu nommes le fichier ainsi créé sitmap.xml et tu le mets sur ton site.
Ensuite tu crées un compte à https://www.google.com/webmasters/sitemaps/login et tu soumets http://www.monsite/ sitmap.xml. Ensuite tu pourras voir sur ce compte la dernière date de lecture de ton sitemap et s'il a détecté des erreurs dans ton sitemap. En faisant comme indiqué tu n'auras pas d'erreur.
 
WRInaute occasionnel
ben dans le doute, je metterais les %20.

sinon, j'ai une question. hier soir la commande site:www.monsite.com retournait 18 pages de résultats.
hier soir j'ai généré un fichier sitemap (non complet puisque je voulais tester l'outil) et je l'ai soumi à GG qui l'a prit en compte tt de suite.
aujourd'hui la commande site:www.monsite.com me retourne plus que 9 pages de résultats !

J'ai fais une connerie ou c'est juste "pas de bol" ?!
bref, je voudrais savoir si le sitemap vient en plus du référencment naturel ou s'il le remplace (ce dont je doute mais bon !)
merci de votre aide.
 
WRInaute discret
Bonjour,
J'ai lu toutes les pages mais j'ai rien vu d'interessant sur les pages soumis à URL rewriting. J'ai lu un moment que Xml etait très complexe. Est ce que quelqu'un peut me dire comment faire pour mettre mes pages (URL rewrité) dans le fichier sitemap.xml:
voici mes pages :
- album.php?artiste=daniel_powter&lang=fr (mes page en php)
- paroles_daniel_powter_fr.html (après URL rewriting)

voici le code que j'utilise pour l'URL rewriting
Code:
RewriteRule ^paroles_(.*)_(.*).html$ album.php?artiste=$1&lang=$2 [L]

Qu'est ce que je dois mettre entre les balises loc. Car pour le moment je ne met que ceci <loc>http://nom_site/album.php</loc>. Et je ne crois pas que c'est suffisant pour qu'il indexent toutes les pages album.php

Merci d'avance :wink:
Web
 
WRInaute discret
Merci gainsdejeux :D
ça m'a aidé quand même. Car il scanne tous les liens presents sur le site et c'est plus facile a faire un sitemap a partir du site que de taper toutes les adresse Url rewrité.
En attendant je vais faire une page avec tous les liens a scanner et faire un sitemap a partir du site que tu m'a passé.

Sinon si quelqu'un a une solution pour mettre toutes les adresses des pages URL rewrité dans le sitemap.
Merci de me le communiquer.

Merci
Web
 
Nouveau WRInaute
Bonjour,

Je découvre ce nouvel outils et j'ai juste une réflexion à faire : Ne pensez-vous pas que vous (nous) faites le travail de Google ?

Si Google souhaite s'allèger le travail ou du moins se le simplifier, pourquoi ne nous dennerait-il pas un utilitaire pour le faire ?

Bon enfin c'est juste une réflexion... :roll:

je trouve que vous avez du courage et aussi beaucoup de talent pour faire tout ce que vous faites :)
 
WRInaute occasionnel
Voila g fait la mienne: un petit outil qui scanne ma db et qui me crée une sitemap sur mesure pour l'url rewriting.

A ta question est ce qu'on fait le boulot de google? oui
Qu'est ce que cela va changer? Dans un premier temps ils vont verifier la pertinence de leurs crawls et dans un second temps imposer ce nouveau standard pour peu qu'il ait du succes...
 
WRInaute accro
sitemap c'est bien mais lorsque l'on à un site dynamique tel que webrankinfo, comment peut-on faire pour automatiser la mise à jour de ce fichier ?
 
WRInaute accro
+1 thierry8 (les thierry sont contestataires ?)
Je suis dedans, y a pleins de fautes à corriger et je ne vais pas m'amuser à ça tous les 4 matins alors que j'ai un plan-du-site à jour et déjà vérifié... Y a intéret à ce que je vois un résultat.
 
Nouveau WRInaute
Bonjour,

J'essai de collaborer au service Sitemap de Google et de comprendre le principe de fonctionnement pour optimiser le crawling

Sur Google Sitemap on dit que le code ci-dessous est requis dans le fichier xml
Code:
   <sitemapindex xmlns="http://www.monsite.com/sitemap.xml">
   <sitemap>
      <loc>http://www.monsite.com/sitemap/sitemap.xml.gz</loc>
      <lastmod>2005-08-07T18:23:17-04:00</lastmod>
   </sitemap>
   </sitemapindex>

Mais après je dois lister mes URLS et le code ci-dessous cause problème (il suite le code ci-dessus)

Code:
<site
  base_url="http://www.monsite.com/"
  store_into="/web/http/m/o/monsite.com/public/sitemap/sitemap.xml.gz"
  verbose="1"
  suppress_search_engine_notify="1"
  default_encoding="ISO-8859-1"
  >
  <url  href="http://www.monsite.com/catalog/"  />
  <url
     href="http://www.monsite.com/catalog/"
     lastmod="2005-08-07T01:00:00-04:00"
     changefreq="weekly"
     priority="1.0"
  />

Que me conseillez-vous ?


  • enlevez la balise <sitemapindex
    ou supprimer la balise <site pour la remplacer par la balise <sitemapindex ???

Car il semble que les 2 balises mentionnée NE PEUVENT PAS co-habiter ensemble sans "crasher" tout le fichier et le rendre complètement inutile...

Merci !
 
WRInaute accro
Je pense qu'un index de sitemaps (fichier contenant <sitemapindex>) doit être différent d'un sitemap.

Si je ne me trompe pas, tu dois avoir:

- un sitemapindex.xml > Listant tes différents sitemaps
- plusieurs sitemap1.xml, sitemap2.xml > listant tes pages.

Tout ceci bien entendu si tu ne veux pas travailler simplement avec UN sitemap.xml.

@+
 
Nouveau WRInaute
Donc si je n'ai qu'un sitemap.xml, je n'ai pas à inscrire de sitemapIndex...

Je n'ai que quelques pages (url) à mentionné...

J'ai donc mis un seule fichier sitemap.xml avec la balise <site et mes urls à indexés

Cependant, je n'ai aucun moyen de savoir si google en sera satisfait et aucune indexation dans google après 2 jours de mise en place de sitemap.xml

en espérant que ce fichier aie le vent dans les voiles...

merci !
 
WRInaute occasionnel
Une question très importante je pense, à laquelle je n'ai pas trouvé de réponse :

Suivant divers sitemap rencontrés sur des sites (et non des forums), certains recensent un maximum de leurs pages, et d'autres seulement les rubriques principales... Donc : quelle est, selon vous, la meilleure solution à adopter ?

Un sitemap de toutes les pages du site ou un sitemap avec seulement les rubriques principales ?
 
WRInaute discret
Une deux simples questions:
- c'est utile d'utiliser le sitemap pour un BLOG ?
- un générateur suffit il ? (en chipotant au priorité des pages, mise a jour des pages...).

De même que, une fois qu'on a envoyer a google son fichier XML, imaginons qu'on crée une nouvelle page a son site, google va quand même visiter cette derniere ou il faudra refaire son sitemap xml et le renvoyer a google ?


Merci pour vos précieuses informations
 
Nouveau WRInaute
N'etant pas un pro du code, j'ai choisi la simplicité en utilisant les generateurs de sitemap comme Yoodamap et tm sitemap generator. Les sitemap sont générés mais je recupere une liste de 140 pages , alors que mon site posséde plus d'un millier de pages... Qq'un a t'il eu le meme probleme ? Comment le resoudre ?
 
Nouveau WRInaute
La question de Dolbysound est intéressante :
- un sitemap peut il être pénalisant si l'on ne le met pas à jours après chaque post ou nouvelle page créée.
- faut il faire un sitemap regroupant seulement les liens principaux ou mettre un maximum de liens ?
 
Nouveau WRInaute
Bonjour à tous,
Alors j'ais quelques questions très simples :

1. Est il pénalisant de noter une meme adresse dans deux sites map appartenant à un meme site????
ex : sitemap index
l____sitemap1 : mondressetordue.htm
l____sitemap2 : mondressetordue.htm


2. N'est-il pas plus simple de créer un site map avec quelques adresse importantes mis à jour régulièrement et optimisé (les pages de themes ou autres...), et mettre à coté un site map autogénéré contenant toutes les url du site?

3. Mais le seul interret c'est quand les pages ne sont pas accessibles???? (genre menu flash , js ect...) Parceke perso niveau ref je n'ais rien a dir sur l'indexation de gogole

:lol:

J'aurais surement d'autres questions plus tard mais pour l'instant ces points me tracassent...

Merci
 
WRInaute accro
Tu remplis le champ 3. avec l'URI de ton fichier sitemap, puis tu valides avec le bouton "Ajouter un plan sitemap web" (qui sera dégrisé).
 
WRInaute passionné
Alors moi j'ai quelques questions aussi :
J'utilise le script perl de Google.
Il marche très bien, mais étant donné qu'il se base sur les logs, j'ai 300 fichiers de logs (logrotate daily). J'ai donc défini mon script de config pour qu'il ne prenne que les 3 derniers fichiers de logs :
access.log
access.log.1
access.log.2.gz

Mais dans ces 3 fichiers, il n'y a donc que 3 jours de logs... Et certainnes de mes pages sont consultés une fois par semaine, et donc ne sont pas dans ce plan sitemap généré par ces logs...
Le problème est que si je mets un /home/web/logs/access.*
Le sitemap sera composé d'un bon nombre de 404 :/

Donc quelle est la meilleure solution ? Et à quelle fréquence faut-il le regénérer? Je le fais pour l'instant tous les jours...
 
WRInaute accro
Pourquoi ne pas coder tout simplement un bout de php qui, lorsqu'une page est appelée, vérifie la présence de l'URL dans une table toute simple, et si l'URL n'est pas présent, l'y ajoute?

--> la génération de ton sitemap, ensuite, n'est qu'une boucle en php sur l'ensemble de la table...
 
Discussions similaires
Haut