Googlebot sais mieux parler arabe ou utf-8 ?

Discussion dans 'Référencement Google' créé par aladdin, 10 Décembre 2005.

  1. aladdin
    aladdin WRInaute passionné
    Inscrit:
    29 Avril 2005
    Messages:
    1 235
    J'aime reçus:
    0
    Bonjour
    j'ai voulu optimiser mon site (arabe) en mettant les titre des articles du site dans la balise <title> resultat : pleins de pages derefferencés car apparement google ne sais pas lire ces titles

    exemple :
    regardez cette page : http://66.249.93.104/search?q=cache:UCy ... .net&hl=fr

    et ce qu'elle devrait etre
    -http://www.oujdacity.net/oujda-article-650-fr.html



    du coup je suis entrain de retenter une optimisation: je transforme les titre en utf-8 et je les affiche en tan qu'html entities (du style & #1578; )

    pensez vous que ça ira mieux ?
    et est ceque google vas faire la correspendance entre les htmlentities et les caractères normaux des requetes de recherche ?
     
  2. Bollore
    Bollore WRInaute discret
    Inscrit:
    30 Août 2005
    Messages:
    51
    J'aime reçus:
    0
    Moi j'ai jamais eu de probleme car mon contenu sortais d'une base de donée et donc reconverti en unicode directement, mais oui, il faut que tu le mette en format uncode #323& etc.. et ça marche impect :)
     
  3. aladdin
    aladdin WRInaute passionné
    Inscrit:
    29 Avril 2005
    Messages:
    1 235
    J'aime reçus:
    0
  4. jeanluc
    jeanluc WRInaute accro
    Inscrit:
    3 Mai 2004
    Messages:
    2 875
    J'aime reçus:
    0
    Bonjour aladdin,

    J'ai testé ta page avec mon simulateur Google. Regarde au bas de la page : on voit que les indications de l'en-tête HTTP (décidée par le serveur) et celle de la balise META "content-type" sont contradictoires, ce qui ne peut que poser des problèmes avec Google.

    Quand le type de codage est défini explicitement par l'en-tête HTTP et par une balise META, il est indispensable que ce soit le même codage des deux côtés.

    Jean-Luc
     
  5. aladdin
    aladdin WRInaute passionné
    Inscrit:
    29 Avril 2005
    Messages:
    1 235
    J'aime reçus:
    0
    merci j'ai enlever l'encodage spécifié par header()
    et maintenant j'obtient ça dans le simulateur
    c'est bon comme ça ?
     
  6. jeanluc
    jeanluc WRInaute accro
    Inscrit:
    3 Mai 2004
    Messages:
    2 875
    J'aime reçus:
    0
    Maintenant c'est bon pour les indications de l'encodage.

    Je suis étonné que le simulateur n'affiche pas correctement les caractères français accentués de la description. Je n'ai jamais constaté ce problème pour d'autres pages en UTF-8. Je ne sais pas si le problème est de mon côté ou du tien...

    Pour la représentation des caractères arabes par le simulateur, je suis heureusement surpris. On dirait que ça marche, même si je n'ai jamais testé d'autres langues que le français et l'anglais. :wink:

    Jean-Luc
     
  7. aladdin
    aladdin WRInaute passionné
    Inscrit:
    29 Avril 2005
    Messages:
    1 235
    J'aime reçus:
    0
    bein pour les caractères arabes maintenant ya pas de raison pour que ça marche pas, en fait je les transforme en htmlentities maintenant, pour etre sur qu'ils passent partout

    avant ça passait pas, regarde dans le cache que j'ai posté au debut de ce sujet
     
  8. jeanluc
    jeanluc WRInaute accro
    Inscrit:
    3 Mai 2004
    Messages:
    2 875
    J'aime reçus:
    0
    Tu as raison. Et en plus, comme ma page est aussi en UTF-8, c'est pas compliqué.

    Par contre, pour les caractères accentués français, ça ne marche pas. Or, comme ma page est aussi en UTF-8, ça devrait donner le même résultat que sur ta page. Tu es sûr de tes codes pour les "é" et les "à" ?

    Jean-Luc
     
  9. aladdin
    aladdin WRInaute passionné
    Inscrit:
    29 Avril 2005
    Messages:
    1 235
    J'aime reçus:
    0
    bein je suis pas totalement sure pour les caractères accetués, mais en tout cas sur mon site et sur google ça passe bien : -https://www.google.fr/search?q=site%3Aoujdacity.net


    en fait, vue que mon site contient de l'arabe et du français, j'ecrit le français en utf-8 et l'arabe en windows-1256 (car des utilisateurs qui postend des articles arabes le font sous cette encodage)

    ensuite j'utilise les fonctions ob_* de php pour bufferiser la sortie et avant de l'afficher j'utilise une librairie opour réencoder les windows-1256 en entity utf-8

    c'est un peut compliqu, mais c'est la seule methode qui m'a permis d'avoir du contenu mixte (arabe français) supportant les deux jeu de caractères sur la meme page
     
  10. jeanluc
    jeanluc WRInaute accro
    Inscrit:
    3 Mai 2004
    Messages:
    2 875
    J'aime reçus:
    0
    Dans la page http://oujdacity.net/, tu as ceci :
    Code:
    <META NAME="DESCRIPTION" CONTENT="Un portail sur Oujda et, la r& #1571;& #169;gion du maroc ...
    ...
    Ce site & #224; & #233;t& #233; cr& #233;e ...
    Dans la description, tu emploies & #1571; et & #169; pour faire un "é" et dans la page même, tu emploies & #233; pour un "é". Je pense que ce que tu emploies dans la page est correct, mais pas ce qui est dans la description.

    J'ai ajouté des espaces pour que les codes soient visibles.

    Jean-Luc

    P.S. Il faudrait plutôt écrire Ce site a été créé.
     
Chargement...
Similar Threads - Googlebot sais parler Forum Date
Les liens nofollow sont quand même suivis par Googlebot Débuter en référencement 27 Mai 2021
Voir une page (entière) comme Googlebot Développement d'un site Web ou d'une appli mobile 27 Mars 2021
Fréquence passage googlebot Crawl et indexation Google, sitemaps 30 Janvier 2021
Stimuler GoogleBot pour crawler de nouvelles pages Crawl et indexation Google, sitemaps 24 Janvier 2021
Comment augmenter la fréquence de passage de GoogleBot Crawl et indexation Google, sitemaps 10 Décembre 2019
Site inaccessible pour GoogleBot Crawl et indexation Google, sitemaps 21 Octobre 2019
En décembre 2019 changement de l'user agent de Googlebot Crawl et indexation Google, sitemaps 5 Octobre 2019
googlebot crawle des pages inexistantes Crawl et indexation Google, sitemaps 16 Août 2019
Les pages 404 avec googlebot Crawl et indexation Google, sitemaps 14 Juin 2019
Evergreen Googlebot, basé sur Chromium (Chrome open source) Référencement Google 9 Mai 2019
Empêcher Googlebot de crawler/indexer tout un dossier Débuter en référencement 19 Avril 2019
GoogleBot scan url inexistante Crawl et indexation Google, sitemaps 17 Avril 2019
feuilles de styles non obtenues par Googlebot Crawl et indexation Google, sitemaps 28 Septembre 2018
Temps de réponse serveur googlebot Développement d'un site Web ou d'une appli mobile 23 Mai 2018
Strikingly et Googlebot : Contenu invisible dans la Search Demandes d'avis et de conseils sur vos sites 3 Avril 2018
Robots.txt ligne génante selon Googlebot votre avis ? Crawl et indexation Google, sitemaps 23 Mai 2017
Impact gestion paramètre url sur Googlebot Crawl et indexation Google, sitemaps 12 Mai 2017
Googlebot et fichier css/ java Débuter en référencement 24 Juin 2016
Googlebot, Cookie et SEO Crawl et indexation Google, sitemaps 20 Mars 2016
GWT m'invente des pages (Googlebot for smartphones) Crawl et indexation Google, sitemaps 19 Août 2015