Rencontrer les symboles é ou é dans une page web relève d’un souci d’encodage des caractères français et dû a un programme ne les supportant pas.
Un correctif du code sera à réaliser pour lui permettre de supporter les spécificités du français (accents, cédilles et autres trémas).
Cette problématique d’introduction n’est pas bloquante, certain contourneront le problème en n’utilisant pas de caractères accentués (au prix de quelques fautes d’orthographes), le contenu restera compréhensible et chacun est habitué à nomer les noms de fichier de cette façon.
La problématique
Lorsque le site internet s’ouvrent aux commentaires de tous les internautes (du monde) ou que les gestionnaires de contenus veulent citer des noms d’auteurs, non latin par exemple, il faut rendre le code du site compatible avec le maximum d’alphabets ou accepter de voir des symboles comme %D0 s’afficher.
Il est alors recommandé de supporter l’UTF-8 compatible avec la majeur partie des jeux de caractères (Cyrillique, Coréen, Hindi, etc.)
Les éléments suivants seront concernés :
- la base de données
- le format des fichiers utilisés pour le rendu du site (html, css, php, xml, etc.)
- les entêtes renvoyées au navigateur (headres et meta html charset entre autre)
- la convertion les données existantes (en base ou en fichiers) ayant pu souffrir des changements précédents
La question des performances se posera alors :
- les contenus soient correctement indexés par les moteurs de recherche
- l’apparence de vos contnus soient bien rendus
- que les moteurs de recherche puissent proposer une traduction automatique
- et finalement qu’elle performance SEO
Quelques conseils mis en oeuvre sur musiquedepub.tv et sur 68000
- une seule langue par URL afin de l’indiquer dans les META aux moteurs de recherche
- choisir une police de caractères supportant l’affiche du plus grand nombre d’alphabets
- le moteur de recherche interne ?
Pour préparer la réponse à la grande question des performances pour les moteurs de recherches, cet article est disponible en bulgare (caractères cyrilliques) sur cette page pour en comparer son indexation avec l’original.
La seconde partie de ce sujet sur l’encodage des caractères porte sur l’écriture des URL et le nommage des fichiers.