Les caractères non latin : dans les URL

Seconde partie du billet relatif a la gestion des contenus en caractères non latin pour le réf nat : la question du support dans les URL se pose logiquement.

Ce sujet se rapporte au nomage des fichiers, quant au traitement du nom de domaine et devra faire l’objet d’une troisième partie.

Beaucoup d’applications web génèrent automatiquement les url de pages depuis le titre de la page, alors comme s’y prendre ?

  • créer une table de conversion depuis tous les alphabets vers le latin ?
  • laisser les rédacteurs saisir l’url en latin ?
  • générer l’url non latine ?
  • utiliser un simple timestamp pour ces pages ?

La question du débugage est à prendre sérieusement en compte, qui dit génération des url en Cyrillique par exemple, dit que l’ensemble des logs devra les supporter, le système de backup / restauration également.

Et pour revenir à la question des performances pour les moteurs de recherches et d’indexation en tous genres, cet article est disponible en latin avec URL cyrillique sur cette page