Format d'envoi de message sur  fr.lettres.langue.japonaise.


Je vais me permettre de donner quelque conseils sur la manière d'envoyer des message utilisant les caractères japonais sur le groupe fr.lettres.langue.japonaise.

La question de quel encodage on allait utiliser s'est posé lors des discussion sur la création de ce groupe ainsi que de celui de grec et de chinois sur fr.usenet.forums.evolutions. J'ai pu rencontrer d'autre personnes à cet occasion qui s'interessaient à ce problème et nous avons déjà passer pas mal de temps à expérimenter.

En conclusion de ces essais, je crois qu'il faut recommender à tous de s'efforcer d'utiliser l'encodage unicode UTF-8 pour envoyer des messages qui comprennent des caractères japonais sur fr.lettres.langue.japonaise.

Je sais que cet encodage n'est pas d'un usage trés courant au japon, mais nous avons pû constater que l'évolution des logiciels semblent suffisante pour pouvoir l'utiliser et cela apporte de nombreux avantages.

Allez, un petit coup de question/réponse sur ce problème :
 

Dans ce cas là, le plus simple est d'écrire en transcription en caractères latin (romaji)  et de ne pas se soucier des histoires d'encodage. C'est le seul encodage qui supporte à la fois les caractères accentués du français et le japonais. C'est l'encodage qui est déjà utilisé sur un autre groupe de la hiérarchie fr, le groupe de grec ancien. L'encodage normal sur fr.* est ISO-8859-1. Lors d'une discussion sur fr.usenet.8bits juste avant la création des groupes de grec et de japonais, un accord de principe a été obtenu pour utiliser UTF-8 sur les groupes où c'était vraiment nécessaire. Utiliser un autre encodage signifierait faire une dérogation suplémentaire à la régle générale d'utilisation de ISO-8859-1.

Multiplier les encodages différents utilisés dans les divers groupes de langue n'est pas une bonne chose.

L'utilisation d'UTF-8 ici est une dérogation à la régle générale de la hiérarchie fr.* qui est d'utiliser l'encodage normal du français (ISO-8859-1).

Or certaines personnes lisent fr.lettres.langue.japonaise sans utiliser un logiciel qui supporte UTF-8 et si elles envoient des message avec des termes japonaise, elles les transcrivent en romaji. Par égard envers ces personne, il faut poster tous les messages uniquement en français dans l'encodage normal et réserver exclusivement UTF-8 aux cas où il est réellement nécessaire.

Il faut aussi éviter sous prétexte qu'on peut s'autoriser à poster dans ce groupe ici, de commencer à l'utiliser de manière plus générale.

Donc tous les messages crossposté sur plusieurs groupes doivent être en ISO-8859-1.
Si on avait choisi de recommander un encodage japonais plus courant, ce problème là ce serait posé de la même façon.

  • Mais les japonais utilisent tous d'autres encodages (par exemple ISO-2022-JP) ?
  • Les japonais eux n'ont pas de problème de caractères accentués. Ca fait une grosse différence. L'unicode ne leur apporte rien dans la vie
    quotidienne, donc si il y a des inconvénients à l'utiliser (les messages sont un petit peu plus gros, les anciens logiciels ne le lisent pas), cela suffit pour y renoncer. De plus, il y a le poids de l'acquis et de l'habitude. Pourquoi changer quand ca marche bien ?

    En français si on se contraignait à ne pas utiliser un seul accent dans les message pour pouvoir utiliser l'encodage habituel du japonais, cela serait trés rapidement difficile. L'habitude d'utiliser les touches de caractères accentués est fortement ancrée, et il y aurait systématiquement quelques accents qui traîneraient dans les messages, le résultat final serait donc une quantitée de problème avec chaque contribution où malheureusement un contributeur aurait tapé un accent.

    Voir la page configuration Outlook Express Voir la page configuration Netscape Voir la page de Thierry Bezecourt sur le japonais sous linux et avec emacs Voir la page configuration Agent Dans ce cas là, on peut effectivement utiliser pour dépanner l'encodage japonais ISO-2022-JP et éliminer tous les accents. Cependant pour arriver à lire les autres messages sur le groupe, qui comportent de l'UTF-8, ce sera frustrant. Sur la plupart des plate-forme, il existe au moins un logiciel qui supporte UTF-8. Vous pouvez essayer de l'utiliser, ne serait-ce que pour lire uniquement ce groupe.

    C'est vrai les programmes commerciaux de Microsoft et Netscape sont loins d'être les meilleurs logiciels pour lire les groupes de discussion.
    L'utilisation d'Emacs en mode news n'est pas donnée à tout le monde

    Un certain nombre des autres programmes de lecture des groupes de discussions sont des logiciels de type GNU, c'est à dire que les sources sont accessibles. Il est donc possible d'aller les améliorer pour qu'ils supportent les fonctions qui leur manquent aujourd'hui. A défaut, on peut aussi contacter l'auteur et lui dire que c'est quelquechose que l'on souhaite.

    Je vais essayer de créer une page consacrée à ce problème et de trouver des bonnes volonté pour essayer de déveloper les patch nécessaires pour ces logiciels. J'ai déjà regardé ce qui serait nécessaire pour le cas de SLRN, cela semble tout à fait envisageable sous linux avec les dernières version de xterm qui intégrent un support UTF-8 (mais pas pour la version de SLRN sous windows).

    Que dire ? Mon expérience à moi est que ca marchait pas si bien que cela. J'ai vu des tas et des tas de message avec un contenu bizarroide, parcque des caractères français ont été rajouté dedans et que ensuite ils ont été manipulés par un logiciel qui ne gérait pas le français et qui a transformé tout le français accentués en mojibake.

    Lorsqu'on travaille exclusivement en français avec certaines personnes, et exclusivement en japonais dans les autres cas, ca marche.
    Mais dés qu'on commence à discuter avec des personnes qui utilisent les deux langues, il y a des problèmes.

    A ce niveau-là, UTF-8 est un gros progrés.
    Si on peut résoudre les problème techniques stupides qui freinent son arrivée, il ne faut pas hésiter. D'après ce que j'ai vu dans le forum de grec, il y a suffisament de logiciels aujourd'hui qui supportent cela pour que la majorités des gens puissent s'en servir.