Discussion Wikipédia:Romanisation du cyrillique
Bonjour à tous,
Etant donné que la page fait écho (en partie) à la discussion sur les conventions typographiques concernant la transcription du russe, je me permets de notifier les principaux intervenants de l'ancienne discussion :
Cosmophilus, GrandEscogriffe, Ryoga, Média-t-il, Charlik, Sergio1006, Huguespotter et Floflo62 :
Je propose la rédaction de cet essai dans le but d'en faire une recommandation. N'hésitez pas à commenter ou reformuler en PDD les passages problématiques.
A toutes fins utiles, je mentionne cette discussion sur le bistro et divers projets associés (URSS, Russie, Ukraine, Moldavie, Bulgarie, Langues, ...). --LD • m'écrire • 21 janvier 2021 à 23:04 (CET)
La transcription sur frwiki n'est pas l'ISO 9
modifierBonjour LD
Merci de cette initiative qui, comme je l'ai déjà exprimé ailleurs, me semble être utile pour transcrire noir sur blanc les usages de l'encyclopédie.
Je t'incite toutefois fortement à la passer en brouillon car, en l'état, elle n'est pas publiable. En effet, elle indique que la transcription à utiliser sur WP serait l'ISO 9 ; or ce n'est pas du tout le cas, car chaque langue utilisant l'alphabet cyrillique est transcrite différemment : pour le russe, c'est la transcription du russe en français, pour le biélorusse, c'est la romanisation du biélorusse, colonne « transcription francophone », pour l'ukrainien, c'est la romanisation de l'ukrainien, colonne « CNT »… Sans compter qu'une même langue peut être transcrite de plusieurs façons selon qu'il s'agit d'un mot ou d'un nom propre (je pense par exemple au kazakh). Une délibération approfondie est donc nécessaire pour lister toutes les langues concernées, voir comment on les transcrit avec les usages déjà observables et les éventuelles préconisations de certains projets associés, et lister toutes ces transcriptions. Cordialement, --Cosmophilus (discuter) 22 janvier 2021 à 08:45 (CET)
- Bonjour LD et Cosmophilus
- Je suis d'accord avec Cosmophilus pour moi l'idéal sur cette page est qu'il y ait un tableau avec chaque la langue et sa transcription choisie sur Wikipédia (ou si jamais quand il y en a pas alors le tableau indiquerait qu'elle doit être translittérée, si j'ai bien compris) . Et je pense que la page n'est pas hyper clair pour le moment pour des non-linguistiques qui ne sont pas bien conscients de la différence entre transcription et translittération, j'ai du aller voir la page pour bien comprendre cette différence ce serait bien qu'il y ait une petite explication sur cette page-ci aussi pour des personnes lambda qui ne connaissent pas bien cette différence. Merci LD pour la création de la page. --Huguespotter (discuter) 22 janvier 2021 à 10:16 (CET)
- Et me revoici donc, avec la liste des langues à considérer.
- Elles se répartissent grosso modo en quatre groupes.
- Langues avec transcription francophone : le système utilisé par défaut est une transcription approximative des sons de la langue considérée au moyen des graphèmes du français.
- Russe : transcription du russe en français.
- Biélorusse : romanisation du biélorusse, colonne transcription francophone.
- Ukrainien : romanisation de l'ukrainien, colonne CNT (la colonne francophone est plus floue, en plus d'être non sourcée).
- Langues avec leur propre système de romanisation : le système utilisé par défaut est un système propre à la langue concernée, largement reconnu et utilisé.
- Serbe : alphabet latin serbe (d'ailleurs mieux expliqué sur alphabet cyrillique serbe).
- Mongol : MNS 5217:2012.
- Plusieurs langues non nationales (bachkir, tatar…) : alphabet turcique uniforme (version moderne).
- Hybrides : un système distinct est utilisé pour la romanisation des mots de la langue, mais la transcription des noms propres suit les usages francophones.
- Kazakh : de facto, simili-turcique (transcription de QazAqparat (en), utilisée sur la Wikipédia en kazakh ou Google Traduction, pour les mots de la langue, voir chez nos amis anglophones), et transcription francophone de la CNT présentée dans Kazakh#Alphabet kazakh cyrillique pour les noms propres. Ceci pourrait évoluer à l'avenir, le gouvernement kazakh souhaitant abandonner le cyrillique au profit du latin à l'horizon 2025.
- Kirghize : système turcique de l'université de Pamukkale (en) pour les mots de la langue (voir en:Kyrgyz alphabets#Correspondence charts), transcription de la CNT pour les noms propres.
- C'est le bazar : une harmonisation serait sans doute à effectuer.
- Tadjik (il y a concurrence entre des systèmes turciques, anglicisés, ISO 9, et la CNT a également donné son système).
- Bulgare (le système bulgare officiel de translittération des caractères cyrilliques est largement contesté ; l'ISO 9 et la CNT sont également en embuscade).
- Macédonien (là, c'est terra incognita).
- Langues avec transcription francophone : le système utilisé par défaut est une transcription approximative des sons de la langue considérée au moyen des graphèmes du français.
- Je veux bien faire les tableaux pour les langues dont la romanisation wikipédienne est déjà définie, mais il faudrait prendre une décision pour les quelques langues problématiques, notamment en collaboration avec les projets associés. Je passe le résumé des systèmes français de romanisation de la CNT, qui peut déjà constituer une base pour la romanisation des noms propres. Cordialement, --Cosmophilus (discuter) 22 janvier 2021 à 11:00 (CET)
- Et par ailleurs, je propose le renommage de la page en Romanisation du cyrillique, titre plus compact et complet (englobant à la fois transcription et translittération). --Cosmophilus (discuter) 22 janvier 2021 à 11:11 (CET)
- Bonjour Huguespotter et Cosmophilus
- J'ai réalisé une mise à jour en prenant en compte au maximum les points soulevés. Il reste encore quelques points à améliorer, je vous laisse le soin de le faire si vous le souhaitez.
- Je pense que tu as mal lu Cosmophilus , "elle indique que la transcription à utiliser sur WP serait l'ISO 9" , c'est écrit "en général, la norme de translittération utilisée est le système ISO 9." J'ai cependant tronqué le passage sur GOST 7.79–2001, système « A » dans la section translittération. A moins que je ne vois pas moi-même l'erreur
- Loin de moi d'être spécialiste de toutes les langues caucasiennes, altaïques, etc., mais je crois que la liste des langues de cette section devrait être ajoutée aux tables lorsqu'il y a une méthode de transcription ou de translittération.
- Aucun problème sur le renommage a priori. --LD • m'écrire • 22 janvier 2021 à 13:40 (CET)
- Merci LD pour ces ajouts, la page commence à ressembler à quelque chose. À vrai dire, j'aurais plutôt vu la chose comme un guide pratique pour les contributeurs amenés à romaniser le cyrillique, avec des tables de transcription et des directives précises ; par exemple, pour les langues qui se transcrivent différemment selon que l'on parle d'un mot ou d'un nom propre, il serait intéressant de présenter les deux systèmes sous forme de tableau (ou, le cas échéant, de renvoyer à un tableau déjà existant dans un autre coin de l'encyclopédie) et de dire lequel utiliser dans telles ou telles circonstances. Actuellement, le seul tableau qu'il y a ici, c'est celui de l'ISO 9, ce qui donne une importance disproportionnée à ce système qui ne devrait se cantonner qu'au cas ultra-particulier où l'on n'aurait pas défini de règle de romanisation précise pour la langue concernée. C'est certes intéressant, mais pour être complet, soit on met un tableau pour chaque langue concernée (ce qui est tout à fait faisable en regroupant certaines langues dont les transcriptions se ressemblent, par exemple les différentes langues romanisées avec la transcription francophone de type CNT ou l'alphabet turcique), soit on fait une liste des langues concernées (l'évolution de la page va dans ce sens, ce qui est bien) en renvoyant pour chacune d'entre elles à l'article sur le système de transcription associé. Le problème, c'est que ledit article n'existe pas forcément sur l'encyclopédie, d'où ma préférence pour la première solution. En tout état de cause, on ne devrait pas réserver un traitement différent à l'ISO 9 par rapport aux autres systèmes.
- En ce qui concerne les langues nouvellement ajoutées sur la page : oui, je n'avais évidemment cité que les principales langues cyrilliques, mais il y en a une multitude : merci de les avoir ajoutées . Nous devrons réfléchir à la manière de transcrire toutes ces nouvelles langues, car si l'ISO 9 peut tout à fait être adopté comme système de secours, il serait tout de même bon de vérifier que des usages de romanisation ne sont pas déjà établis pour ces idiomes. Je vais m'y atteler. --Cosmophilus (discuter) 22 janvier 2021 à 14:47 (CET)
- Je t’en prie, @Cosmophilus.
- Je pense que l'essai, la future recommandation ou règle doit être assez générale. La création d'une page d'aide peut être nécessaire. Aussi, nous pouvons penser cette page comme l'a été WP:CAA en créant des "annexes" WP:Romanisation du russe, WP:Romanisation de l'ukrainien, etc. dans lesquels les tables auraient un intérêt sans pour autant surcharger la page déjà assez complexe.
- Aussi, pour ne pas donner une importance disproportionnée à l'ISO 9, il faut maintenir une hiérarchisation des normes. Toutefois, la tableau me semble utile car il est justement assez général et s'applique uniformément et en dernier recours.
- Seul la première partie du #Principe générale jusqu'à l'exemple sur les titres d'oeuvre est un principe à appliquer, strico sensu, en premier.
- Les trois autres systèmes sont à appliquer en second.
- Et l'ISO 9 en dernier recours.
- J'ai réalisé une réécriture partielle en ce sens, est-ce que cela convient ?
- J'ai également ajouté des remarques comme le fait WP:Transcription du chinois. Faites-moi part des éléments à reformuler. --LD • m'écrire • 22 janvier 2021 à 21:44 (CET)
- Et par ailleurs, je propose le renommage de la page en Romanisation du cyrillique, titre plus compact et complet (englobant à la fois transcription et translittération). --Cosmophilus (discuter) 22 janvier 2021 à 11:11 (CET)
┌──────────────┘
LD : : effectivement, l'idée de créer des annexes de type Wikipédia:Romanisation du russe ou Wikipédia:Romanisation de l'ukrainien est très intéressante pour renvoyer aux tables détaillées sans surcharger la page. J'y suis tout à fait favorable.
En ce qui concerne la formulation actuelle, il reste pour moi trois principaux problèmes (pardon d'avance, ça va être un peu long : j'ai toujours tendance à rédiger des pavés quand je veux analyser posément une situation ).
- Tout d'abord, il est dit que les systèmes par défaut sont de trois types et à utiliser dans cet ordre : transcriptions francophones, translittérations spécifiques et coexistence d'usages. Cet « ordre à utiliser » me gêne car il ne correspond pas à l'usage. Lorsque j'ai écrit ce paragraphe, c'était justement pour dire que selon la langue qu'on transcrit, on est susceptible de se retrouver dans un de ces trois cas, mais ils sont exclusifs les uns des autres, et il n'y a donc pas de hiérarchisation à faire entre eux. Je vois là un risque de confusion : des contributeurs non-initiés pourraient penser en lisant ce passage que s'il existe un système de transcription francophone pour la langue à laquelle il est confronté, ce système doit prévaloir en toutes circonstances. Or non, justement, cela dépend de la langue : oui pour le russe et l'ukrainien, par exemple (premier cas), mais pas forcément pour le kazakh (troisième cas, avec le nom de l'ex-président Noursoultan Nazarbaïev transcrit à la française mais les mots kazakhs comme қазақша/qazaqşa translittérés selon la norme de type turcique spécifique à cette langue), et absolument pas pour le serbe (deuxième cas, avec l'alphabet latin serbe qui prévaut aujourd'hui sans discussion, de sorte qu'il n'y aurait aucun sens à ressusciter les anciennes transcriptions francophones comme Vouk Stefanovitch Karadjitch pour Vuk Stefanović Karadžić). J'appelle donc à la suppression du fragment « et à utiliser dans cet ordre », qui ne reflète pas le fond du message (qui est précisément que cela dépend de la langue).
- Second problème : la table des systèmes retenus pour les différentes langues présente non pas une, mais deux colonnes (hors colonne d'en-tête), une pour la transcription et une autre pour la translittération. Parfois, une seule colonne est remplie ; parfois, ce sont les deux. J'y vois là encore un risque de confusion : l'utilisateur non-initié, venu sur cette page pour savoir comment transcrire le nom de telle personnalité russe dont il a besoin, se retrouve avec deux possibilités et un risque de choisir la mauvaise (ISO 9) alors que c'était l'autre (transcription du russe en français) qui aurait dû être utilisée ici. Tout ceci me semble inutilement compliqué : il serait bien plus simple d'avoir une seule et unique colonne de sorte que l'utilisateur arrive sur cette liste, trouve la langue qu'il cherche (le russe) et ait directement sa réponse quant au système à utiliser (transcription du russe en français), le plus aisément du monde. Ceci est d'autant plus vrai que les multiples mentions de l'ISO 9 dans cette table sont lourdement redondantes avec la section précédente, où l'on vient de dire en une phrase que si la langue concernée n'a pas de système retenu dans la table, c'est l'ISO 9 qui est utilisé en tant que système de secours, et voilà tout. Inutile, de mon point de vue, de le marteler continuellement de la sorte. Je rejoins @Huguespotter, seuls devraient figurer dans cette table les systèmes à utiliser sur WP : le reste n'a pas à être ici et ne fera qu'embrouiller les destinataires de la page. Je souhaite donc que toutes les normes choisies pour l'encyclopédie soient regroupées dans la première colonne (à renommer en conséquence « Système de romanisation »), et que la deuxième colonne soit supprimée. Soit dit en passant, je me demande ce que le polonais fait ici, vu qu'il ne s'écrit pas en cyrillique .
- Enfin, troisième et dernier problème : cette énorme tableau d'ISO 9 intitulé « Table des normes pour les exceptions » est la copie conforme de celui qui se trouve dans l'article ISO 9, auquel on a déjà renvoyé dans la section « Exceptions ». Je serais donc enclin à le supprimer purement et simplement, car il prend trop de place sur la page. Si l'on ne met pas les tables détaillées des autres systèmes, alors par cohérence, on ne devrait pas mettre la table détaillée de l'ISO 9 : il convient de renvoyer à chaque fois aux articles dédiés (et à terme aux éventuelles pages méta dédiées de type WP:Romanisation du russe, etc.), ce qui est déjà fait ici sans qu'il y ait besoin de rajouter cette section « Table des normes pour les exceptions ». C'est pour moi un problème majeur, car visuellement parlant, cela conduit à une surreprésentation de l'ISO 9 par rapport aux autres, et je ne puis avaliser la présence de cet imposant tableau. Soit ils y sont tous, soit il n'y en a aucun, mais en aucun cas il ne peut y en avoir un sans les autres.
Voilà mes trois problèmes, les trois gros points de blocage qu'il faut selon moi à tout prix régler pour que cette page soit publiable. Et maintenant, trêve de critiques : à part tout ceci, je salue les paragraphes explicatifs ajoutés en fin de page, qui sont très bien formulés et ajoutent clarté et précision au propos ; de manière plus générale, félicitations pour tout le travail abattu . Et cette page est encore améliorable : en faisant quelques recherches, j'ai découvert que nos collègues wiktionnaristes anglophones s'étaient déjà penchés sur la question, débouchant sur la Category:Transliteration policies. Pour les translittérations, c'est une véritable mine d'or (et de liens), qui apporte des systèmes scientifiques pour un grand nombre de langues, largement applicables ici. Je propose d'y renvoyer les lecteurs de la page en ce qui concerne l'abaza (article WP), l'abkhaze (article WP), l'adyguéen (article WP), l'abkhaze (article WP), l'avar (article WP), le bachkir (article WP), le bejta (article WP), le budukh (article WP), le bouriate (article WP)… Une belle multitude, donc. Peut-être serait-il intéressant, après s'être assurés qu'ils correspondent bien à l'usage sur WP, de les faire figurer dans la table ?
Et quoi qu'il en soit, bonne soirée ! --Космофилус (discuter), 22 janvier 2021 à 23:32 (CET)
- Bonjour et merci pour tes remarques,
- Je serais bref.
- Pour le premier point, je suis d'accord : ce n’est pas la bonne formulation.
- Pour le second point, je suis en désaccord : dans la majorité des cas, il faut transcrire mais il faut aussi translittérer. C'est le cas dans les résumés introductifs par exemple. Dans les remarques, je mentionne URSS à titre d'exemple.
- Pour le troisième point, je propose de renvoyer effectivement vers l'article. Doublon pas très utile.
- Pour le quatrième point, je connaissais l’existence des policies évoquées, elles ne sont pas toujours très claires. Par ex. sur pl.wikt, la police de romanisation fait prévaloir PN avant ISO-9 (logique me diras-tu) mais applique ISO 9 dans certains cas sans décrire exactement quand. Finalement, c'est un peu le même problème dans toutes les langues avec la translittération : elle apparaît que dans très rares cas ou au mieux, elle apparaît dans tous les cas pour uniformiser un mot cyrillique sans prendre en compte sa prononciation. En ce sens, je pense que la page doit se concentrer pour expliquer qu'il faut dans tous les cas appliquer la norme décrite dans le tableau (tableau à deux colonnes) mais qu'il faut aussi harmoniser avec l'ISO 9 dans le résumé introductif par principe de recherche de l'exactitude. C'est actuellement le meilleur consensus qui puisse apparaître.
- J'ai écrit la réforme de la page dans ce sens, je l'annulerai ou modifierai à nouveau si elle ne fait pas consensus
- Ahm, la formulation du principe d'exactitude n'est pas parfaite pour un novice. Un style un peu lourd. Une suggestion ?
- --LD • m'écrire • 23 janvier 2021 à 04:53 (CET)
- Merci LD pour la prise en compte de mes remarques ; la page dans son état actuel me convient sur toute la ligne. J'ai juste supprimé le polonais de la liste car il n'est pas à romaniser, puisqu'il utilise déjà l'alphabet latin depuis le Moyen Âge . Mais la structuration actuelle de la page me semble excellente.
- Sur ta suggestion, j'ai tenté de rendre plus limpide la section « Principe d'exactitude » en ajoutant un paragraphe pour bien expliquer les enjeux. Il ne s'agit que d'une suggestion : si tu trouves la formulation initiale plus claire, n'hésite pas à la rétablir.
- Sur les préconisations du Wiktionnaire anglophone, je ne me suis pas très bien expliqué. Je ne voulais pas dire que nous devions les considérer comme la référence, d'autant que l'on s'en écarte pour de nombreuses langues comme le russe ou l'ukrainien. Ce qui m'intéressait, c'était de faire des liens vers les systèmes proposés pour les langues dotées d'une norme communément admise mais n'ayant pas d'article chez nous, par exemple la norme de QazAqparat pour le kazakh. Mais il est vrai que c'est d'utilité limitée, maintenant que des sous-pages spécifiques vont être créées. Je vais d'ailleurs en créer quelques-unes sur-le-champ.
- Bien à toi, --Cosmophilus (discuter) 23 janvier 2021 à 11:11 (CET)
- @Cosmophilus, cela me semble très bien. Merci pour la WP:romanisation du russe, page très complète.
- Pour le polonais, j'avais mal formulé mon idée. Il s'agirait de repasser la romanisation existante lors d'une traduction, je rédige une remarque pour ce cas.
- Je crois qu'il serait bon de renommer {{Lang-ru-ISO9}} vers {{Lang-Cyrl-ISO9}}, cela ne fait pas trop sens, non ? --LD • m'écrire • 23 janvier 2021 à 19:50 (CET)
- LD : ah, je comprends mieux pour le polonais, alors. Il serait en effet pertinent de mentionner la question de l'adaptation de cette transcription étrangère dans une section dédiée ; et d'ailleurs, il faudrait également mentionner les autres romanisations à revoir lors d'une traduction, en premier lieu l'anglophone (j'en ai touché un mot dans WP:Romanisation du russe — merci pour les compliments, d'ailleurs ) et la germanophone.
- Pour {{Lang-ru-ISO9}} : le texte-source de ce modèle consiste en
[[ISO 9]] : {{Lang|ru-Latn|texte={{{1}}}}}
. Le modèle {{lang|ru-Latn}} implique donc que ce texte sera considéré comme du russe romanisé, et sera donc lu comme tel par les lecteurs d'écran dont se servent les utilisateurs en situation de handicap visuel. Je ne sais pas trop si une extension de ce modèle aux autres langues est envisageable ; peut-être poser la question à l'atelier accessibilité ? --Cosmophilus (discuter) 23 janvier 2021 à 23:21 (CET)
Renommage
modifierBonjour GrandEscogriffe, Floflo62, François Calvaresi, Charlik, Ariel Provost, Jules*, Supertoff et LeFnake
Ayant brièvement vu cette demande de renommage dans laquelle cet essai n'a pas été nommé — et qui pourtant ouvre des pistes de réflexions — je vous invite à réfléchir sur les principes évoqués, leurs rédactions et d'éventuels ajouts afin d'établir un consensus sur la romanisation du cyrillique, avant de soumettre cette page à une prise de décision ultérieurement.
Voir également les recommandations WP:Transcription du chinois et WP:Transcription des langues indiennes ainsi que la règle WP:Transcription du japonais.
Bien à vous, LD • m'écrire • 4 juin 2021 à 20:49 (CEST)
- L'essai est un peu trop bref sur les noms de personnes, au centre de la question de renommage citée. Le cas général est une personne dont l'état civil de naissance est en cyrillique auquel nous appliquons les règles de transcription en français, avec des exceptions pour les transcriptions historiques établies, les émigrés ayant un état civil officiel dans l'alphabet latin selon une autre transcription, les sportifs qui généralement suivent les règles anglaises. Pour les personnes ayant un nom russe et dans une autre langue (par exemple l'ukrainien) le choix de la forme à retenir peut devenir une question épineuse.
- Par ailleurs l'essai se concentre sur le russe, je pense que dans les langues slaves méridionales employant le cyrillique les questions ne sont pas les mêmes. --Charlik (discuter) 5 juin 2021 à 11:04 (CEST)
- C'est d'ailleurs pour cette raison que j'ai créé des essais dédiés : WP:Romanisation du russe, WP:Romanisation du serbe, WP:Romanisation de l'ukrainien… en train d'être rédigés petit à petit. La présente page a plutôt vocation à présenter les généralités sur la question et à centraliser ces différentes pages dédiées. L'approche est différente pour chaque langue concernée. --Cosmophilus (discuter) 5 juin 2021 à 22:54 (CEST)
Passages en recommandation ?
modifier@LD, cet article et ceux pour le bulgare et le kazakh sont dans la catégorie Essai alors que ceux pour le russe, l'ukrainien, le biélorusse etc., sont en Recommandations.
Il y a une raison à ça où les 3 pourraient passer aussi en recommandation ? Fabius Lector (discuter) 28 mars 2024 à 13:23 (CET)
- Fabius Lector : la page pour le kazakh est en pause en attendant une décision définitive du gouvernement kazakh sur la latinisation de cette langue (les systèmes d'écriture semblent se succéder depuis des années). En revanche, la page sur le bulgare pourrait sans doute être passée en recommandation. -- Cosmophilus (discuter) 28 mars 2024 à 19:19 (CET)