CEDICT
CEDICT est un projet de dictionnaire anglo-chinois, avec pinyin, sur support numérique, et sous licence libre[1].
Introduction
modifierLe projet CEDICT a été inspiré par le projet EDICT, un dictionnaire nippo-anglais, lancé par Jim Breen en 1991, et considéré également comme une référence.
CEDICT a été lancé en 1997 par Paul Denisowski dans le but de fournir un dictionnaire sino-anglais complet et gratuit (licence libre). Il a depuis été fréquemment mis à jour par plusieurs volontaires. CEDICT existe principalement sous forme de fichier texte, d'autres programmes sont nécessaires pour y rechercher des informations, et les utiliser. Ce projet est désormais considéré comme une référence du Web en matière de dictionnaire sino-anglais, et est notamment utilisé par le projet Unihan[2] et d'autres projets relatifs à ces langues[3],[4]. Il est également encodé en UTF-8.
Données
modifierLes données de ce dictionnaire sont :
- chinois simplifié / chinois traditionnel ;
- pinyin (plusieurs prononciations s'il y a) ;
- anglais (plusieurs sens s'il y a) ;
- encodage UTF-8 disponible.
En , CEDICT contenait plus de 98 000 entrées chinoises.
Format
modifierLe format de CEDICT est tel que :
Traditional Simplified [pin1 yin1] /English equivalent 1/equivalent 2/ 中國 中国 [Zhong1 guo2] /China/Middle Kingdom/
Notes et références
modifier- (en) Gang Peng, James W. Minett et William S.-Y. Wang, « The networks of syllables and characters in Chinese∗ », Journal of Quantitative Linguistics, vol. 15, no 3, , p. 243–255 (ISSN 0929-6174 et 1744-5035, DOI 10.1080/09296170802159488, lire en ligne, consulté le )
- (en) Claire-Lise Mottaz Jiang, « Hypertext Interfaces for Chinese Character and Word Dictionaries », Centre Universitaire d'Informatique, Université de Genève, (lire en ligne, consulté le )
- (en) « Chinese Retrieval System Using Hangeul - ProQuest », sur www.proquest.com (consulté le )
- (en) Xiaoheng Zhang et Xiaotong Li, « Building a Collation Element Table for a Large Chinese Character Set in YES », Chinese Computational Linguistics and Natural Language Processing Based on Naturally Annotated Big Data, Springer International Publishing, lecture Notes in Computer Science, , p. 3–14 (ISBN 978-3-319-25816-4, DOI 10.1007/978-3-319-25816-4_1, lire en ligne, consulté le )