[{"@type":"PropertyValue","name":"Format de stockage","value":"txt"},{"@type":"PropertyValue","name":"Contenu des données","value":"Corpus parallèle chinois-ouïghour"},{"@type":"PropertyValue","name":"Volume des données","value":"4,72 millions de paires chinois-ouïghour, avec une longueur moyenne de 22 caractères pour le chinois"},{"@type":"PropertyValue","name":"Langue","value":"Chinois, ouïghour"},{"@type":"PropertyValue","name":"Scène d'application","value":"Traduction automatique"},{"@type":"PropertyValue","name":"Précision","value":"0.9"}]
{"id":1185,"datatype":"1","titleimg":"https://fr.nexdata.ai/shujutang/static/image/index/datatang_wenben_default.webp","type1":"183","type1str":null,"type2":"185","type2str":null,"dataname":"4,72 millions de paires de corpus parallèles chinois-ouïghour","datazy":[{"title":"Format de stockage","desc":"Format de stockage","content":"txt"},{"title":"Contenu des données","desc":"Contenu des données","content":"Corpus parallèle chinois-ouïghour"},{"title":"Volume des données","desc":"Volume des données","content":"4,72 millions de paires chinois-ouïghour, avec une longueur moyenne de 22 caractères pour le chinois"},{"title":"Langue","desc":"Langue","content":"Chinois, ouïghour"},{"title":"Scène d'application","desc":"Scène d'application","content":"Traduction automatique"},{"title":"Précision","desc":"Précision","content":"0.9"}],"datatag":"Chinese,Uighur,Han-Uyghur,Parallel corpus","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"/data/apps/damp/temp/ziptemp/APY220720002_demo1711015209158/APY220720002-demo/zh_ug ????.png","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY220720002_demo1711015209158/APY220720002-demo/zh_ug%20%3F%3F%3F%3F.png?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=4x5LxBrzAXyre6%2BPLWdnkk8B%2FKI%3D","intro":"","size":0,"progress":100,"type":"jpg"}],"officialSummary":"4,72 millions d’segments bilingues alignés chinois-ouïghour, enregistrées au format texte (.txt). Le corpus a été soigneusement nettoyé, anonymisé et vérifié, offrant une base robuste pour les analyses linguistiques et les systèmes de traduction automatique.","dataexampl":null,"datakeyword":["Données de corpus parallèle chinois-ouïghour"," corpus aligné"," données de corpus parallèle"," données de corpus aligné"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Type","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"nlu","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"4,720,000 Groups - Chinese-Uighur Parallel Corpus Data","BGimg":"","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
https://fr.nexdata.ai/shujutang/static/image/index/datatang_wenben_default.webp
[{"@type":"ImageObject","embedUrl":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY220720002_demo1711015209158/APY220720002-demo/zh_ug%20%3F%3F%3F%3F.png?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=4x5LxBrzAXyre6%2BPLWdnkk8B%2FKI%3D"}]
4,72 millions de paires de corpus parallèles chinois-ouïghour
Données de corpus parallèle chinois-ouïghour
corpus aligné
données de corpus parallèle
données de corpus aligné
4,72 millions d’segments bilingues alignés chinois-ouïghour, enregistrées au format texte (.txt). Le corpus a été soigneusement nettoyé, anonymisé et vérifié, offrant une base robuste pour les analyses linguistiques et les systèmes de traduction automatique.
Il s'agit d'un ensemble de données payant destiné à un usage commercial, à la recherche et plus encore. Ces Jeux de données prêts à l'emploi et sous licence contribuent au lancement de projets d'IA.
![Spécifications]()
Spécifications
Contenu des données
Corpus parallèle chinois-ouïghour
Volume des données
4,72 millions de paires chinois-ouïghour, avec une longueur moyenne de 22 caractères pour le chinois
Scène d'application
Traduction automatique
![Échantillon]()
Exemple
![Données recommandées]()
Jeux de données recommandés
Veuillez nous indiquer vos besoins particuliers
8345cec5-9c68-4da1-b6b1-836f4c1fd462