[{"@type":"PropertyValue","name":"Format de stockage","value":"TXT"},{"@type":"PropertyValue","name":"Contenu des données","value":"Corpus parallèle sino-ouïgour"},{"@type":"PropertyValue","name":"Volume des données","value":"100 000 paires de corpus parallèles sino-ouïgour"},{"@type":"PropertyValue","name":"Langue","value":"Chinois, Ouïgour"},{"@type":"PropertyValue","name":"Scène d'application","value":"Traduction automatique"}]
{"id":149,"datatype":"1","titleimg":"https://fr.nexdata.ai/shujutang/static/image/index/datatang_wenben_default.webp","type1":"183","type1str":null,"type2":"185","type2str":null,"dataname":"100 000 paires de corpus parallèles sino-ouïgour","datazy":[{"title":"Format de stockage","desc":"Format de stockage","content":"TXT"},{"title":"Contenu des données","desc":"Contenu des données","content":"Corpus parallèle sino-ouïgour"},{"title":"Volume des données","desc":"Volume des données","content":"100 000 paires de corpus parallèles sino-ouïgour"},{"title":"Langue","desc":"Langue","content":"Chinois, Ouïgour"},{"title":"Scène d'application","desc":"Scène d'application","content":"Traduction automatique"}],"datatag":"Chinese-Uighur,Parallel Corpus","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"/data/apps/damp/temp/ziptemp/APY170101225_demo1711015202833/HW01509034_demo/HW01509034_demo.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY170101225_demo1711015202833/HW01509034_demo/HW01509034_demo.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=x%2FUBRlWPRlYDQsi2b%2BrA9Go9QWQ%3D","intro":"","size":0,"progress":100,"type":"jpg"}],"officialSummary":"Les données du corpus parallèle Han-ouïgour comprennent 100 000 paires de corpus de traduction parallèle du chinois et de l'ouïgour, et le format de stockage des données est un document TXT, avec une fluidité et une fidélité des données de plus de 80 %. Elles ont été nettoyées, désensibilisées et inspectées, et peuvent être utilisées comme corpus de base pour l'analyse de données de texte dans la Traduction automatique et dans d'autres domaines.","dataexampl":null,"datakeyword":["Données de corpus parallèle chinois-ouïghour"," corpus aligné"," données de corpus parallèle"," données de corpus aligné"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Type","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"nlu","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"100,000 Groups - Chinese-Uighur Parallel Corpus Data","BGimg":"","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
https://fr.nexdata.ai/shujutang/static/image/index/datatang_wenben_default.webp
[{"@type":"ImageObject","embedUrl":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY170101225_demo1711015202833/HW01509034_demo/HW01509034_demo.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=x%2FUBRlWPRlYDQsi2b%2BrA9Go9QWQ%3D"}]
100 000 paires de corpus parallèles sino-ouïgour
Données de corpus parallèle chinois-ouïghour
corpus aligné
données de corpus parallèle
données de corpus aligné
Les données du corpus parallèle Han-ouïgour comprennent 100 000 paires de corpus de traduction parallèle du chinois et de l'ouïgour, et le format de stockage des données est un document TXT, avec une fluidité et une fidélité des données de plus de 80 %. Elles ont été nettoyées, désensibilisées et inspectées, et peuvent être utilisées comme corpus de base pour l'analyse de données de texte dans la Traduction automatique et dans d'autres domaines.
Il s'agit d'un ensemble de données payant destiné à un usage commercial, à la recherche et plus encore. Ces Jeux de données prêts à l'emploi et sous licence contribuent au lancement de projets d'IA.
![Spécifications]()
Spécifications
Contenu des données
Corpus parallèle sino-ouïgour
Volume des données
100 000 paires de corpus parallèles sino-ouïgour
Scène d'application
Traduction automatique
![Échantillon]()
Exemple
![Données recommandées]()
Jeux de données recommandés
Veuillez nous indiquer vos besoins particuliers
fc88c001-8c92-4f71-adc5-534fe0843bd1