Please fill in your name

Mobile phone format error

Veuillez entrer le téléphone

Veuillez entrer le nom de votre entreprise

Veuillez entrer votre e-mail professionnel

Veuillez entrer l'exigence de données

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

L'exigence de données ne peut pas faire moins de 5 mots et ne peut pas être constituée uniquement de chiffres

Accueil > Toutes Catégories > NLU > 100 000 paires de corpus parallèles sino-ouïgour

100 000 paires de corpus parallèles sino-ouïgour

Données de corpus parallèle chinois-ouïghour

corpus aligné

données de corpus parallèle

données de corpus aligné

Les données du corpus parallèle Han-ouïgour comprennent 100 000 paires de corpus de traduction parallèle du chinois et de l'ouïgour, et le format de stockage des données est un document TXT, avec une fluidité et une fidélité des données de plus de 80 %. Elles ont été nettoyées, désensibilisées et inspectées, et peuvent être utilisées comme corpus de base pour l'analyse de données de texte dans la Traduction automatique et dans d'autres domaines.

Il s'agit d'un ensemble de données payant destiné à un usage commercial, à la recherche et plus encore. Ces Jeux de données prêts à l'emploi et sous licence contribuent au lancement de projets d'IA.

Spécifications

Format de stockage

TXT

Contenu des données

Corpus parallèle sino-ouïgour

Volume des données

100 000 paires de corpus parallèles sino-ouïgour

Langue

Chinois, Ouïgour

Scène d'application

Traduction automatique

Exemple

Jeux de données recommandés

5 500 000 paires de corpus parallèles turc-anglais

5,5 millions de paires de données parallèles turc-anglais, format de stockage des données en fichier txt, couvrant divers domaines. Les données ont été nettoyées, anonymisées et vérifiées, et peuvent servir de corpus de base pour l'analyse des données textuelles, utilisé dans des domaines tels que la traduction automatique.

Corpus parallèle turc anglais

1,98 million de données de corpus parallèles chinois-polonais

1,98 million de paires de textes parallèles chinois-polonais, format de stockage : TXT. Nettoyés, anonymisés, vérifiés. Utilisable comme corpus de base pour la traduction automatique.

Corpus parallèle chinois-polonais corpus aligné données de corpus parallèle données de corpus aligné

1,99 million de paires de corpus parallèles chinois-tchèque

Ce vaste corpus bilingue sino-tchèque contient 1,99 million de paires de phrases en chinois et en tchèque, stockées au format texte (.txt). Les données ont été nettoyées, désensibilisées et vérifiées, offrant une ressource fiable pour la traduction automatique et l’analyse de textes multilingues.

Corpus parallèle chinois-tchèque corpus aligné données de corpus parallèle données de corpus align

980 000 paires de corpus parallèles chinois-ourdou

Corpus parallèle chinois-ourdou composé de 980 000 paires de traductions bidirectionnelles en format texte (.txt), couvrant les domaines du tourisme, de la vie quotidienne, de l’actualité, etc. Les données ont été nettoyées, désensibilisées et contrôlées, servant de base fiable pour les analyses textuelles et les systèmes de traduction automatique.

Données de corpus parallèle chinois-ourdou corpus aligné données de corpus parallèle données de corpus aligné

5,01 millions de paires de corpus parallèles chinois-tibétain

Corpus parallèle chinois-tibétain comprenant 5,01 millions de paires de segments traduits. Le fichier est au format .txt. Nettoyé, anonymisé et validé, il constitue une ressource de référence pour l’analyse textuelle et la traduction automatique.

Données de corpus parallèle chinois-tibétain corpus aligné données de corpus parallèle données de corpus aligné

1,14 million de paires de corpus parallèles chinois-hébreu

Ce vaste corpus bilingue sino-hébreu contient 1,14 million de paires de phrases couvrant divers domaines tels que le tourisme, la vie quotidienne et l’actualité. Les données ont été nettoyées, désensibilisées et vérifiées, offrant une ressource fiable pour la traduction automatique et l’analyse de textes multilingues.

Données de corpus parallèle chinois-hébreu corpus parallèle chinois-hébreu données de corpus parallèle données de corpus aligné

12 820 000 paires de corpus parallèles sino-coréens

12 820 000 paires de corpus de traduction parallèle sino-coréen, le format de stockage de données est un document TXT, couvrant la parole, le tourisme, les actualités, la finance et d'autres domaines. Il a été nettoyé, désensibilisé et inspecté, et peut être utilisé comme corpus de base pour l'analyse de données de texte dans la Traduction automatique et dans d'autres domaines.

Corpus parallèle sino-coréen Données de corpus Corpus d'alignement Données de corpus parallèles Données de corpus d'alignement

3,14 millions de paires de corpus parallèles chinois-espagnol

Ce vaste corpus bilingue sino-espagnol contient 3,14 millions de paires de phrases issues du domaine scientifique et technologique. Les données ont été nettoyées, désensibilisées et vérifiées, offrant une ressource fiable pour la traduction automatique et l’analyse de textes multilingues.

Données de corpus parallèle chinois-espagnol corpus parallèle chinois-espagnol données de corpus parallèle corpus aligné données de corpus parallèle données de corpus aligné

Veuillez nous indiquer vos besoins particuliers

Niveau de maturité du projet

Phase d’exploration initiale (spécifications non définies)

Objectifs définis, besoin d’un accompagnement professionnel

Phase de développement ou d’optimisation

Experts en données et annotation avec des spécifications claires

Nom complet *

Numéro de Téléphone*

Nom de l’entreprise *

E-mail de l’entreprise *

Exigences en matière de données *

En soumettant, j’accepte la politique de confidentialité

Envoyer

Abonnez-vous à notre newsletter

Soyez les premiers à recevoir les nouveautés produits, solutions de données et actualités de Nexdata

Jeux de données Prêts à l'Emploi: Toutes Catégories; LLM; Vision par ordinateur; Reconnaissance vocale; Synthèse vocale; OCR; Dictionnaire de prononciation; NLU

Service de Données: Données 3D Point Cloud; Données de Vue de Rue; Données OCR; Reconnaissance comportementale; Reconnaissance d’identité; Reconnaissance Vocale; Données Synthèse Vocale; Données multimodales

Industries: IA Incarnée; IA Générative; Véhicules Autonomes; AR/VR; IA Conversationnelle; Système Domotique; Commerce de Détail; Santé Intelligence

Entreprise: À Propos de Nous; Actualités; Partenaires; Qualité & Sécurité; Événements
Liens Utiles: OPENMPD; DataPlus; Datarade

Platforme: Platforme
Compétition: Compétition
Ressources: Jeux de données sponsorisés

Améliorez votre IA avec de meilleures données

+1(626)594-5598

[email protected]

Navigation du site Conditions générales d’utilisation

Nous utilisons des cookies pour améliorer votre navigation, diffuser des publicités ou contenus personnalisés et analyser notre trafic. En cliquant "Accepter Tout", vous consentez à notre utilisation des cookies

7a208dca-c7e2-473e-a309-00bd094c24e8

a63f56d8-3382-4b02-b462-812ddbbe9b8a

100 000 paires de corpus parallèles sino-ouïgour

Données de corpus parallèle chinois-ouïghour corpus aligné données de corpus parallèle données de corpus aligné

Niveau de maturité du projet

Données de corpus parallèle chinois-ouïghour

corpus aligné

données de corpus parallèle

données de corpus aligné