en

Please fill in your name

Mobile phone format error

Veuillez entrer le téléphone

Veuillez entrer le nom de votre entreprise

Veuillez entrer votre e-mail professionnel

Veuillez entrer l'exigence de données

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

L'exigence de données ne peut pas faire moins de 5 mots et ne peut pas être constituée uniquement de chiffres

Jeux de données NLU

Améliorez instantanément les performances de votre modèle IA avec des Jeux de données prêts à l’emploi de haute qualité.

Type

Tout
29
Identification d'entités
4
Texte de dialogue
1
Compréhension d’intention
1
Autres
2
Corpus parallèle
23

5,31 millions de paires de corpus parallèles chinois-allemand

Ce vaste corpus multilingue sino-allemand contient 5,14 millions de paires de phrases couvrant divers domaines : tourisme, santé, quotidien, actualités, etc. Les données ont été nettoyées, désensibilisées et vérifiées, offrant une ressource fiable pour la traduction automatique et l’analyse de textes multilingues.
Données de corpus parallèle chinois-allemand Corpus parallèle chinois-allemand Données de corpus parallèle Données de corpus aligné

1,08 million de paires de corpus parallèles anglais-russe

Ce corpus comprend 1,08 million de paires de segments anglais-russe, soigneusement filtrés pour exclure tout contenu sensible (politique, obscène, personnel). Il fournit une base linguistique propre et structurée, idéale pour les recherches en traduction automatique et en traitement de corpus textuels.
Données de corpus parallèle anglais-russe Collection de corpus anglais-russe Corpus parallèle anglais-russe Données de corpus parallèle Données de corpus aligné

1,34 million de données de corpus parallèles anglais-coréen

1,34 million de paires de textes parallèles anglais-coréen ; exclusion des termes sensibles. Utilisable comme corpus de base pour la traduction automatique, etc.
Corpus parallèles anglais et coréen collection de corpus anglais et coréen corpus d'alignement Corpus parallèles Corpus d'alignement

380 000 données de corpus parallèles japonais-anglais

380 000 paires de textes parallèles japonais-anglais ; exclusion des termes sensibles (politique, pornographie, données personnelles). Utilisable comme corpus de base pour la traduction automatique, etc.
Corpus parallèles japonais et anglais collection de corpus parallèles japonais et anglais corpus d'alignement Corpus parallèles Corpus d'alignement

1,99 million de paires de corpus parallèles chinois-tchèque

Ce vaste corpus bilingue sino-tchèque contient 1,99 million de paires de phrases en chinois et en tchèque, stockées au format texte (.txt). Les données ont été nettoyées, désensibilisées et vérifiées, offrant une ressource fiable pour la traduction automatique et l’analyse de textes multilingues.
Corpus parallèle chinois-tchèque corpus aligné données de corpus parallèle données de corpus align

10 millions de données de corpus de SMS en chinois traditionnel

10 millions de textes de SMS en chinois traditionnel, réels, informels ; uniquement du texte ; annotation en TXT. Utilisable pour la NLU.
Corpus SMS en chinois traditionnel données SMS en chinois traditionnel collecte de SMS en chinois traditionnel données de corpus en chinois traditionnel

850 000 paires de corpus parallèles anglais-japonais

Ce vaste corpus bilingue anglais-japonais contient 850 000 paires de phrases couvrant divers domaines : tourisme, santé, quotidien, actualités, etc. Les données ont été nettoyées, désensibilisées et vérifiées, offrant une ressource fiable pour la traduction automatique et l’analyse de textes multilingues.
Données de corpus parallèle anglais-japonais corpus parallèle anglais-japonais données de corpus parallèle données de corpus aligné

80 120 000 paires de corpus parallèles sino-anglais

Corpus de traduction parallèle sino-anglais, le format de stockage de données est un document TXT, couvrant le tourisme, la médecine, la vie quotidienne, les séries télévisées et d'autres domaines. Il a été nettoyé, désensibilisé et inspecté, et peut être utilisé comme corpus de base pour l'analyse de données de texte dans la Traduction automatique et dans d'autres domaines.
Données de corpus parallèles sino-anglais Alignement sino-anglais Corpus

3,14 millions de paires de corpus parallèles chinois-espagnol

Ce vaste corpus bilingue sino-espagnol contient 3,14 millions de paires de phrases issues du domaine scientifique et technologique. Les données ont été nettoyées, désensibilisées et vérifiées, offrant une ressource fiable pour la traduction automatique et l’analyse de textes multilingues.
Données de corpus parallèle chinois-espagnol corpus parallèle chinois-espagnol données de corpus parallèle corpus aligné données de corpus parallèle données de corpus aligné

loading

Personnalisez vos données dès maintenant

Pourquoi choisir des jeux de données prêts à l'emploi

  • Droits d'auteur

    Droits d'auteur

    Droits d’auteur clairs vérifiables à tout moment
  • Sécurité

    Sécurité

    Correctement autorisés Sécurisés à l’usage
  • Professionnel

    Professionnel

    Conçus et produits par des experts en données d’IA
  • Diversité

    Diversité

    Collectés à partir de diverses scènes réelles
  • Rentabilité

    Rentabilité

    Plus rentable Que les données personnalisées
  • Efficacité

    Efficacité

    Prêt à l'emploi, livré en quelques secondes
93a97a61-9ebe-4d9f-9b79-50e870ffb3e8