fr

Please fill in your name

Mobile phone format error

Veuillez entrer le téléphone

Veuillez entrer le nom de votre entreprise

Veuillez entrer votre e-mail professionnel

Veuillez entrer l'exigence de données

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

L'exigence de données ne peut pas faire moins de 5 mots et ne peut pas être constituée uniquement de chiffres

Jeux de données d’entraînement de haute qualité

Améliorez les performances de vos modèles d’IA grâce à nos jeux de données d’entraînement prêts à l’emploi et de haute qualité.

Langue

Tout

Type de données

Tout

Base de synthèse de timbre moyen à haute expressivité pour narration de 4 locuteurs en chinois

Base de synthèse de timbre moyen à haute expressivité pour narration de 4 locuteurs en chinois, collectée par des comédiens vocaux professionnels, compte tenu des livres, l'orateur lit dans le style d'une narration très expressive.
Haute expressivité Narration TTS Chinois

Base de synthèse de timbre moyen multistyle et multi-émotions pour 4 locuteurs

Base de synthèse de timbre moyen multistyle et multi-émotions pour 4 locuteurs, collectée par des comédiens de doublage professionnels. Le style comprend 4 types de patronnes capables, des princes audacieux, des servantes habiles et des belles-mères gentilles ; Les émotions comprennent le dédain, la colère, la joie, l'inquiétude, la surprise, le halètement de peur, le reniflement (dédain), la sympathie, le rire, l'activité mentale, le sérieux, le dégoût, le doute, la neutralité.
Corpus de Synthèse TTS Mandarin Chinois Multi-style Multi-émotionnel

288 millions d'ensembles de données de scènes et de modèles 3D

288 millions d'ensembles de données de scènes et de modèles 3D, dont 270 millions d'ensembles de données de modèles 3D et 18 millions d'ensembles de données de scènes 3D, dont les modèles 3D couvrent divers types d'objets tels que les modèles conventionnels, les modèles interactifs et les modèles d'amélioration physique et les environnements de mobilier intérieur, et les scènes 3D couvrent les scènes de décoration intérieure et les scènes d'espace commercial. Cet ensemble de données peut être utilisé pour des tâches telles que la génération d'actifs 3D et la simulation de construction de terrains.
Ensemble de données de modèles 3D Ensemble de données de scènes 3D Ensemble de données d'environnement 3D intérieur Ensemble de données d'espace 3D commercial Modèles 3D améliorés par la physique Ensemble de données de modèles 3D interactifs Ensemble de données de génération d'actifs 3D Ensemble de données d'environnement d'entraînement de simulation Données 3D d'environnement virtuel Ensemble de données d'IA 3D à grande échelle

Ensemble de données pour le concours de dialogue vocal multilingue Interspeech 2025 - MLC-SLM

Le contexte de l'ensemble de données pour le concours de dialogue vocal multilingue Interspeech 2025 - MLC-SLM est que Datatang a organisé le concours de discours de dialogue multilingue MLC-SLM en 2025, et l'ensemble de données provient des 15 ensembles de données de discours de dialogue de Datatang. Il est conçu pour briser le goulot d'étranglement de la reconnaissance vocale multilingue et de la technologie de compréhension de contexte long, et capturer véritablement des scénarios d'interaction complexes tels que le chevauchement des locuteurs et l'interruption impromptue, fournissant ainsi de riches ressources pour la recherche et les applications liées à la reconnaissance vocale, et aidant le modèle à bien fonctionner face à la diversité du monde réel. Nous respectons strictement les réglementations sur la protection des données et de la vie privée, en veillant à préserver la confidentialité et les droits légitimes des utilisateurs tout au long des processus d'acquisition, de stockage et d'utilisation. Toutes les données sont conformes au RGPD, à la CCPA et à la PIPL.
ensemble de données audio d'atelier ensemble de données mlc-slm données de reconnaissance vocale ASR

3000 heures de données vocales de conversation naturelle en mandarin pleinement duplex

Données vocales de conversation naturelle en mandarin pleinement duplex, enregistrées sur la base de conversations sur des sujets courants. Cet ensemble de données est marqué avec une variété d'attributs tels que le contenu du texte, l'horodatage des phrases, l'identité du locuteur, le sexe, etc., il garantit une grande exactitude. Cette ressource riche constitue un outil précieux pour la recherche et les applications liées à la reconnaissance vocale. Validé par plusieurs entreprises en intelligence artificielle, il contribue à améliorer les performances des modèles face à la diversité des situations réelles. Nous respectons strictement les réglementations sur la protection des données et de la vie privée, en veillant à préserver la confidentialité et les droits légitimes des utilisateurs tout au long des processus d'acquisition, de stockage et d'utilisation. Toutes les données sont conformes au RGPD, à la CCPA et à la PIPL.
Full-Duplex Dialogues Mandarin

119 heures de données vocales de lecture en grec collectées par téléphone portable

Données vocales de lecture en grec collectées par téléphone portable, lues et simulées basé sur un script donné et enregistré, avec un total de 95 enregistreurs, enregistrés depuis la Grèce, et enregistrés dans un environnement calme et sans écho. L'enregistrement est vaste, environ 1 000 phrases par personne. Le texte a été relu manuellement, il garantit une grande exactitude. Cette ressource riche constitue un outil précieux pour la recherche et les applications liées à la reconnaissance vocale. Validé par plusieurs entreprises en intelligence artificielle, il contribue à améliorer les performances des modèles face à la diversité des situations réelles. Nous respectons strictement les réglementations sur la protection des données et de la vie privée, en veillant à préserver la confidentialité et les droits légitimes des utilisateurs tout au long des processus d'acquisition, de stockage et d'utilisation. Toutes les données sont conformes au RGPD, à la CCPA et à la PIPL.
Ensemble de données de monologue scénarisé en grec Ensemble de données vocales grecques Données audio grecques Données vocales grecques Données de synthèse vocale grecques

280 heures de données vocales de lecture en norvégien collectées par téléphone portable

Données vocales de lecture en norvégien collectées par téléphone portable, lues et simulées basé sur un script donné et enregistré, avec un total de 157 enregistreurs, enregistrés depuis la Norvège et enregistrés dans un environnement calme sans écho. L'enregistrement est vaste, environ 1 000 phrases par personne. Le texte a été relu manuellement, il garantit une grande exactitude. Cette ressource riche constitue un outil précieux pour la recherche et les applications liées à la reconnaissance vocale. Validé par plusieurs entreprises en intelligence artificielle, il contribue à améliorer les performances des modèles face à la diversité des situations réelles. Nous respectons strictement les réglementations sur la protection des données et de la vie privée, en veillant à préserver la confidentialité et les droits légitimes des utilisateurs tout au long des processus d'acquisition, de stockage et d'utilisation. Toutes les données sont conformes au RGPD, à la CCPA et à la PIPL.
Ensemble de données de monologue scénarisé norvégien Ensemble de données vocales norvégiennes Données de synthèse vocale norvégiennes Corpus NLP norvégien Données vocales norvégiennes Ensemble de données audio norvégiennes

500 000 images de données OCR annotées provenant de scènes naturelles, de scènes de documents photographiés et de scènes électroniques dans 21 pays

500 000 images de données OCR annotées provenant de scènes naturelles, de scènes de documents photographiés et de scènes électroniques dans 21 pays. Les données contiennent 21 langues, et le nombre de feuilles dans chaque langue est réparti entre 20 000 et 25 000. Les types de données incluent les scènes naturelles, les scènes photo de document et les scènes électroniques. La diversité des données comprend plusieurs types de données, plusieurs angles de prise de vue et plusieurs langues. En termes d'annotation, l'annotation quadrilatérale ou polygonale au niveau de la ligne (colonne) et la transcription du contenu au niveau de la ligne (colonne) sont adoptées. Les données peuvent être utilisées pour des tâches de reconnaissance OCR multilingues.
ensemble de données OCR multilingues données de reconnaissance de texte de scène ensemble de données OCR de document données OCR d'écran électronique ensemble de données OCR 21 langues données d'entraînement OCR AI ensemble de données de reconnaissance de texte

200 000 ensembles de données image-texte de bâtiments emblématiques de plusieurs pays

200 000 ensembles de données image-texte de bâtiments emblématiques de plusieurs pays. Chaque ensemble de données contient une image et un document de description en chinois et en anglais. Les points de repère nationaux comprennent 80 000 groupes et les autres points de repère nationaux 120 000 groupes. Il n'y a pas moins de 20 pays, dont les États-Unis, le Royaume-Uni, la France, la Russie, l'Allemagne et d'autres pays. Le nombre d'images correspondant à chaque point de repère est réparti de 1 à 10, y compris des informations sur les points de repère sous différents angles, à différentes distances et à différentes périodes. Les types de points de repère comprennent de nombreux types de bâtiments emblématiques, tels que des bâtiments commerciaux, des bâtiments anciens, des monuments, des bibliothèques, des attractions, etc. En termes de contenu d'étiquetage, le pays de repère, la ville de repère, l'emplacement spécifique du point de repère, la classification et la description du point de repère sont marqués. Les données peuvent être utilisées pour l'identification et l'analyse des bâtiments emblématiques.
ensemble de données d'images de point de repère ensemble de données de reconnaissance de bâtiment ensemble de légende d'image de point de repère mondial données de légende d'image bilingue ensemble de légende chinois-anglais ensemble de données de classification de point de repère ensemble de données image-texte ensemble de données de point de repère touristique ensemble de données d'image du patrimoine culturel sous-titrage d'image pour l'entraînement de l'IA

581 heures de données vocales parlées en grec

Données vocales parlées en grec, couvrant des domaines généraux tels que les médias personnels, le dialogue et la diffusion en direct, reflétant des situations interactives du monde réel. Cet ensemble de données est marqué avec divers attributs tels que le contenu du texte, l'identité du locuteur et le sexe, et est enregistré par plusieurs Roumains de différents milieux géographiques et culturels, avec une grande précision et une grande facilité d'utilisation, fournissant de riches ressources pour la recherche et les applications liées à la reconnaissance vocale, aidant le modèle à bien fonctionner face à la diversité du monde réel. Nous respectons strictement les réglementations sur la protection des données et de la vie privée, en veillant à préserver la confidentialité et les droits légitimes des utilisateurs tout au long des processus d'acquisition, de stockage et d'utilisation. Toutes les données sont conformes au RGPD, à la CCPA et à la PIPL.
ensemble de données de parole grecque données d'entraînement ASR grecques corpus de conversation grecque discours de monologue grec ensemble de données de reconnaissance vocale grecque données grecques de synthèse vocale ensemble de données vocales grecques ensemble de données de transcription grecque

600 heures de données vocales parlées en norvégien

Données vocales parlées en norvégien, couvrant des domaines généraux tels que les médias personnels, le dialogue et la diffusion en direct, reflétant des situations interactives du monde réel. Cet ensemble de données est marqué avec divers attributs tels que le contenu du texte, l'identité du locuteur et le sexe, et est enregistré par plusieurs Roumains de différents milieux géographiques et culturels, avec une grande précision et une grande facilité d'utilisation, fournissant de riches ressources pour la recherche et les applications liées à la reconnaissance vocale, aidant le modèle à bien fonctionner face à la diversité du monde réel. Nous respectons strictement les réglementations sur la protection des données et de la vie privée, en veillant à préserver la confidentialité et les droits légitimes des utilisateurs tout au long des processus d'acquisition, de stockage et d'utilisation. Toutes les données sont conformes au RGPD, à la CCPA et à la PIPL.
ensemble de données vocales norvégiennes données d'entraînement ASR norvégiennes corpus de conversations norvégiennes discours monologue norvégien ensemble de données norvégiennes de reconnaissance vocale données norvégiennes de reconnaissance vocale données norvégiennes de reconnaissance vocale ensemble de données vocales norvégiennes données vocales multilingues ensemble de données de transcription norvégienne

Ensemble de données de synthèse haute fidélité de scènes 3D_Habitacle

Ensemble de données de synthèse haute fidélité de scènes 3D_Habitacle, la modélisation de scène 3D, les données de sortie de capteur synthétisées très similaires au monde réel, y compris les images de caméra, les séquences vidéo, les nuages de points, etc., peuvent fournir du contenu d'annotation, y compris, mais sans s'y limiter, les paramètres de caméra, la catégorie cible/la détection/la segmentation, les méta-informations sur le temps/l'éclairage/la météo, la position et la direction de la tête/des yeux/des bras/des jambes, et d'autres poses humaines. Cet ensemble de données peut être utilisé pour la modélisation environnementale et la synthèse de données pour la conduite autonome, la robotique, etc.
Données synthétiques 3D Ensemble de données synthétiques de surveillance du conducteur Données synthétiques de conduite autonome Ensemble de données de simulation haute fidélité Données de nuages de points synthétiques Ensemble de données de simulation de caméra Ensemble de données synthétiques de pose humaine Ensemble de données lidar synthétiques Modélisation d'environnement 3D Données synthétiques robotiques Ensemble de données DMS
. . .
loading

loading

4aab89ea-bcc2-46a2-b764-b01ab0e84b22