en

Please fill in your name

Mobile phone format error

Veuillez entrer le téléphone

Veuillez entrer le nom de votre entreprise

Veuillez entrer votre e-mail professionnel

Veuillez entrer l'exigence de données

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

L'exigence de données ne peut pas faire moins de 5 mots et ne peut pas être constituée uniquement de chiffres

534 heures de données vocales en mandarin avec accent taïwanais – conversation naturelle – téléphone mobile

Mandarin avec accent
taïwanais
dialogue spontané

Ce corpus de 534 heures de dialogues spontanés en mandarin avec accent taïwanais, collecté via smartphone autour d’une trentaine de thèmes courants, inclut des annotations telles que le contenu textuel, les horodatages, l’identité et le sexe des locuteurs. Il a été enregistré par des locuteurs originaires de Taïwan. Grâce à son haut niveau de précision, ce corpus constitue une ressource précieuse pour les systèmes de reconnaissance vocale. Validé par de nombreuses entreprises d’IA, il offre une grande robustesse face aux situations du monde réel. Le traitement des données est conforme au RGPD, au CCPA et à la PIPL.

Données payantes
Il s'agit d'un ensemble de données payant destiné à un usage commercial, à la recherche et plus encore. Ces Jeux de données prêts à l'emploi et sous licence contribuent au lancement de projets d'IA.
SpécificationsSpécifications
Format
16 kHz, 16 bits, format WAV non compressé, mono
Environnement d'enregistrement
Environnement intérieur relativement silencieux, sans réverbération
Contenu d'enregistrement
Une liste de sujets est fournie ; les locuteurs en sélectionnent plusieurs qu’ils maîtrisent afin de garantir la fluidité des échanges, puis enregistrent une conversation autour de chaque sujet
Intervenants
480 locuteurs originaires de Taïwan, avec une répartition équilibrée entre hommes et femmes
Caractéristiques d'annotation
Annotation de phrases individuelles valides, incluant les points de début et de fin, l’identifiant du locuteur, le contenu textuel, ainsi que la présence éventuelle de bruit de fond
Pays
Chine
Langue
Mandarin (chinois standard)
Scène d'application
Reconnaissance vocale ; reconnaissance de l’empreinte vocale
Précision
Taux de précision par phrase : 95 %
Échantillon Exemple
Données recommandéesJeux de données recommandés
600 heures de données vocales de conversation naturelle avec pistes séparées en anglais philippin collectées par téléphone portable

Données vocales de conversation naturelle avec pistes séparées en anglais philippin collectées par téléphone portable, enregistré sur la base d'une simulation de thèmes courants. Cet ensemble de données est marqué par du contenu textuel, des horodatages de phrases, l'identité du locuteur, le sexe et d'autres attributs, enregistré par des natifs philippins de différents milieux géographiques et culturels, il garantit une grande exactitude. Cette ressource riche constitue un outil précieux pour la recherche et les applications liées à la reconnaissance vocale. Validé par plusieurs entreprises en intelligence artificielle, il contribue à améliorer les performances des modèles face à la diversité des situations réelles. Nous respectons strictement les réglementations sur la protection des données et de la vie privée, en veillant à préserver la confidentialité et les droits légitimes des utilisateurs tout au long des processus d'acquisition, de stockage et d'utilisation. Toutes les données sont conformes au RGPD, à la CCPA et à la PIPL.

dialogue AI dataset données d'entraînement à la reconnaissance vocale ensemble de données audio multicanaux données vocales de smartphone ensemble de données de parole spontanée ensemble de données vocales multi-flux ensemble de données vocales en anglais des Philippines ensemble de données vocales en duplex intégral
600 heures de données vocales de conversation naturelle avec pistes séparées en anglais américain collectées par téléphone portable

Données vocales de conversation naturelle avec pistes séparées en anglais américain collectées par téléphone portable, enregistré sur la base d'une simulation de thèmes courants. Cet ensemble de données est marqué par du contenu textuel, des horodatages de phrases, l'identité du locuteur, le sexe et d'autres attributs, enregistrés par des Amérindiens de différents milieux géographiques et culturels, il garantit une grande exactitude. Cette ressource riche constitue un outil précieux pour la recherche et les applications liées à la reconnaissance vocale. Validé par plusieurs entreprises en intelligence artificielle, il contribue à améliorer les performances des modèles face à la diversité des situations réelles. Nous respectons strictement les réglementations sur la protection des données et de la vie privée, en veillant à préserver la confidentialité et les droits légitimes des utilisateurs tout au long des processus d'acquisition, de stockage et d'utilisation. Toutes les données sont conformes au RGPD, à la CCPA et à la PIPL.

Ensemble de données vocales en anglais américain Ensemble de données vocales multi-flux ensemble de données de dialogue en duplex intégral ensemble de données vocales spontanées données vocales de smartphone ensemble de données audio multicanaux données d'entraînement de reconnaissance vocale ensemble de données de dialogue AI
Veuillez nous indiquer vos besoins particuliers

En soumettant, j’accepte la politique de confidentialité

2461e9c2-f507-4d7a-97bf-5b3301e149a3

0918e1c4-39fc-45e9-872a-be5fa7577bd7