en

Please fill in your name

Mobile phone format error

Veuillez entrer le téléphone

Veuillez entrer le nom de votre entreprise

Veuillez entrer votre e-mail professionnel

Veuillez entrer l'exigence de données

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

L'exigence de données ne peut pas faire moins de 5 mots et ne peut pas être constituée uniquement de chiffres

162 heures de données vocales d’enfants en français (France) – style oral

Français
spontané
parole
enfant

Ce corpus audio en français, enregistré par des enfants de 12 ans ou moins originaires de différentes régions de France, couvre un large éventail de situations orales : médias sociaux, échanges conversationnels, conférences, diffusions en direct ou encore émissions ludiques. Chaque enregistrement est annoté avec précision (contenu textuel, identité, genre, accent), offrant un niveau de détail propice aux recherches avancées en reconnaissance vocale appliquée aux voix d’enfants. Sa fiabilité, combinée à une grande souplesse d’utilisation, en fait une base de données de référence. Conformément aux réglementations RGPD, CCPA et PIPL, la confidentialité et les droits des mineurs sont pleinement protégés tout au long du cycle de vie des données.

Données payantes
Il s'agit d'un ensemble de données payant destiné à un usage commercial, à la recherche et plus encore. Ces Jeux de données prêts à l'emploi et sous licence contribuent au lancement de projets d'IA.
SpécificationsSpécifications
Format
16kHz, 16 bits, format WAV, mono
Âge des enfants
Âge inférieur ou égal à 12 ans
Catégorisation du contenu
Conversations, contenus de médias sociaux, émissions de variétés, etc.
Environnement d'enregistrement
Faible bruit de fond
Pays
France
Code de région linguistique
fr-FR
Langue
Français
Caractéristiques d'annotation
Annotation du contenu textuel, des horodatages de phrases, de l’identifiant du locuteur, du sexe et du bruit de fond
Précision
Taux de précision lexicale : 95%
Échantillon Exemple
  • Audio

    J'ai quelque chose sur ma joue?[N]

  • Audio

    Qu'est-ce qui y a?[N]

  • Audio

    Waw Raphaelle tu te rencontres que l'oxygène a été découverte qu'au dix-huitième siècle.

  • Audio

    On y peut rien c'est vous la maîtresse.[N]

  • Audio

    Euh et moi je suis allée la chercher à l'aéroport.[N]

Données recommandéesJeux de données recommandés
600 heures de données vocales de conversation naturelle avec pistes séparées en anglais philippin collectées par téléphone portable

Données vocales de conversation naturelle avec pistes séparées en anglais philippin collectées par téléphone portable, enregistré sur la base d'une simulation de thèmes courants. Cet ensemble de données est marqué par du contenu textuel, des horodatages de phrases, l'identité du locuteur, le sexe et d'autres attributs, enregistré par des natifs philippins de différents milieux géographiques et culturels, il garantit une grande exactitude. Cette ressource riche constitue un outil précieux pour la recherche et les applications liées à la reconnaissance vocale. Validé par plusieurs entreprises en intelligence artificielle, il contribue à améliorer les performances des modèles face à la diversité des situations réelles. Nous respectons strictement les réglementations sur la protection des données et de la vie privée, en veillant à préserver la confidentialité et les droits légitimes des utilisateurs tout au long des processus d'acquisition, de stockage et d'utilisation. Toutes les données sont conformes au RGPD, à la CCPA et à la PIPL.

dialogue AI dataset données d'entraînement à la reconnaissance vocale ensemble de données audio multicanaux données vocales de smartphone ensemble de données de parole spontanée ensemble de données vocales multi-flux ensemble de données vocales en anglais des Philippines ensemble de données vocales en duplex intégral
600 heures de données vocales de conversation naturelle avec pistes séparées en anglais américain collectées par téléphone portable

Données vocales de conversation naturelle avec pistes séparées en anglais américain collectées par téléphone portable, enregistré sur la base d'une simulation de thèmes courants. Cet ensemble de données est marqué par du contenu textuel, des horodatages de phrases, l'identité du locuteur, le sexe et d'autres attributs, enregistrés par des Amérindiens de différents milieux géographiques et culturels, il garantit une grande exactitude. Cette ressource riche constitue un outil précieux pour la recherche et les applications liées à la reconnaissance vocale. Validé par plusieurs entreprises en intelligence artificielle, il contribue à améliorer les performances des modèles face à la diversité des situations réelles. Nous respectons strictement les réglementations sur la protection des données et de la vie privée, en veillant à préserver la confidentialité et les droits légitimes des utilisateurs tout au long des processus d'acquisition, de stockage et d'utilisation. Toutes les données sont conformes au RGPD, à la CCPA et à la PIPL.

Ensemble de données vocales en anglais américain Ensemble de données vocales multi-flux ensemble de données de dialogue en duplex intégral ensemble de données vocales spontanées données vocales de smartphone ensemble de données audio multicanaux données d'entraînement de reconnaissance vocale ensemble de données de dialogue AI
Veuillez nous indiquer vos besoins particuliers

En soumettant, j’accepte la politique de confidentialité

6273d301-15ca-4eb7-8c01-31f09b1d2179

c117a3df-21fd-44e1-93e5-93ad76fb9154