en

Please fill in your name

Mobile phone format error

Veuillez entrer le téléphone

Veuillez entrer le nom de votre entreprise

Veuillez entrer votre e-mail professionnel

Veuillez entrer l'exigence de données

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

L'exigence de données ne peut pas faire moins de 5 mots et ne peut pas être constituée uniquement de chiffres

80 heures de dialogues en français canadien (téléphone mobile)

audio
données
ensemble de données
conversationnel
données ASR
français
canadien

Les données vocales en français canadien _ conversations (téléphone portable) ont été enregistrées sur la base d’environ une trentaine de thèmes courants. Cet ensemble de données contient des annotations détaillant le contenu textuel, les horodatages des phrases, l'identité des locuteurs, leur sexe, ainsi que d'autres attributs. Il a été enregistré par 126 locuteurs natifs du Québec, issus de différentes régions et cultures, garantissant ainsi une grande précision. Ces données constituent une ressource précieuse pour la recherche et les applications en reconnaissance vocale, validée par plusieurs entreprises spécialisées en intelligence artificielle. Elles permettent aux modèles d’atteindre des performances exceptionnelles face à la diversité du monde réel. Nous respectons scrupuleusement les réglementations en matière de protection des données et de confidentialité, garantissant ainsi la protection des droits et de la vie privée des utilisateurs tout au long de la collecte, du stockage et de l'utilisation des données. Toutes les données respectent le GDPR, le CCPA et la PIPL.

Données payantes
Il s'agit d'un ensemble de données payant destiné à un usage commercial, à la recherche et plus encore. Ces Jeux de données prêts à l'emploi et sous licence contribuent au lancement de projets d'IA.
SpécificationsSpécifications
Format
16 kHz, 16 bits, format WAV non compressé, mono
Catégorisation du contenu
Les locuteurs sélectionnent plusieurs sujets familiers à partir d’une liste prédéfinie, et enregistrent des dialogues fluides et naturels
Conditions d'enregistrement
Environnement intérieur relativement silencieux, sans réverbération
Dispositifs d'enregistrement
Smartphones Android et iPhone ;
Informations d'enregisteur
126 participants au total, dont 60 hommes et 66 femmes ;
Pays
Canada
Code de région linguistique
fr-CA
Langue
Français
Caractéristiques d'annotation
Annotation du contenu textuel, des horodatages de phrases, de l’identifiant du locuteur, du sexe et du bruit de fond
Précision
Taux de précision lexicale : 98%
Échantillon Exemple
  • Audio

    [OVERLAP/] Si les autres [/OVERLAP], tu les reçois, tu sais que tu peux pas dire oui.

  • Audio

    Ouais.

  • Audio

    ça ne peut pas être par la voie de la Cour.

  • Audio

    parce qu'ils ne voudront jamais risquer ce scénario là.

  • Audio

    trancher un côté, tu enfin que tu regardes et waouh et en regardez hein.

Données recommandéesJeux de données recommandés
600 heures de données vocales de conversation naturelle avec pistes séparées en anglais philippin collectées par téléphone portable

Données vocales de conversation naturelle avec pistes séparées en anglais philippin collectées par téléphone portable, enregistré sur la base d'une simulation de thèmes courants. Cet ensemble de données est marqué par du contenu textuel, des horodatages de phrases, l'identité du locuteur, le sexe et d'autres attributs, enregistré par des natifs philippins de différents milieux géographiques et culturels, il garantit une grande exactitude. Cette ressource riche constitue un outil précieux pour la recherche et les applications liées à la reconnaissance vocale. Validé par plusieurs entreprises en intelligence artificielle, il contribue à améliorer les performances des modèles face à la diversité des situations réelles. Nous respectons strictement les réglementations sur la protection des données et de la vie privée, en veillant à préserver la confidentialité et les droits légitimes des utilisateurs tout au long des processus d'acquisition, de stockage et d'utilisation. Toutes les données sont conformes au RGPD, à la CCPA et à la PIPL.

dialogue AI dataset données d'entraînement à la reconnaissance vocale ensemble de données audio multicanaux données vocales de smartphone ensemble de données de parole spontanée ensemble de données vocales multi-flux ensemble de données vocales en anglais des Philippines ensemble de données vocales en duplex intégral
600 heures de données vocales de conversation naturelle avec pistes séparées en anglais américain collectées par téléphone portable

Données vocales de conversation naturelle avec pistes séparées en anglais américain collectées par téléphone portable, enregistré sur la base d'une simulation de thèmes courants. Cet ensemble de données est marqué par du contenu textuel, des horodatages de phrases, l'identité du locuteur, le sexe et d'autres attributs, enregistrés par des Amérindiens de différents milieux géographiques et culturels, il garantit une grande exactitude. Cette ressource riche constitue un outil précieux pour la recherche et les applications liées à la reconnaissance vocale. Validé par plusieurs entreprises en intelligence artificielle, il contribue à améliorer les performances des modèles face à la diversité des situations réelles. Nous respectons strictement les réglementations sur la protection des données et de la vie privée, en veillant à préserver la confidentialité et les droits légitimes des utilisateurs tout au long des processus d'acquisition, de stockage et d'utilisation. Toutes les données sont conformes au RGPD, à la CCPA et à la PIPL.

Ensemble de données vocales en anglais américain Ensemble de données vocales multi-flux ensemble de données de dialogue en duplex intégral ensemble de données vocales spontanées données vocales de smartphone ensemble de données audio multicanaux données d'entraînement de reconnaissance vocale ensemble de données de dialogue AI
Veuillez nous indiquer vos besoins particuliers

En soumettant, j’accepte la politique de confidentialité

86d1542c-9905-4c1b-a8f7-20a2b0396574

b49c6f18-fc11-425a-a070-481930157052