en

Please fill in your name

Mobile phone format error

Veuillez entrer le téléphone

Veuillez entrer le nom de votre entreprise

Veuillez entrer votre e-mail professionnel

Veuillez entrer l'exigence de données

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

L'exigence de données ne peut pas faire moins de 5 mots et ne peut pas être constituée uniquement de chiffres

98 heures de données vocales d’enfants en indonésien (Indonésie) – style oral

Parole spontanée
annotation textuelle
indonésien

Ce corpus vocal d’enfants indonésiens en langue indonésienne, à caractère spontané, couvre les principaux domaines d’interaction comme les plateformes sociales, les conversations, les conférences en ligne, les émissions en direct et les programmes de variétés. Il reproduit des contextes de communication réalistes. Les enregistrements, accompagnés de métadonnées incluant les transcriptions, l’identité, le sexe et l’accent des locuteurs, ont été réalisés par des enfants de 12 ans ou moins issus de différentes régions et cultures d’Indonésie. Hautement fiable et facile à intégrer, ce corpus constitue une base solide pour la recherche en reconnaissance vocale. Toutes les données respectent les normes internationales de protection des données personnelles (RGPD, CCPA, PIPL).

Données payantes
Il s'agit d'un ensemble de données payant destiné à un usage commercial, à la recherche et plus encore. Ces Jeux de données prêts à l'emploi et sous licence contribuent au lancement de projets d'IA.
SpécificationsSpécifications
Format
16kHz, 16 bits, format WAV, mono
Âge des enfants
Âge inférieur ou égal à 12 ans
Catégorisation du contenu
Conversations, contenus de médias sociaux, émissions de variétés, etc.
Environnement d'enregistrement
Faible bruit de fond
Pays
Indonésie
Code de région linguistique
id-ID
Langue
Indonésien
Caractéristiques d'annotation
Annotation du contenu textuel, des horodatages de phrases, de l’identifiant du locuteur, du sexe et du bruit de fond
Précision
Taux de précision lexicale : 98%
Échantillon Exemple
  • Audio

    Oke, jadi ini ada stikernya. [N]

  • Audio

    Oke, langsung saja ya kita buka, oke kita buka ya. [N]

  • Audio

    Hai teman-teman selamat datang di channel Unboxing Mainan Anak bersama Naifa! [N]

  • Audio

    Dan mainan ini disarankan untuk anak tiga tahun ke atas. [N]

  • Audio

    Ini dia. [N]

Données recommandéesJeux de données recommandés
600 heures de données vocales de conversation naturelle avec pistes séparées en anglais philippin collectées par téléphone portable

Données vocales de conversation naturelle avec pistes séparées en anglais philippin collectées par téléphone portable, enregistré sur la base d'une simulation de thèmes courants. Cet ensemble de données est marqué par du contenu textuel, des horodatages de phrases, l'identité du locuteur, le sexe et d'autres attributs, enregistré par des natifs philippins de différents milieux géographiques et culturels, il garantit une grande exactitude. Cette ressource riche constitue un outil précieux pour la recherche et les applications liées à la reconnaissance vocale. Validé par plusieurs entreprises en intelligence artificielle, il contribue à améliorer les performances des modèles face à la diversité des situations réelles. Nous respectons strictement les réglementations sur la protection des données et de la vie privée, en veillant à préserver la confidentialité et les droits légitimes des utilisateurs tout au long des processus d'acquisition, de stockage et d'utilisation. Toutes les données sont conformes au RGPD, à la CCPA et à la PIPL.

dialogue AI dataset données d'entraînement à la reconnaissance vocale ensemble de données audio multicanaux données vocales de smartphone ensemble de données de parole spontanée ensemble de données vocales multi-flux ensemble de données vocales en anglais des Philippines ensemble de données vocales en duplex intégral
600 heures de données vocales de conversation naturelle avec pistes séparées en anglais américain collectées par téléphone portable

Données vocales de conversation naturelle avec pistes séparées en anglais américain collectées par téléphone portable, enregistré sur la base d'une simulation de thèmes courants. Cet ensemble de données est marqué par du contenu textuel, des horodatages de phrases, l'identité du locuteur, le sexe et d'autres attributs, enregistrés par des Amérindiens de différents milieux géographiques et culturels, il garantit une grande exactitude. Cette ressource riche constitue un outil précieux pour la recherche et les applications liées à la reconnaissance vocale. Validé par plusieurs entreprises en intelligence artificielle, il contribue à améliorer les performances des modèles face à la diversité des situations réelles. Nous respectons strictement les réglementations sur la protection des données et de la vie privée, en veillant à préserver la confidentialité et les droits légitimes des utilisateurs tout au long des processus d'acquisition, de stockage et d'utilisation. Toutes les données sont conformes au RGPD, à la CCPA et à la PIPL.

Ensemble de données vocales en anglais américain Ensemble de données vocales multi-flux ensemble de données de dialogue en duplex intégral ensemble de données vocales spontanées données vocales de smartphone ensemble de données audio multicanaux données d'entraînement de reconnaissance vocale ensemble de données de dialogue AI
Veuillez nous indiquer vos besoins particuliers

En soumettant, j’accepte la politique de confidentialité

ab7fe1c8-d1db-4ac7-8539-d1ddb399f240

9bc18c44-f4fc-4388-86b1-b3023e6e8622