en

Please fill in your name

Mobile phone format error

Veuillez entrer le téléphone

Veuillez entrer le nom de votre entreprise

Veuillez entrer votre e-mail professionnel

Veuillez entrer l'exigence de données

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

L'exigence de données ne peut pas faire moins de 5 mots et ne peut pas être constituée uniquement de chiffres

198 heures de données vocales en espagnol – domaine du jeu vidéo – style oral

Espagnol
dialogue spontané
jeux vidéo
espagnol latino-américain

Ce corpus de données vocales en espagnol est issu des dialogues des jeux les plus emblématiques et pérennes du pays. Il couvre des échanges stratégiques entre joueurs, des interactions sociales et des contenus liés à l’e-sport, reflétant fidèlement les situations réelles. Le jeu de données est annoté de manière exhaustive : contenu textuel, genre et identité des locuteurs, présence de propos offensants, accent, etc. Enregistré par des participants issus de régions et de cultures variées, il se distingue par sa précision et sa facilité d’utilisation. Validé par plusieurs entreprises d’IA, il constitue une ressource essentielle pour améliorer la robustesse des modèles dans des contextes variés. Toutes les données respectent rigoureusement les réglementations sur la protection de la vie privée et des données (RGPD, CCPA, PIPL).

Données payantes
Il s'agit d'un ensemble de données payant destiné à un usage commercial, à la recherche et plus encore. Ces Jeux de données prêts à l'emploi et sous licence contribuent au lancement de projets d'IA.
SpécificationsSpécifications
Format
16kHz, 16 bits, format WAV, mono;
Catégorisation du contenu
Monologues ou dialogues issus de jeux populaires et durables du pays (FPS, MOBA, MMORPG, VR, etc.), traitant de stratégies de combat, d’interactions sociales et d’actualités e-sportives
Environnement d'enregistrement
Environnements variés (intérieur, extérieur, lieux de loisirs);
Pays
Espagne, Mexique, etc.
Code de région linguistique
es-EP, es-MX, etc.
Langue
Espagnol
Caractéristiques d'annotation
Annotation du contenu textuel, des horodatages de phrases, des propos offensants, de l’identifiant du locuteur, du sexe et du bruit de fond;
Précision
Taux de précision lexicale : 98%.
Échantillon Exemple
  • Audio

    [OFFENSIVE/] Hijo puta.[/OFFENSIVE]

  • Audio

    Subida.[N]

  • Audio

    Tira la Q, Auron.[N]

  • Audio

    ¿Dónde está la fuente? Clicando. Clic derecho. [OVERLAP/] Clícale [/OVERLAP] en Mammoth, Auron, porque tienes dinero y hay que comprar. Auron, dale a una Q. Dale, tira una Q al minion.

  • Audio

    Vale, perfecto. Auron, tira la E.[N]

Données recommandéesJeux de données recommandés
600 heures de données vocales de conversation naturelle avec pistes séparées en anglais philippin collectées par téléphone portable

Données vocales de conversation naturelle avec pistes séparées en anglais philippin collectées par téléphone portable, enregistré sur la base d'une simulation de thèmes courants. Cet ensemble de données est marqué par du contenu textuel, des horodatages de phrases, l'identité du locuteur, le sexe et d'autres attributs, enregistré par des natifs philippins de différents milieux géographiques et culturels, il garantit une grande exactitude. Cette ressource riche constitue un outil précieux pour la recherche et les applications liées à la reconnaissance vocale. Validé par plusieurs entreprises en intelligence artificielle, il contribue à améliorer les performances des modèles face à la diversité des situations réelles. Nous respectons strictement les réglementations sur la protection des données et de la vie privée, en veillant à préserver la confidentialité et les droits légitimes des utilisateurs tout au long des processus d'acquisition, de stockage et d'utilisation. Toutes les données sont conformes au RGPD, à la CCPA et à la PIPL.

dialogue AI dataset données d'entraînement à la reconnaissance vocale ensemble de données audio multicanaux données vocales de smartphone ensemble de données de parole spontanée ensemble de données vocales multi-flux ensemble de données vocales en anglais des Philippines ensemble de données vocales en duplex intégral
600 heures de données vocales de conversation naturelle avec pistes séparées en anglais américain collectées par téléphone portable

Données vocales de conversation naturelle avec pistes séparées en anglais américain collectées par téléphone portable, enregistré sur la base d'une simulation de thèmes courants. Cet ensemble de données est marqué par du contenu textuel, des horodatages de phrases, l'identité du locuteur, le sexe et d'autres attributs, enregistrés par des Amérindiens de différents milieux géographiques et culturels, il garantit une grande exactitude. Cette ressource riche constitue un outil précieux pour la recherche et les applications liées à la reconnaissance vocale. Validé par plusieurs entreprises en intelligence artificielle, il contribue à améliorer les performances des modèles face à la diversité des situations réelles. Nous respectons strictement les réglementations sur la protection des données et de la vie privée, en veillant à préserver la confidentialité et les droits légitimes des utilisateurs tout au long des processus d'acquisition, de stockage et d'utilisation. Toutes les données sont conformes au RGPD, à la CCPA et à la PIPL.

Ensemble de données vocales en anglais américain Ensemble de données vocales multi-flux ensemble de données de dialogue en duplex intégral ensemble de données vocales spontanées données vocales de smartphone ensemble de données audio multicanaux données d'entraînement de reconnaissance vocale ensemble de données de dialogue AI
Veuillez nous indiquer vos besoins particuliers

En soumettant, j’accepte la politique de confidentialité

b85bac35-fcd2-4a14-aa26-b6ed5b5521f1

397858b7-1510-4a1c-87e2-d0135320bedb