346 heures de dialogues en espagnol mexicain （téléphone mobile）

audio

données

ensemble de données

conversationnel

données ASR

espagnol

mexicain

Le corpus de données vocales en espagnol mexicain — constitué à partir de conversations téléphoniques simulées — couvre une trentaine de thématiques courantes. Il comprend des annotations exhaustives, notamment le contenu textuel, les horodatages des phrases, l’identité des locuteurs ainsi que leur sexe. Les enregistrements ont été réalisés par 338 locuteurs natifs du Mexique, représentant une diversité de régions et de milieux culturels. Doté d’une grande précision et d’une facilité d’exploitation remarquable, ce corpus constitue une ressource précieuse pour la recherche et les applications en reconnaissance vocale. Son efficacité a été confirmée par de nombreuses entreprises spécialisées en intelligence artificielle, notamment pour l’entraînement de modèles robustes capables de s’adapter à la diversité des situations du monde réel. Toutes les données ont été collectées, stockées et utilisées dans le strict respect des réglementations en matière de protection des données personnelles, conformément au RGPD, au CCPA et au PIPL.

Il s'agit d'un ensemble de données payant destiné à un usage commercial, à la recherche et plus encore. Ces Jeux de données prêts à l'emploi et sous licence contribuent au lancement de projets d'IA.

Spécifications

Format

16 kHz, 16 bits, format WAV non compressé, mono

Catégorisation du contenu

Les locuteurs sélectionnent plusieurs sujets familiers à partir d’une liste prédéfinie, et enregistrent des dialogues fluides et naturels

Conditions d'enregistrement

Environnement intérieur relativement silencieux, sans réverbération

Dispositifs d'enregistrement

Smartphones Android et iPhone ;

Informations d'enregisteur

338 participants au total, dont 152 hommes et 186 femmes ;

Pays

Mexique

Code de région linguistique

es-MX

Langue

Espagnol

Caractéristiques d'annotation

Annotation du contenu textuel, des horodatages de phrases, de l’identifiant du locuteur, du sexe et du bruit de fond

Précision

Taux de précision lexicale : 98%

Jeux de données recommandés

Ensemble de données pour le concours de dialogue vocal multilingue Interspeech 2025 - MLC-SLM

Le contexte de l'ensemble de données pour le concours de dialogue vocal multilingue Interspeech 2025 - MLC-SLM est que Datatang a organisé le concours de discours de dialogue multilingue MLC-SLM en 2025, et l'ensemble de données provient des 15 ensembles de données de discours de dialogue de Datatang. Il est conçu pour briser le goulot d'étranglement de la reconnaissance vocale multilingue et de la technologie de compréhension de contexte long, et capturer véritablement des scénarios d'interaction complexes tels que le chevauchement des locuteurs et l'interruption impromptue, fournissant ainsi de riches ressources pour la recherche et les applications liées à la reconnaissance vocale, et aidant le modèle à bien fonctionner face à la diversité du monde réel. Nous respectons strictement les réglementations sur la protection des données et de la vie privée, en veillant à préserver la confidentialité et les droits légitimes des utilisateurs tout au long des processus d'acquisition, de stockage et d'utilisation. Toutes les données sont conformes au RGPD, à la CCPA et à la PIPL.

ensemble de données audio d'atelier ensemble de données mlc-slm données de reconnaissance vocale ASR

581 heures de données vocales parlées en grec

Données vocales parlées en grec, couvrant des domaines généraux tels que les médias personnels, le dialogue et la diffusion en direct, reflétant des situations interactives du monde réel. Cet ensemble de données est marqué avec divers attributs tels que le contenu du texte, l'identité du locuteur et le sexe, et est enregistré par plusieurs Roumains de différents milieux géographiques et culturels, avec une grande précision et une grande facilité d'utilisation, fournissant de riches ressources pour la recherche et les applications liées à la reconnaissance vocale, aidant le modèle à bien fonctionner face à la diversité du monde réel. Nous respectons strictement les réglementations sur la protection des données et de la vie privée, en veillant à préserver la confidentialité et les droits légitimes des utilisateurs tout au long des processus d'acquisition, de stockage et d'utilisation. Toutes les données sont conformes au RGPD, à la CCPA et à la PIPL.

ensemble de données de parole grecque données d'entraînement ASR grecques corpus de conversation grecque discours de monologue grec ensemble de données de reconnaissance vocale grecque données grecques de synthèse vocale ensemble de données vocales grecques ensemble de données de transcription grecque

600 heures de données vocales parlées en norvégien

Données vocales parlées en norvégien, couvrant des domaines généraux tels que les médias personnels, le dialogue et la diffusion en direct, reflétant des situations interactives du monde réel. Cet ensemble de données est marqué avec divers attributs tels que le contenu du texte, l'identité du locuteur et le sexe, et est enregistré par plusieurs Roumains de différents milieux géographiques et culturels, avec une grande précision et une grande facilité d'utilisation, fournissant de riches ressources pour la recherche et les applications liées à la reconnaissance vocale, aidant le modèle à bien fonctionner face à la diversité du monde réel. Nous respectons strictement les réglementations sur la protection des données et de la vie privée, en veillant à préserver la confidentialité et les droits légitimes des utilisateurs tout au long des processus d'acquisition, de stockage et d'utilisation. Toutes les données sont conformes au RGPD, à la CCPA et à la PIPL.

ensemble de données vocales norvégiennes données d'entraînement ASR norvégiennes corpus de conversations norvégiennes discours monologue norvégien ensemble de données norvégiennes de reconnaissance vocale données norvégiennes de reconnaissance vocale données norvégiennes de reconnaissance vocale ensemble de données vocales norvégiennes données vocales multilingues ensemble de données de transcription norvégienne

Données vocales de dialogue scénarisé en gujarati

Données vocales de dialogue scénarisées en gujarati, simulées basé sur un script donné et enregistré, couvrant plusieurs champs et un contenu riche. Cet ensemble de données est étiqueté avec divers attributs tels que le contenu textuel et il garantit une grande exactitude. Cette ressource riche constitue un outil précieux pour la recherche et les applications liées à la reconnaissance vocale. Validé par plusieurs entreprises en intelligence artificielle, il contribue à améliorer les performances des modèles face à la diversité des situations réelles. Nous respectons strictement les réglementations sur la protection des données et de la vie privée, en veillant à préserver la confidentialité et les droits légitimes des utilisateurs tout au long des processus d'acquisition, de stockage et d'utilisation. Toutes les données sont conformes au RGPD, à la CCPA et à la PIPL.

Ensemble de données audio gujarati Ensemble de données ASR gujarati Ensemble de données vocales gujarati Ensemble de données tts gujarati

600 heures de données vocales de conversation naturelle avec pistes séparées en anglais philippin collectées par téléphone portable

Données vocales de conversation naturelle avec pistes séparées en anglais philippin collectées par téléphone portable, enregistré sur la base d'une simulation de thèmes courants. Cet ensemble de données est marqué par du contenu textuel, des horodatages de phrases, l'identité du locuteur, le sexe et d'autres attributs, enregistré par des natifs philippins de différents milieux géographiques et culturels, il garantit une grande exactitude. Cette ressource riche constitue un outil précieux pour la recherche et les applications liées à la reconnaissance vocale. Validé par plusieurs entreprises en intelligence artificielle, il contribue à améliorer les performances des modèles face à la diversité des situations réelles. Nous respectons strictement les réglementations sur la protection des données et de la vie privée, en veillant à préserver la confidentialité et les droits légitimes des utilisateurs tout au long des processus d'acquisition, de stockage et d'utilisation. Toutes les données sont conformes au RGPD, à la CCPA et à la PIPL.

dialogue AI dataset données d'entraînement à la reconnaissance vocale ensemble de données audio multicanaux données vocales de smartphone ensemble de données de parole spontanée ensemble de données vocales multi-flux ensemble de données vocales en anglais des Philippines ensemble de données vocales en duplex intégral

600 heures de données vocales de conversation naturelle avec pistes séparées en anglais américain collectées par téléphone portable

Données vocales de conversation naturelle avec pistes séparées en anglais américain collectées par téléphone portable, enregistré sur la base d'une simulation de thèmes courants. Cet ensemble de données est marqué par du contenu textuel, des horodatages de phrases, l'identité du locuteur, le sexe et d'autres attributs, enregistrés par des Amérindiens de différents milieux géographiques et culturels, il garantit une grande exactitude. Cette ressource riche constitue un outil précieux pour la recherche et les applications liées à la reconnaissance vocale. Validé par plusieurs entreprises en intelligence artificielle, il contribue à améliorer les performances des modèles face à la diversité des situations réelles. Nous respectons strictement les réglementations sur la protection des données et de la vie privée, en veillant à préserver la confidentialité et les droits légitimes des utilisateurs tout au long des processus d'acquisition, de stockage et d'utilisation. Toutes les données sont conformes au RGPD, à la CCPA et à la PIPL.

Ensemble de données vocales en anglais américain Ensemble de données vocales multi-flux ensemble de données de dialogue en duplex intégral ensemble de données vocales spontanées données vocales de smartphone ensemble de données audio multicanaux données d'entraînement de reconnaissance vocale ensemble de données de dialogue AI

Données vocales parlées en espagnol mexicain

Données vocales parlées en espagnol mexicain, couvrant des domaines généraux tels que le dialogue, les auto-médias et les émissions de variétés, reflétant des situations interactives du monde réel. Cet ensemble de données est annoté avec divers attributs tels que le contenu textuel, l'identité de l'orateur, le sexe, etc., avec une grande précision et une grande facilité d'utilisation, fournissant de riches ressources pour la recherche et les applications liées à la reconnaissance vocale, et aidant le modèle à bien fonctionner face à la diversité du monde réel. Nous respectons strictement les réglementations sur la protection des données et de la vie privée, en veillant à préserver la confidentialité et les droits légitimes des utilisateurs tout au long des processus d'acquisition, de stockage et d'utilisation. Toutes les données sont conformes au RGPD, à la CCPA et à la PIPL.

Mexique Espagnol Conversation décontractée ASR

460 heures de données vocales en suédois — style oral

Les données vocales en suédois _ conversation informelle, reflètent des situations interactives du monde réel. L’ensemble de données contient des annotations sur le contenu textuel, l’identité et le sexe des locuteurs. Il a été enregistré par des locuteurs natifs suédois issus de différentes régions et cultures. Ces données, précises et faciles à exploiter, représentent une ressource précieuse pour la recherche et les applications en reconnaissance vocale. Elles permettent aux modèles de s’adapter efficacement à la diversité du monde réel. Nous respectons strictement les réglementations relatives à la protection des données et à la vie privée, garantissant la sécurité des utilisateurs durant l’ensemble du processus de collecte, de stockage et d’utilisation. Toutes les données sont conformes au GDPR, au CCPA et à la PIPL.

Suédois spontané ASR

346 heures de dialogues en espagnol mexicain （téléphone mobile）

audio données ensemble de données conversationnel données ASR espagnol mexicain

Niveau de maturité du projet

audio

données

ensemble de données

conversationnel

données ASR

espagnol

mexicain