302 participants – données vocales bilingues hindi/anglais – monologues

Monologue spontané

parole naturelle

hindi

anglais

bilingue

Ce corpus bilingue (hindi-anglais) de monologues enregistrés sur téléphone portable a été produit à partir de thèmes prédéfinis, couvrant divers sujets d’intérêt général. Il a été réalisé par 302 locuteurs âgés de 18 à 46 ans, issus de régions et de milieux culturels variés. Grâce à sa précision élevée, ce corpus constitue une ressource fiable pour la recherche et les applications en reconnaissance vocale. Validé par plusieurs entreprises spécialisées dans l’intelligence artificielle, il améliore significativement les performances des modèles face à la diversité du monde réel. Toutes les données ont été recueillies, stockées et exploitées dans le strict respect des réglementations sur la protection des données personnelles (RGPD, CCPA, PIPL).

Il s'agit d'un ensemble de données payant destiné à un usage commercial, à la recherche et plus encore. Ces Jeux de données prêts à l'emploi et sous licence contribuent au lancement de projets d'IA.

Jeux de données recommandés

Ensemble de données pour le concours de dialogue vocal multilingue Interspeech 2025 - MLC-SLM

Le contexte de l'ensemble de données pour le concours de dialogue vocal multilingue Interspeech 2025 - MLC-SLM est que Datatang a organisé le concours de discours de dialogue multilingue MLC-SLM en 2025, et l'ensemble de données provient des 15 ensembles de données de discours de dialogue de Datatang. Il est conçu pour briser le goulot d'étranglement de la reconnaissance vocale multilingue et de la technologie de compréhension de contexte long, et capturer véritablement des scénarios d'interaction complexes tels que le chevauchement des locuteurs et l'interruption impromptue, fournissant ainsi de riches ressources pour la recherche et les applications liées à la reconnaissance vocale, et aidant le modèle à bien fonctionner face à la diversité du monde réel. Nous respectons strictement les réglementations sur la protection des données et de la vie privée, en veillant à préserver la confidentialité et les droits légitimes des utilisateurs tout au long des processus d'acquisition, de stockage et d'utilisation. Toutes les données sont conformes au RGPD, à la CCPA et à la PIPL.

ensemble de données audio d'atelier ensemble de données mlc-slm données de reconnaissance vocale ASR

581 heures de données vocales parlées en grec

Données vocales parlées en grec, couvrant des domaines généraux tels que les médias personnels, le dialogue et la diffusion en direct, reflétant des situations interactives du monde réel. Cet ensemble de données est marqué avec divers attributs tels que le contenu du texte, l'identité du locuteur et le sexe, et est enregistré par plusieurs Roumains de différents milieux géographiques et culturels, avec une grande précision et une grande facilité d'utilisation, fournissant de riches ressources pour la recherche et les applications liées à la reconnaissance vocale, aidant le modèle à bien fonctionner face à la diversité du monde réel. Nous respectons strictement les réglementations sur la protection des données et de la vie privée, en veillant à préserver la confidentialité et les droits légitimes des utilisateurs tout au long des processus d'acquisition, de stockage et d'utilisation. Toutes les données sont conformes au RGPD, à la CCPA et à la PIPL.

ensemble de données de parole grecque données d'entraînement ASR grecques corpus de conversation grecque discours de monologue grec ensemble de données de reconnaissance vocale grecque données grecques de synthèse vocale ensemble de données vocales grecques ensemble de données de transcription grecque

600 heures de données vocales parlées en norvégien

Données vocales parlées en norvégien, couvrant des domaines généraux tels que les médias personnels, le dialogue et la diffusion en direct, reflétant des situations interactives du monde réel. Cet ensemble de données est marqué avec divers attributs tels que le contenu du texte, l'identité du locuteur et le sexe, et est enregistré par plusieurs Roumains de différents milieux géographiques et culturels, avec une grande précision et une grande facilité d'utilisation, fournissant de riches ressources pour la recherche et les applications liées à la reconnaissance vocale, aidant le modèle à bien fonctionner face à la diversité du monde réel. Nous respectons strictement les réglementations sur la protection des données et de la vie privée, en veillant à préserver la confidentialité et les droits légitimes des utilisateurs tout au long des processus d'acquisition, de stockage et d'utilisation. Toutes les données sont conformes au RGPD, à la CCPA et à la PIPL.

ensemble de données vocales norvégiennes données d'entraînement ASR norvégiennes corpus de conversations norvégiennes discours monologue norvégien ensemble de données norvégiennes de reconnaissance vocale données norvégiennes de reconnaissance vocale données norvégiennes de reconnaissance vocale ensemble de données vocales norvégiennes données vocales multilingues ensemble de données de transcription norvégienne

Données vocales de dialogue scénarisé en gujarati

Données vocales de dialogue scénarisées en gujarati, simulées basé sur un script donné et enregistré, couvrant plusieurs champs et un contenu riche. Cet ensemble de données est étiqueté avec divers attributs tels que le contenu textuel et il garantit une grande exactitude. Cette ressource riche constitue un outil précieux pour la recherche et les applications liées à la reconnaissance vocale. Validé par plusieurs entreprises en intelligence artificielle, il contribue à améliorer les performances des modèles face à la diversité des situations réelles. Nous respectons strictement les réglementations sur la protection des données et de la vie privée, en veillant à préserver la confidentialité et les droits légitimes des utilisateurs tout au long des processus d'acquisition, de stockage et d'utilisation. Toutes les données sont conformes au RGPD, à la CCPA et à la PIPL.

Ensemble de données audio gujarati Ensemble de données ASR gujarati Ensemble de données vocales gujarati Ensemble de données tts gujarati

600 heures de données vocales de conversation naturelle avec pistes séparées en anglais philippin collectées par téléphone portable

Données vocales de conversation naturelle avec pistes séparées en anglais philippin collectées par téléphone portable, enregistré sur la base d'une simulation de thèmes courants. Cet ensemble de données est marqué par du contenu textuel, des horodatages de phrases, l'identité du locuteur, le sexe et d'autres attributs, enregistré par des natifs philippins de différents milieux géographiques et culturels, il garantit une grande exactitude. Cette ressource riche constitue un outil précieux pour la recherche et les applications liées à la reconnaissance vocale. Validé par plusieurs entreprises en intelligence artificielle, il contribue à améliorer les performances des modèles face à la diversité des situations réelles. Nous respectons strictement les réglementations sur la protection des données et de la vie privée, en veillant à préserver la confidentialité et les droits légitimes des utilisateurs tout au long des processus d'acquisition, de stockage et d'utilisation. Toutes les données sont conformes au RGPD, à la CCPA et à la PIPL.

dialogue AI dataset données d'entraînement à la reconnaissance vocale ensemble de données audio multicanaux données vocales de smartphone ensemble de données de parole spontanée ensemble de données vocales multi-flux ensemble de données vocales en anglais des Philippines ensemble de données vocales en duplex intégral

600 heures de données vocales de conversation naturelle avec pistes séparées en anglais américain collectées par téléphone portable

Données vocales de conversation naturelle avec pistes séparées en anglais américain collectées par téléphone portable, enregistré sur la base d'une simulation de thèmes courants. Cet ensemble de données est marqué par du contenu textuel, des horodatages de phrases, l'identité du locuteur, le sexe et d'autres attributs, enregistrés par des Amérindiens de différents milieux géographiques et culturels, il garantit une grande exactitude. Cette ressource riche constitue un outil précieux pour la recherche et les applications liées à la reconnaissance vocale. Validé par plusieurs entreprises en intelligence artificielle, il contribue à améliorer les performances des modèles face à la diversité des situations réelles. Nous respectons strictement les réglementations sur la protection des données et de la vie privée, en veillant à préserver la confidentialité et les droits légitimes des utilisateurs tout au long des processus d'acquisition, de stockage et d'utilisation. Toutes les données sont conformes au RGPD, à la CCPA et à la PIPL.

Ensemble de données vocales en anglais américain Ensemble de données vocales multi-flux ensemble de données de dialogue en duplex intégral ensemble de données vocales spontanées données vocales de smartphone ensemble de données audio multicanaux données d'entraînement de reconnaissance vocale ensemble de données de dialogue AI

Données vocales parlées en espagnol mexicain

Données vocales parlées en espagnol mexicain, couvrant des domaines généraux tels que le dialogue, les auto-médias et les émissions de variétés, reflétant des situations interactives du monde réel. Cet ensemble de données est annoté avec divers attributs tels que le contenu textuel, l'identité de l'orateur, le sexe, etc., avec une grande précision et une grande facilité d'utilisation, fournissant de riches ressources pour la recherche et les applications liées à la reconnaissance vocale, et aidant le modèle à bien fonctionner face à la diversité du monde réel. Nous respectons strictement les réglementations sur la protection des données et de la vie privée, en veillant à préserver la confidentialité et les droits légitimes des utilisateurs tout au long des processus d'acquisition, de stockage et d'utilisation. Toutes les données sont conformes au RGPD, à la CCPA et à la PIPL.

Mexique Espagnol Conversation décontractée ASR

460 heures de données vocales en suédois — style oral

Les données vocales en suédois _ conversation informelle, reflètent des situations interactives du monde réel. L’ensemble de données contient des annotations sur le contenu textuel, l’identité et le sexe des locuteurs. Il a été enregistré par des locuteurs natifs suédois issus de différentes régions et cultures. Ces données, précises et faciles à exploiter, représentent une ressource précieuse pour la recherche et les applications en reconnaissance vocale. Elles permettent aux modèles de s’adapter efficacement à la diversité du monde réel. Nous respectons strictement les réglementations relatives à la protection des données et à la vie privée, garantissant la sécurité des utilisateurs durant l’ensemble du processus de collecte, de stockage et d’utilisation. Toutes les données sont conformes au GDPR, au CCPA et à la PIPL.

Suédois spontané ASR

302 participants – données vocales bilingues hindi/anglais – monologues – téléphone mobile

Monologue spontané

parole naturelle

hindi

anglais

bilingue

Niveau de maturité du projet