900 heures de données vocales en thaï

Thaï

conversation informelle

ASR

Les données vocales en thaï _ conversation informelle, couvrent des domaines généraux tels que les dialogues, les médias sociaux et les émissions de divertissement, reflétant des situations d’interaction réelles. L’ensemble contient des annotations sur le contenu textuel, l’identité et le sexe des locuteurs. Ces données, précises et faciles à exploiter, constituent une ressource précieuse pour les recherches et les applications en reconnaissance vocale. Elles permettent aux modèles de mieux s’adapter à la diversité du monde réel. Nous respectons rigoureusement les réglementations en matière de protection des données et de la vie privée, assurant la sécurité des utilisateurs tout au long du processus de collecte, de stockage et d’utilisation. Toutes les données sont conformes au GDPR, au CCPA et à la PIPL.

Il s'agit d'un ensemble de données payant destiné à un usage commercial, à la recherche et plus encore. Ces Jeux de données prêts à l'emploi et sous licence contribuent au lancement de projets d'IA.

Exemple

Audio
คุณผู้ฟังมีความคิดแบบนี้ไหมคะ ในวันที่เราเหนื่อยมากมาก เราท้อมากมาก เราเริ่มไม่อยากจะมีชีวิตอยู่แล้ว
Audio
อยู่ที่โคราช แล้วจะมีการซ้อมรบกันอยู่ ฝึกซ้อมรบกันอยู่น่ะ ก็ตั้งชื่อผมอะคลอดพอดี ก็ตั้งชื่อผมว่าประลองยุทธ์
Audio
ปรุงแต่งอยู่ในนั้น
Audio
มันก็จะทำให้ใจรู้สึกปฏิเสธมากมาก เนี่ย แล้วมันก็เลยส่งผลออกมาเป็นความจำความรู้สึก

Jeux de données recommandés

Ensemble de données pour le concours de dialogue vocal multilingue Interspeech 2025 - MLC-SLM

Le contexte de l'ensemble de données pour le concours de dialogue vocal multilingue Interspeech 2025 - MLC-SLM est que Datatang a organisé le concours de discours de dialogue multilingue MLC-SLM en 2025, et l'ensemble de données provient des 15 ensembles de données de discours de dialogue de Datatang. Il est conçu pour briser le goulot d'étranglement de la reconnaissance vocale multilingue et de la technologie de compréhension de contexte long, et capturer véritablement des scénarios d'interaction complexes tels que le chevauchement des locuteurs et l'interruption impromptue, fournissant ainsi de riches ressources pour la recherche et les applications liées à la reconnaissance vocale, et aidant le modèle à bien fonctionner face à la diversité du monde réel. Nous respectons strictement les réglementations sur la protection des données et de la vie privée, en veillant à préserver la confidentialité et les droits légitimes des utilisateurs tout au long des processus d'acquisition, de stockage et d'utilisation. Toutes les données sont conformes au RGPD, à la CCPA et à la PIPL.

ensemble de données audio d'atelier ensemble de données mlc-slm données de reconnaissance vocale ASR

581 heures de données vocales parlées en grec

Données vocales parlées en grec, couvrant des domaines généraux tels que les médias personnels, le dialogue et la diffusion en direct, reflétant des situations interactives du monde réel. Cet ensemble de données est marqué avec divers attributs tels que le contenu du texte, l'identité du locuteur et le sexe, et est enregistré par plusieurs Roumains de différents milieux géographiques et culturels, avec une grande précision et une grande facilité d'utilisation, fournissant de riches ressources pour la recherche et les applications liées à la reconnaissance vocale, aidant le modèle à bien fonctionner face à la diversité du monde réel. Nous respectons strictement les réglementations sur la protection des données et de la vie privée, en veillant à préserver la confidentialité et les droits légitimes des utilisateurs tout au long des processus d'acquisition, de stockage et d'utilisation. Toutes les données sont conformes au RGPD, à la CCPA et à la PIPL.

ensemble de données de parole grecque données d'entraînement ASR grecques corpus de conversation grecque discours de monologue grec ensemble de données de reconnaissance vocale grecque données grecques de synthèse vocale ensemble de données vocales grecques ensemble de données de transcription grecque

600 heures de données vocales parlées en norvégien

Données vocales parlées en norvégien, couvrant des domaines généraux tels que les médias personnels, le dialogue et la diffusion en direct, reflétant des situations interactives du monde réel. Cet ensemble de données est marqué avec divers attributs tels que le contenu du texte, l'identité du locuteur et le sexe, et est enregistré par plusieurs Roumains de différents milieux géographiques et culturels, avec une grande précision et une grande facilité d'utilisation, fournissant de riches ressources pour la recherche et les applications liées à la reconnaissance vocale, aidant le modèle à bien fonctionner face à la diversité du monde réel. Nous respectons strictement les réglementations sur la protection des données et de la vie privée, en veillant à préserver la confidentialité et les droits légitimes des utilisateurs tout au long des processus d'acquisition, de stockage et d'utilisation. Toutes les données sont conformes au RGPD, à la CCPA et à la PIPL.

ensemble de données vocales norvégiennes données d'entraînement ASR norvégiennes corpus de conversations norvégiennes discours monologue norvégien ensemble de données norvégiennes de reconnaissance vocale données norvégiennes de reconnaissance vocale données norvégiennes de reconnaissance vocale ensemble de données vocales norvégiennes données vocales multilingues ensemble de données de transcription norvégienne

Données vocales de dialogue scénarisé en gujarati

Données vocales de dialogue scénarisées en gujarati, simulées basé sur un script donné et enregistré, couvrant plusieurs champs et un contenu riche. Cet ensemble de données est étiqueté avec divers attributs tels que le contenu textuel et il garantit une grande exactitude. Cette ressource riche constitue un outil précieux pour la recherche et les applications liées à la reconnaissance vocale. Validé par plusieurs entreprises en intelligence artificielle, il contribue à améliorer les performances des modèles face à la diversité des situations réelles. Nous respectons strictement les réglementations sur la protection des données et de la vie privée, en veillant à préserver la confidentialité et les droits légitimes des utilisateurs tout au long des processus d'acquisition, de stockage et d'utilisation. Toutes les données sont conformes au RGPD, à la CCPA et à la PIPL.

Ensemble de données audio gujarati Ensemble de données ASR gujarati Ensemble de données vocales gujarati Ensemble de données tts gujarati

600 heures de données vocales de conversation naturelle avec pistes séparées en anglais philippin collectées par téléphone portable

Données vocales de conversation naturelle avec pistes séparées en anglais philippin collectées par téléphone portable, enregistré sur la base d'une simulation de thèmes courants. Cet ensemble de données est marqué par du contenu textuel, des horodatages de phrases, l'identité du locuteur, le sexe et d'autres attributs, enregistré par des natifs philippins de différents milieux géographiques et culturels, il garantit une grande exactitude. Cette ressource riche constitue un outil précieux pour la recherche et les applications liées à la reconnaissance vocale. Validé par plusieurs entreprises en intelligence artificielle, il contribue à améliorer les performances des modèles face à la diversité des situations réelles. Nous respectons strictement les réglementations sur la protection des données et de la vie privée, en veillant à préserver la confidentialité et les droits légitimes des utilisateurs tout au long des processus d'acquisition, de stockage et d'utilisation. Toutes les données sont conformes au RGPD, à la CCPA et à la PIPL.

dialogue AI dataset données d'entraînement à la reconnaissance vocale ensemble de données audio multicanaux données vocales de smartphone ensemble de données de parole spontanée ensemble de données vocales multi-flux ensemble de données vocales en anglais des Philippines ensemble de données vocales en duplex intégral

600 heures de données vocales de conversation naturelle avec pistes séparées en anglais américain collectées par téléphone portable

Données vocales de conversation naturelle avec pistes séparées en anglais américain collectées par téléphone portable, enregistré sur la base d'une simulation de thèmes courants. Cet ensemble de données est marqué par du contenu textuel, des horodatages de phrases, l'identité du locuteur, le sexe et d'autres attributs, enregistrés par des Amérindiens de différents milieux géographiques et culturels, il garantit une grande exactitude. Cette ressource riche constitue un outil précieux pour la recherche et les applications liées à la reconnaissance vocale. Validé par plusieurs entreprises en intelligence artificielle, il contribue à améliorer les performances des modèles face à la diversité des situations réelles. Nous respectons strictement les réglementations sur la protection des données et de la vie privée, en veillant à préserver la confidentialité et les droits légitimes des utilisateurs tout au long des processus d'acquisition, de stockage et d'utilisation. Toutes les données sont conformes au RGPD, à la CCPA et à la PIPL.

Ensemble de données vocales en anglais américain Ensemble de données vocales multi-flux ensemble de données de dialogue en duplex intégral ensemble de données vocales spontanées données vocales de smartphone ensemble de données audio multicanaux données d'entraînement de reconnaissance vocale ensemble de données de dialogue AI

Données vocales parlées en espagnol mexicain

Données vocales parlées en espagnol mexicain, couvrant des domaines généraux tels que le dialogue, les auto-médias et les émissions de variétés, reflétant des situations interactives du monde réel. Cet ensemble de données est annoté avec divers attributs tels que le contenu textuel, l'identité de l'orateur, le sexe, etc., avec une grande précision et une grande facilité d'utilisation, fournissant de riches ressources pour la recherche et les applications liées à la reconnaissance vocale, et aidant le modèle à bien fonctionner face à la diversité du monde réel. Nous respectons strictement les réglementations sur la protection des données et de la vie privée, en veillant à préserver la confidentialité et les droits légitimes des utilisateurs tout au long des processus d'acquisition, de stockage et d'utilisation. Toutes les données sont conformes au RGPD, à la CCPA et à la PIPL.

Mexique Espagnol Conversation décontractée ASR

460 heures de données vocales en suédois — style oral

Les données vocales en suédois _ conversation informelle, reflètent des situations interactives du monde réel. L’ensemble de données contient des annotations sur le contenu textuel, l’identité et le sexe des locuteurs. Il a été enregistré par des locuteurs natifs suédois issus de différentes régions et cultures. Ces données, précises et faciles à exploiter, représentent une ressource précieuse pour la recherche et les applications en reconnaissance vocale. Elles permettent aux modèles de s’adapter efficacement à la diversité du monde réel. Nous respectons strictement les réglementations relatives à la protection des données et à la vie privée, garantissant la sécurité des utilisateurs durant l’ensemble du processus de collecte, de stockage et d’utilisation. Toutes les données sont conformes au GDPR, au CCPA et à la PIPL.

Suédois spontané ASR

900 heures de données vocales en thaï – style oral

Thaï

conversation informelle

ASR

Niveau de maturité du projet