en

Please fill in your name

Mobile phone format error

Veuillez entrer le téléphone

Veuillez entrer le nom de votre entreprise

Veuillez entrer votre e-mail professionnel

Veuillez entrer l'exigence de données

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

L'exigence de données ne peut pas faire moins de 5 mots et ne peut pas être constituée uniquement de chiffres

500 heures de dialogues naturels en dialecte de Liuzhou (annotations bilingues) - Données vocales collectées par smartphone

Dialecte
liuzhou
guangxi
Conversation

Données vocales en dialecte de Liuzhou - Dialogue (téléphone), enregistrées par des locuteurs conversant librement. Ce jeu de données est annoté avec le contenu textuel, les horodatages des phrases, l'identité du locuteur, le genre et d'autres attributs. Enregistré par des locuteurs natifs du dialecte, il est d'une grande précision et constitue une ressource riche pour la recherche et les applications liées à la reconnaissance vocale. Validé par de nombreuses entreprises d'IA : il aide les modèles à exceller face à la diversité du monde réel. Nous suivons strictement les lois sur la protection des données et les règlements sur la vie privée, garantissant le respect de la vie privée et des droits des utilisateurs lors de la collecte, du stockage et de l'utilisation des données. Toutes les données sont conformes au RGPD, au CCPA, et au PIPL.

Données payantes
Il s'agit d'un ensemble de données payant destiné à un usage commercial, à la recherche et plus encore. Ces Jeux de données prêts à l'emploi et sous licence contribuent au lancement de projets d'IA.
SpécificationsSpécifications
Format
16 kHz/24 kHz, 16 bits, WAV non compressé, mono
Environnement d'enregistrement
Intérieur relativement calme, sans écho
Contenu de l'enregistrement
Une liste de sujets était fournie, les locuteurs en choisissaient plusieurs qui leur étaient familiers pour assurer la fluidité et le naturel des conversations. Pour chaque sujet, un dialogue était engagé et enregistré.
Personnel
Environ 500 locuteurs, provenant des villes et districts de la région de Liuzhou, ratio hommes-femmes équilibré, couvrant plusieurs tranches d'âge.
Caractéristiques des annotations
Transcription du contenu texte, explication en mandarin standard, points de début et de fin des phrases valides, identifiant du locuteur.
Appareil
Téléphones Android, téléphones Apple
Langue
Dialecte de Liuzhou
Précision
Précision au niveau du caractère : 98% ; Précision des annotations en mandarin : 90%
Scénarios d'application
Reconnaissance vocale, reconnaissance du locuteur
Échantillon Exemple
  • Audio

    但是人家讲㖏,有好有没好哦,那手机也害人哦, 但是人家说呢,有好有不好哦,那手机也害人哦,

  • Audio

    没认得运用它,就是,对你来讲,就是坏滴啊。 不知道运用它,就是,对你来说,就是坏的啊。

  • Audio

    [OVERLAP/]大人[/OVERLAP]的话,认得,赚钱哦,认得使用它滴功能。 大人的话,知道,赚钱哦,知道使用它的功能。

  • Audio

    像那种娃崽他们没认得,控制自己滴, 像那些小孩他们不知道,控制自己的,

  • Audio

    [OVERLAP/]但是[/OVERLAP]你控制点,合理滴。 但是你控制些,合理的。

Données recommandéesJeux de données recommandés
600 heures de données vocales de conversation naturelle avec pistes séparées en anglais philippin collectées par téléphone portable

Données vocales de conversation naturelle avec pistes séparées en anglais philippin collectées par téléphone portable, enregistré sur la base d'une simulation de thèmes courants. Cet ensemble de données est marqué par du contenu textuel, des horodatages de phrases, l'identité du locuteur, le sexe et d'autres attributs, enregistré par des natifs philippins de différents milieux géographiques et culturels, il garantit une grande exactitude. Cette ressource riche constitue un outil précieux pour la recherche et les applications liées à la reconnaissance vocale. Validé par plusieurs entreprises en intelligence artificielle, il contribue à améliorer les performances des modèles face à la diversité des situations réelles. Nous respectons strictement les réglementations sur la protection des données et de la vie privée, en veillant à préserver la confidentialité et les droits légitimes des utilisateurs tout au long des processus d'acquisition, de stockage et d'utilisation. Toutes les données sont conformes au RGPD, à la CCPA et à la PIPL.

dialogue AI dataset données d'entraînement à la reconnaissance vocale ensemble de données audio multicanaux données vocales de smartphone ensemble de données de parole spontanée ensemble de données vocales multi-flux ensemble de données vocales en anglais des Philippines ensemble de données vocales en duplex intégral
600 heures de données vocales de conversation naturelle avec pistes séparées en anglais américain collectées par téléphone portable

Données vocales de conversation naturelle avec pistes séparées en anglais américain collectées par téléphone portable, enregistré sur la base d'une simulation de thèmes courants. Cet ensemble de données est marqué par du contenu textuel, des horodatages de phrases, l'identité du locuteur, le sexe et d'autres attributs, enregistrés par des Amérindiens de différents milieux géographiques et culturels, il garantit une grande exactitude. Cette ressource riche constitue un outil précieux pour la recherche et les applications liées à la reconnaissance vocale. Validé par plusieurs entreprises en intelligence artificielle, il contribue à améliorer les performances des modèles face à la diversité des situations réelles. Nous respectons strictement les réglementations sur la protection des données et de la vie privée, en veillant à préserver la confidentialité et les droits légitimes des utilisateurs tout au long des processus d'acquisition, de stockage et d'utilisation. Toutes les données sont conformes au RGPD, à la CCPA et à la PIPL.

Ensemble de données vocales en anglais américain Ensemble de données vocales multi-flux ensemble de données de dialogue en duplex intégral ensemble de données vocales spontanées données vocales de smartphone ensemble de données audio multicanaux données d'entraînement de reconnaissance vocale ensemble de données de dialogue AI
Veuillez nous indiquer vos besoins particuliers

En soumettant, j’accepte la politique de confidentialité

81cf34b0-1b2b-42b1-8a58-d2fe6dc0b042

1c96257f-f829-42c7-bbfb-0a0f5027619a