en

Please fill in your name

Mobile phone format error

Veuillez entrer le téléphone

Veuillez entrer le nom de votre entreprise

Veuillez entrer votre e-mail professionnel

Veuillez entrer l'exigence de données

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

L'exigence de données ne peut pas faire moins de 5 mots et ne peut pas être constituée uniquement de chiffres

147 heures de dialogues naturels en philippin – canal téléphonique

Philippin
conversationnel
téléphone
données vocales tagalog
données audio tagalog

Ce corpus de conversations téléphoniques en philippin a été conçu à partir d’enregistrements simulés autour d’une trentaine de thématiques courantes. Il est enrichi de métadonnées incluant les transcriptions, les horodatages par phrase, l’identité et le genre des locuteurs. Enregistré par environ 264 locuteurs natifs provenant de diverses régions et cultures des Philippines, ce jeu de données se distingue par sa grande précision. Il constitue une ressource stratégique pour les recherches et applications en reconnaissance vocale, validée par plusieurs entreprises du secteur de l’IA. L’ensemble du processus de collecte, de stockage et d’exploitation respecte rigoureusement les normes de protection des données personnelles (RGPD, CCPA, PIPL).

Données payantes
Il s'agit d'un ensemble de données payant destiné à un usage commercial, à la recherche et plus encore. Ces Jeux de données prêts à l'emploi et sous licence contribuent au lancement de projets d'IA.
SpécificationsSpécifications
Format
8 kHz, 8 bits, format pcm ulaw/alaw, mono;
Catégorisation du contenu
Les locuteurs sélectionnent plusieurs sujets familiers à partir d’une liste prédéfinie, et enregistrent des dialogues fluides et naturels;
Conditions d'enregistrement
Environnement intérieur relativement silencieux, sans réverbération;
Dispositifs d'enregistrement
Système d’enregistrement téléphonique;
Informations d'enregisteur
264 participants au total, dont 99 hommes et 165 femmes ;
Pays
Philippines
Code de région linguistique
tl-PH;
Langue
Philippin
Caractéristiques d'annotation
Annotation du contenu textuel, des horodatages de phrases, de l’identifiant du locuteur, du sexe et du bruit de fond;
Précision
Taux de précision lexicale : 98%;
Échantillon Exemple
  • Audio

    Ang bata na nasa wastong edad ay dadaan sa ibat-ibang yugto ng pag-aaral.

  • Audio

    Pagkatapos niya makapagtapos ng sekondarya, tutungo naman ang mag-aaral sa kolehiyo. [N]

  • Audio

    Hindi lamang sa paaralan naka-sentro ang edukasyon. Ito ay makikita rin maging sa ating tahanan at kapaligiran.

  • Audio

    Simula, elementarya, patungo sa ekse- sekondarya o mataas na paaralan.

  • Audio

    Simula pa man nung noong tayo ay mga bata pa, tinuturuan na tayo ng ating mga magulang ng mabuting asal. [N]

Données recommandéesJeux de données recommandés
600 heures de données vocales de conversation naturelle avec pistes séparées en anglais philippin collectées par téléphone portable

Données vocales de conversation naturelle avec pistes séparées en anglais philippin collectées par téléphone portable, enregistré sur la base d'une simulation de thèmes courants. Cet ensemble de données est marqué par du contenu textuel, des horodatages de phrases, l'identité du locuteur, le sexe et d'autres attributs, enregistré par des natifs philippins de différents milieux géographiques et culturels, il garantit une grande exactitude. Cette ressource riche constitue un outil précieux pour la recherche et les applications liées à la reconnaissance vocale. Validé par plusieurs entreprises en intelligence artificielle, il contribue à améliorer les performances des modèles face à la diversité des situations réelles. Nous respectons strictement les réglementations sur la protection des données et de la vie privée, en veillant à préserver la confidentialité et les droits légitimes des utilisateurs tout au long des processus d'acquisition, de stockage et d'utilisation. Toutes les données sont conformes au RGPD, à la CCPA et à la PIPL.

dialogue AI dataset données d'entraînement à la reconnaissance vocale ensemble de données audio multicanaux données vocales de smartphone ensemble de données de parole spontanée ensemble de données vocales multi-flux ensemble de données vocales en anglais des Philippines ensemble de données vocales en duplex intégral
600 heures de données vocales de conversation naturelle avec pistes séparées en anglais américain collectées par téléphone portable

Données vocales de conversation naturelle avec pistes séparées en anglais américain collectées par téléphone portable, enregistré sur la base d'une simulation de thèmes courants. Cet ensemble de données est marqué par du contenu textuel, des horodatages de phrases, l'identité du locuteur, le sexe et d'autres attributs, enregistrés par des Amérindiens de différents milieux géographiques et culturels, il garantit une grande exactitude. Cette ressource riche constitue un outil précieux pour la recherche et les applications liées à la reconnaissance vocale. Validé par plusieurs entreprises en intelligence artificielle, il contribue à améliorer les performances des modèles face à la diversité des situations réelles. Nous respectons strictement les réglementations sur la protection des données et de la vie privée, en veillant à préserver la confidentialité et les droits légitimes des utilisateurs tout au long des processus d'acquisition, de stockage et d'utilisation. Toutes les données sont conformes au RGPD, à la CCPA et à la PIPL.

Ensemble de données vocales en anglais américain Ensemble de données vocales multi-flux ensemble de données de dialogue en duplex intégral ensemble de données vocales spontanées données vocales de smartphone ensemble de données audio multicanaux données d'entraînement de reconnaissance vocale ensemble de données de dialogue AI
Veuillez nous indiquer vos besoins particuliers

En soumettant, j’accepte la politique de confidentialité

c4c93db7-db04-438f-9b38-018a0e8cae39

35a9aae0-c4cc-4126-9498-96906f6174ab