[{"@type":"PropertyValue","name":"Format","value":"16 kHz, 16 bits, wav non compressé, mono, séparation des canaux de haut-parleurs"},{"@type":"PropertyValue","name":"Environnement d'enregistrement","value":"Intérieur relativement calme, pas d'écho"},{"@type":"PropertyValue","name":"Contenu d'enregistrement","value":"Une liste de sujets est fournie ; l'orateur en sélectionne plusieurs qu'il maîtrise afin d'assurer une conversation fluide et naturelle, et développe un dialogue autour de chaque sujet lors de l'enregistrement"},{"@type":"PropertyValue","name":"Personnel","value":"Environ 1 500 Philippins de souche"},{"@type":"PropertyValue","name":"Caractéristiques de l'annotation","value":"Les phrases uniques valides sont interceptées pour l'annotation, et les résultats de l'annotation incluent l'heure de début et de fin de la phrase unique valide, l'identification du locuteur et le contenu du texte ; Annotation de bruit"},{"@type":"PropertyValue","name":"Pays","value":"Philippines"},{"@type":"PropertyValue","name":"Langue","value":"Tagalog"},{"@type":"PropertyValue","name":"Scénarios d'application","value":"Reconnaissance vocale ; Reconnaissance d'empreintes vocales"},{"@type":"PropertyValue","name":"Taux de précision","value":"98 % de précision des mots"}]
{"id":1700,"datatype":"1","titleimg":"https://fr.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"1100 heures de données vocales de conversation naturelle avec pistes séparées en tagalog collectées par téléphone portable","datazy":[{"title":"Format","desc":"Format","content":"16 kHz, 16 bits, wav non compressé, mono, séparation des canaux de haut-parleurs"},{"title":"Environnement d'enregistrement","desc":"Environnement d'enregistrement","content":"Intérieur relativement calme, pas d'écho"},{"title":"Contenu d'enregistrement","desc":"Contenu d'enregistrement","content":"Une liste de sujets est fournie ; l'orateur en sélectionne plusieurs qu'il maîtrise afin d'assurer une conversation fluide et naturelle, et développe un dialogue autour de chaque sujet lors de l'enregistrement"},{"title":"Personnel","desc":"Personnel","content":"Environ 1 500 Philippins de souche"},{"title":"Caractéristiques de l'annotation","desc":"Caractéristiques de l'annotation","content":"Les phrases uniques valides sont interceptées pour l'annotation, et les résultats de l'annotation incluent l'heure de début et de fin de la phrase unique valide, l'identification du locuteur et le contenu du texte ; Annotation de bruit"},{"title":"Pays","desc":"Pays","content":"Philippines"},{"title":"Langue","desc":"Langue","content":"Tagalog"},{"title":"Scénarios d'application","desc":"Scénarios d'application","content":"Reconnaissance vocale ; Reconnaissance d'empreintes vocales"},{"title":"Taux de précision","desc":"Taux de précision","content":"98 % de précision des mots"}],"datatag":" full duplex","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[],"officialSummary":"Données vocales de conversation naturelle avec pistes séparées en tagalog collectées par téléphone portable, enregistré sur la base d'une simulation de thèmes courants. Cet ensemble de données est marqué par du contenu textuel, des horodatages de phrases, l'identité du locuteur, le sexe et d'autres attributs, enregistré par des natifs philippins de différents milieux géographiques et culturels, il garantit une grande exactitude. Cette ressource riche constitue un outil précieux pour la recherche et les applications liées à la reconnaissance vocale. Validé par plusieurs entreprises en intelligence artificielle, il contribue à améliorer les performances des modèles face à la diversité des situations réelles. Nous respectons strictement les réglementations sur la protection des données et de la vie privée, en veillant à préserver la confidentialité et les droits légitimes des utilisateurs tout au long des processus d'acquisition, de stockage et d'utilisation. Toutes les données sont conformes au RGPD, à la CCPA et à la PIPL.","dataexampl":null,"datakeyword":["Ensemble de données vocales multiflux"," Ensemble de données de dialogue en duplex intégral"," Ensemble de données audio multicanaux"," données d'entraînement à la reconnaissance vocale"," Ensemble de données vocales multicanaux"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"}]","productNameEn":"950 Hours - Tagalog Full-Duplex Spontaneous Dialogue Smartphone speech dataset","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
1100 heures de données vocales de conversation naturelle avec pistes séparées en tagalog collectées par téléphone portable
Ensemble de données vocales multiflux
Ensemble de données de dialogue en duplex intégral
Ensemble de données audio multicanaux
données d'entraînement à la reconnaissance vocale
Ensemble de données vocales multicanaux
Données vocales de conversation naturelle avec pistes séparées en tagalog collectées par téléphone portable, enregistré sur la base d'une simulation de thèmes courants. Cet ensemble de données est marqué par du contenu textuel, des horodatages de phrases, l'identité du locuteur, le sexe et d'autres attributs, enregistré par des natifs philippins de différents milieux géographiques et culturels, il garantit une grande exactitude. Cette ressource riche constitue un outil précieux pour la recherche et les applications liées à la reconnaissance vocale. Validé par plusieurs entreprises en intelligence artificielle, il contribue à améliorer les performances des modèles face à la diversité des situations réelles. Nous respectons strictement les réglementations sur la protection des données et de la vie privée, en veillant à préserver la confidentialité et les droits légitimes des utilisateurs tout au long des processus d'acquisition, de stockage et d'utilisation. Toutes les données sont conformes au RGPD, à la CCPA et à la PIPL.
Il s'agit d'un ensemble de données payant destiné à un usage commercial, à la recherche et plus encore. Ces Jeux de données prêts à l'emploi et sous licence contribuent au lancement de projets d'IA.
Spécifications
Format
16 kHz, 16 bits, wav non compressé, mono, séparation des canaux de haut-parleurs
Environnement d'enregistrement
Intérieur relativement calme, pas d'écho
Contenu d'enregistrement
Une liste de sujets est fournie ; l'orateur en sélectionne plusieurs qu'il maîtrise afin d'assurer une conversation fluide et naturelle, et développe un dialogue autour de chaque sujet lors de l'enregistrement
Personnel
Environ 1 500 Philippins de souche
Caractéristiques de l'annotation
Les phrases uniques valides sont interceptées pour l'annotation, et les résultats de l'annotation incluent l'heure de début et de fin de la phrase unique valide, l'identification du locuteur et le contenu du texte ; Annotation de bruit