[{"@type":"PropertyValue","name":"Format","value":"16 kHz, 16 bits, wav non compressé, mono, séparation des canaux de haut-parleurs"},{"@type":"PropertyValue","name":"Environnement d'enregistrement","value":"Intérieur relativement calme, pas d'écho"},{"@type":"PropertyValue","name":"Contenu d'enregistrement","value":"Une liste de sujets est fournie ; l'orateur en sélectionne plusieurs qu'il maîtrise afin d'assurer une conversation fluide et naturelle, et développe un dialogue autour de chaque sujet lors de l'enregistrement"},{"@type":"PropertyValue","name":"Personnel","value":"Environ 800 Philippins natifs"},{"@type":"PropertyValue","name":"Caractéristiques de l'annotation","value":"Les phrases uniques valides sont interceptées pour l'annotation, et les résultats de l'annotation incluent l'heure de début et de fin de la phrase unique valide, l'identification du locuteur et le contenu du texte ; Annotation de bruit"},{"@type":"PropertyValue","name":"Pays","value":"Philippines"},{"@type":"PropertyValue","name":"Langue","value":"Anglais"},{"@type":"PropertyValue","name":"Scénarios d'application","value":"Reconnaissance vocale ; Reconnaissance d'empreintes vocales"},{"@type":"PropertyValue","name":"Taux de précision","value":"98 % de précision des mots"}]
{"id":1771,"datatype":"1","titleimg":"https://fr.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"600 heures de données vocales de conversation naturelle avec pistes séparées en anglais philippin collectées par téléphone portable","datazy":[{"title":"Format","desc":"Format","content":"16 kHz, 16 bits, wav non compressé, mono, séparation des canaux de haut-parleurs"},{"title":"Environnement d'enregistrement","desc":"Environnement d'enregistrement","content":"Intérieur relativement calme, pas d'écho"},{"title":"Contenu d'enregistrement","desc":"Contenu d'enregistrement","content":"Une liste de sujets est fournie ; l'orateur en sélectionne plusieurs qu'il maîtrise afin d'assurer une conversation fluide et naturelle, et développe un dialogue autour de chaque sujet lors de l'enregistrement"},{"title":"Personnel","desc":"Personnel","content":"Environ 800 Philippins natifs"},{"title":"Caractéristiques de l'annotation","desc":"Caractéristiques de l'annotation","content":"Les phrases uniques valides sont interceptées pour l'annotation, et les résultats de l'annotation incluent l'heure de début et de fin de la phrase unique valide, l'identification du locuteur et le contenu du texte ; Annotation de bruit"},{"title":"Pays","desc":"Pays","content":"Philippines"},{"title":"Langue","desc":"Langue","content":"Anglais"},{"title":"Scénarios d'application","desc":"Scénarios d'application","content":"Reconnaissance vocale ; Reconnaissance d'empreintes vocales"},{"title":"Taux de précision","desc":"Taux de précision","content":"98 % de précision des mots"}],"datatag":"full-duplex,Dialogue","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[],"officialSummary":"Données vocales de conversation naturelle avec pistes séparées en anglais philippin collectées par téléphone portable, enregistré sur la base d'une simulation de thèmes courants. Cet ensemble de données est marqué par du contenu textuel, des horodatages de phrases, l'identité du locuteur, le sexe et d'autres attributs, enregistré par des natifs philippins de différents milieux géographiques et culturels, il garantit une grande exactitude. Cette ressource riche constitue un outil précieux pour la recherche et les applications liées à la reconnaissance vocale. Validé par plusieurs entreprises en intelligence artificielle, il contribue à améliorer les performances des modèles face à la diversité des situations réelles. Nous respectons strictement les réglementations sur la protection des données et de la vie privée, en veillant à préserver la confidentialité et les droits légitimes des utilisateurs tout au long des processus d'acquisition, de stockage et d'utilisation. Toutes les données sont conformes au RGPD, à la CCPA et à la PIPL.","dataexampl":null,"datakeyword":["dialogue AI dataset"," données d'entraînement à la reconnaissance vocale"," ensemble de données audio multicanaux"," données vocales de smartphone"," ensemble de données de parole spontanée"," ensemble de données vocales multi-flux"," ensemble de données vocales en anglais des Philippines"," ensemble de données vocales en duplex intégral"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"}]","productNameEn":"460 Hours - English(Philippine) Full-Duplex Spontaneous Dialogue Smartphone speech dataset","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
600 heures de données vocales de conversation naturelle avec pistes séparées en anglais philippin collectées par téléphone portable
dialogue AI dataset
données d'entraînement à la reconnaissance vocale
ensemble de données audio multicanaux
données vocales de smartphone
ensemble de données de parole spontanée
ensemble de données vocales multi-flux
ensemble de données vocales en anglais des Philippines
ensemble de données vocales en duplex intégral
Données vocales de conversation naturelle avec pistes séparées en anglais philippin collectées par téléphone portable, enregistré sur la base d'une simulation de thèmes courants. Cet ensemble de données est marqué par du contenu textuel, des horodatages de phrases, l'identité du locuteur, le sexe et d'autres attributs, enregistré par des natifs philippins de différents milieux géographiques et culturels, il garantit une grande exactitude. Cette ressource riche constitue un outil précieux pour la recherche et les applications liées à la reconnaissance vocale. Validé par plusieurs entreprises en intelligence artificielle, il contribue à améliorer les performances des modèles face à la diversité des situations réelles. Nous respectons strictement les réglementations sur la protection des données et de la vie privée, en veillant à préserver la confidentialité et les droits légitimes des utilisateurs tout au long des processus d'acquisition, de stockage et d'utilisation. Toutes les données sont conformes au RGPD, à la CCPA et à la PIPL.
Il s'agit d'un ensemble de données payant destiné à un usage commercial, à la recherche et plus encore. Ces Jeux de données prêts à l'emploi et sous licence contribuent au lancement de projets d'IA.
Spécifications
Format
16 kHz, 16 bits, wav non compressé, mono, séparation des canaux de haut-parleurs
Environnement d'enregistrement
Intérieur relativement calme, pas d'écho
Contenu d'enregistrement
Une liste de sujets est fournie ; l'orateur en sélectionne plusieurs qu'il maîtrise afin d'assurer une conversation fluide et naturelle, et développe un dialogue autour de chaque sujet lors de l'enregistrement
Personnel
Environ 800 Philippins natifs
Caractéristiques de l'annotation
Les phrases uniques valides sont interceptées pour l'annotation, et les résultats de l'annotation incluent l'heure de début et de fin de la phrase unique valide, l'identification du locuteur et le contenu du texte ; Annotation de bruit