[{"@type":"PropertyValue","name":"Format","value":"16 kHz, 16 bits, wav non compressé, mono, séparation des canaux de haut-parleurs"},{"@type":"PropertyValue","name":"Environnement d'enregistrement","value":"Intérieur relativement calme, pas d'écho"},{"@type":"PropertyValue","name":"Contenu d'enregistrement","value":"Une liste de sujets est fournie ; l'orateur en sélectionne plusieurs qu'il maîtrise afin d'assurer une conversation fluide et naturelle, et développe un dialogue autour de chaque sujet lors de l'enregistrement"},{"@type":"PropertyValue","name":"Personnel","value":"Environ 800 Amérindiens"},{"@type":"PropertyValue","name":"Caractéristiques de l'annotation","value":"Les phrases uniques valides sont interceptées pour l'annotation, et les résultats de l'annotation incluent l'heure de début et de fin de la phrase unique valide, l'identification du locuteur et le contenu du texte ; Annotation de bruit"},{"@type":"PropertyValue","name":"Pays","value":"États-Unis"},{"@type":"PropertyValue","name":"Langue","value":"Anglais"},{"@type":"PropertyValue","name":"Scénarios d'application","value":"Reconnaissance vocale ; Reconnaissance d'empreintes vocales"},{"@type":"PropertyValue","name":"Taux de précision","value":"98 % de précision des mots"}]
{"id":1770,"datatype":"1","titleimg":"https://fr.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"600 heures de données vocales de conversation naturelle avec pistes séparées en anglais américain collectées par téléphone portable","datazy":[{"title":"Format","desc":"Format","content":"16 kHz, 16 bits, wav non compressé, mono, séparation des canaux de haut-parleurs"},{"title":"Environnement d'enregistrement","desc":"Environnement d'enregistrement","content":"Intérieur relativement calme, pas d'écho"},{"title":"Contenu d'enregistrement","desc":"Contenu d'enregistrement","content":"Une liste de sujets est fournie ; l'orateur en sélectionne plusieurs qu'il maîtrise afin d'assurer une conversation fluide et naturelle, et développe un dialogue autour de chaque sujet lors de l'enregistrement"},{"title":"Personnel","desc":"Personnel","content":"Environ 800 Amérindiens"},{"title":"Caractéristiques de l'annotation","desc":"Caractéristiques de l'annotation","content":"Les phrases uniques valides sont interceptées pour l'annotation, et les résultats de l'annotation incluent l'heure de début et de fin de la phrase unique valide, l'identification du locuteur et le contenu du texte ; Annotation de bruit"},{"title":"Pays","desc":"Pays","content":"États-Unis"},{"title":"Langue","desc":"Langue","content":"Anglais"},{"title":"Scénarios d'application","desc":"Scénarios d'application","content":"Reconnaissance vocale ; Reconnaissance d'empreintes vocales"},{"title":"Taux de précision","desc":"Taux de précision","content":"98 % de précision des mots"}],"datatag":"full duplex","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[],"officialSummary":"Données vocales de conversation naturelle avec pistes séparées en anglais américain collectées par téléphone portable, enregistré sur la base d'une simulation de thèmes courants. Cet ensemble de données est marqué par du contenu textuel, des horodatages de phrases, l'identité du locuteur, le sexe et d'autres attributs, enregistrés par des Amérindiens de différents milieux géographiques et culturels, il garantit une grande exactitude. Cette ressource riche constitue un outil précieux pour la recherche et les applications liées à la reconnaissance vocale. Validé par plusieurs entreprises en intelligence artificielle, il contribue à améliorer les performances des modèles face à la diversité des situations réelles. Nous respectons strictement les réglementations sur la protection des données et de la vie privée, en veillant à préserver la confidentialité et les droits légitimes des utilisateurs tout au long des processus d'acquisition, de stockage et d'utilisation. Toutes les données sont conformes au RGPD, à la CCPA et à la PIPL.","dataexampl":null,"datakeyword":["Ensemble de données vocales en anglais américain"," Ensemble de données vocales multi-flux"," ensemble de données de dialogue en duplex intégral"," ensemble de données vocales spontanées"," données vocales de smartphone"," ensemble de données audio multicanaux"," données d'entraînement de reconnaissance vocale"," ensemble de données de dialogue AI"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"}]","productNameEn":"170 Hours - American English Full-Duplex Spontaneous Dialogue Smartphone speech dataset","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
600 heures de données vocales de conversation naturelle avec pistes séparées en anglais américain collectées par téléphone portable
Ensemble de données vocales en anglais américain
Ensemble de données vocales multi-flux
ensemble de données de dialogue en duplex intégral
ensemble de données vocales spontanées
données vocales de smartphone
ensemble de données audio multicanaux
données d'entraînement de reconnaissance vocale
ensemble de données de dialogue AI
Données vocales de conversation naturelle avec pistes séparées en anglais américain collectées par téléphone portable, enregistré sur la base d'une simulation de thèmes courants. Cet ensemble de données est marqué par du contenu textuel, des horodatages de phrases, l'identité du locuteur, le sexe et d'autres attributs, enregistrés par des Amérindiens de différents milieux géographiques et culturels, il garantit une grande exactitude. Cette ressource riche constitue un outil précieux pour la recherche et les applications liées à la reconnaissance vocale. Validé par plusieurs entreprises en intelligence artificielle, il contribue à améliorer les performances des modèles face à la diversité des situations réelles. Nous respectons strictement les réglementations sur la protection des données et de la vie privée, en veillant à préserver la confidentialité et les droits légitimes des utilisateurs tout au long des processus d'acquisition, de stockage et d'utilisation. Toutes les données sont conformes au RGPD, à la CCPA et à la PIPL.
Il s'agit d'un ensemble de données payant destiné à un usage commercial, à la recherche et plus encore. Ces Jeux de données prêts à l'emploi et sous licence contribuent au lancement de projets d'IA.
Spécifications
Format
16 kHz, 16 bits, wav non compressé, mono, séparation des canaux de haut-parleurs
Environnement d'enregistrement
Intérieur relativement calme, pas d'écho
Contenu d'enregistrement
Une liste de sujets est fournie ; l'orateur en sélectionne plusieurs qu'il maîtrise afin d'assurer une conversation fluide et naturelle, et développe un dialogue autour de chaque sujet lors de l'enregistrement
Personnel
Environ 800 Amérindiens
Caractéristiques de l'annotation
Les phrases uniques valides sont interceptées pour l'annotation, et les résultats de l'annotation incluent l'heure de début et de fin de la phrase unique valide, l'identification du locuteur et le contenu du texte ; Annotation de bruit