[{"@type":"PropertyValue","name":"Format","value":"Microphone - 48 kHz, 16 bits, wav non compressé, mono ; Téléphone portable - 24kHz, 16bit, wav non compressé, mono"},{"@type":"PropertyValue","name":"Environnement d'enregistrement","value":"Intérieur relativement calme, pas d'écho ;"},{"@type":"PropertyValue","name":"Contenu d'enregistrement","value":"Une liste de sujets est fournie ; l'orateur en sélectionne plusieurs qu'il maîtrise afin d'assurer une conversation fluide et naturelle, et développe un dialogue autour de chaque sujet lors de l'enregistrement"},{"@type":"PropertyValue","name":"Personnel","value":"Environ 3 600 personnes enregistrées, avec un rapport équilibré d'hommes et de femmes, couvrant plusieurs groupes d'âge"},{"@type":"PropertyValue","name":"Caractéristiques de l'annotation","value":"Annotation du contenu textuel, traduction en mandarin standard, points de début et de fin des phrases valides, identifiant du locuteur"},{"@type":"PropertyValue","name":"Appareil","value":"Carte son + microphone hi-fi / téléphone portable"},{"@type":"PropertyValue","name":"Langue","value":"Mandarin"},{"@type":"PropertyValue","name":"Taux de précision","value":"Précision caractère 99 %"},{"@type":"PropertyValue","name":"Scénarios d'application","value":"Reconnaissance vocale, reconnaissance d'empreintes vocales"}]
{"id":1890,"datatype":"1","titleimg":"https://fr.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"3000 heures de données vocales de conversation naturelle en mandarin pleinement duplex","datazy":[{"title":"Format","desc":"Format","content":"Microphone - 48 kHz, 16 bits, wav non compressé, mono ; Téléphone portable - 24kHz, 16bit, wav non compressé, mono"},{"title":"Environnement d'enregistrement","desc":"Environnement d'enregistrement","content":"Intérieur relativement calme, pas d'écho ;"},{"title":"Contenu d'enregistrement","desc":"Contenu d'enregistrement","content":"Une liste de sujets est fournie ; l'orateur en sélectionne plusieurs qu'il maîtrise afin d'assurer une conversation fluide et naturelle, et développe un dialogue autour de chaque sujet lors de l'enregistrement"},{"title":"Personnel","desc":"Personnel","content":"Environ 3 600 personnes enregistrées, avec un rapport équilibré d'hommes et de femmes, couvrant plusieurs groupes d'âge"},{"title":"Caractéristiques de l'annotation","desc":"Caractéristiques de l'annotation","content":"Annotation du contenu textuel, traduction en mandarin standard, points de début et de fin des phrases valides, identifiant du locuteur"},{"title":"Appareil","desc":"Appareil","content":"Carte son + microphone hi-fi / téléphone portable"},{"title":"Langue","desc":"Langue","content":"Mandarin"},{"title":"Taux de précision","desc":"Taux de précision","content":"Précision caractère 99 %"},{"title":"Scénarios d'application","desc":"Scénarios d'application","content":"Reconnaissance vocale, reconnaissance d'empreintes vocales"}],"datatag":"","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[],"officialSummary":"Données vocales de conversation naturelle en mandarin pleinement duplex, enregistrées sur la base de conversations sur des sujets courants. Cet ensemble de données est marqué avec une variété d'attributs tels que le contenu du texte, l'horodatage des phrases, l'identité du locuteur, le sexe, etc., il garantit une grande exactitude. Cette ressource riche constitue un outil précieux pour la recherche et les applications liées à la reconnaissance vocale. Validé par plusieurs entreprises en intelligence artificielle, il contribue à améliorer les performances des modèles face à la diversité des situations réelles. Nous respectons strictement les réglementations sur la protection des données et de la vie privée, en veillant à préserver la confidentialité et les droits légitimes des utilisateurs tout au long des processus d'acquisition, de stockage et d'utilisation. Toutes les données sont conformes au RGPD, à la CCPA et à la PIPL.","dataexampl":null,"datakeyword":["Full-Duplex"," Dialogues"," Mandarin"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"}]","productNameEn":"4600 Hours - Mandarin Full-Duplex Spontaneous Dialogue Speech Dataset","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
3000 heures de données vocales de conversation naturelle en mandarin pleinement duplex
Full-Duplex
Dialogues
Mandarin
Données vocales de conversation naturelle en mandarin pleinement duplex, enregistrées sur la base de conversations sur des sujets courants. Cet ensemble de données est marqué avec une variété d'attributs tels que le contenu du texte, l'horodatage des phrases, l'identité du locuteur, le sexe, etc., il garantit une grande exactitude. Cette ressource riche constitue un outil précieux pour la recherche et les applications liées à la reconnaissance vocale. Validé par plusieurs entreprises en intelligence artificielle, il contribue à améliorer les performances des modèles face à la diversité des situations réelles. Nous respectons strictement les réglementations sur la protection des données et de la vie privée, en veillant à préserver la confidentialité et les droits légitimes des utilisateurs tout au long des processus d'acquisition, de stockage et d'utilisation. Toutes les données sont conformes au RGPD, à la CCPA et à la PIPL.
Il s'agit d'un ensemble de données payant destiné à un usage commercial, à la recherche et plus encore. Ces Jeux de données prêts à l'emploi et sous licence contribuent au lancement de projets d'IA.
Spécifications
Format
Microphone - 48 kHz, 16 bits, wav non compressé, mono ; Téléphone portable - 24kHz, 16bit, wav non compressé, mono
Environnement d'enregistrement
Intérieur relativement calme, pas d'écho ;
Contenu d'enregistrement
Une liste de sujets est fournie ; l'orateur en sélectionne plusieurs qu'il maîtrise afin d'assurer une conversation fluide et naturelle, et développe un dialogue autour de chaque sujet lors de l'enregistrement
Personnel
Environ 3 600 personnes enregistrées, avec un rapport équilibré d'hommes et de femmes, couvrant plusieurs groupes d'âge
Caractéristiques de l'annotation
Annotation du contenu textuel, traduction en mandarin standard, points de début et de fin des phrases valides, identifiant du locuteur