[{"@type":"PropertyValue","name":"Format","value":"16 kHz, 16 bits, format WAV non compressé, mono"},{"@type":"PropertyValue","name":"Environnement d'enregistrement","value":"Environnement intérieur relativement silencieux, sans réverbération"},{"@type":"PropertyValue","name":"Contenu d'enregistrement","value":"Une liste de sujets est fournie ; les locuteurs en sélectionnent plusieurs qu’ils maîtrisent afin de garantir la fluidité des échanges, puis enregistrent une conversation autour de chaque sujet"},{"@type":"PropertyValue","name":"Intervenants","value":"480 locuteurs originaires de Taïwan, avec une répartition équilibrée entre hommes et femmes"},{"@type":"PropertyValue","name":"Caractéristiques d'annotation","value":"Annotation de phrases individuelles valides, incluant les points de début et de fin, l’identifiant du locuteur, le contenu textuel, ainsi que la présence éventuelle de bruit de fond"},{"@type":"PropertyValue","name":"Pays","value":"Chine"},{"@type":"PropertyValue","name":"Langue","value":"Mandarin (chinois standard)"},{"@type":"PropertyValue","name":"Scène d'application","value":"Reconnaissance vocale ; reconnaissance de l’empreinte vocale"},{"@type":"PropertyValue","name":"Précision","value":"Taux de précision par phrase : 95 %"}]
{"id":1631,"datatype":"1","titleimg":"https://fr.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"534 heures de données vocales en mandarin avec accent taïwanais – conversation naturelle – téléphone mobile","datazy":[{"title":"Format","desc":"Format","content":"16 kHz, 16 bits, format WAV non compressé, mono"},{"title":"Environnement d'enregistrement","desc":"Environnement d'enregistrement","content":"Environnement intérieur relativement silencieux, sans réverbération"},{"title":"Contenu d'enregistrement","desc":"Contenu d'enregistrement","content":"Une liste de sujets est fournie ; les locuteurs en sélectionnent plusieurs qu’ils maîtrisent afin de garantir la fluidité des échanges, puis enregistrent une conversation autour de chaque sujet"},{"title":"Intervenants","desc":"Intervenants","content":"480 locuteurs originaires de Taïwan, avec une répartition équilibrée entre hommes et femmes"},{"title":"Caractéristiques d'annotation","desc":"Caractéristiques d'annotation","content":"Annotation de phrases individuelles valides, incluant les points de début et de fin, l’identifiant du locuteur, le contenu textuel, ainsi que la présence éventuelle de bruit de fond"},{"title":"Pays","desc":"Pays","content":"Chine"},{"title":"Langue","desc":"Langue","content":"Mandarin (chinois standard)"},{"title":"Scène d'application","desc":"Scène d'application","content":"Reconnaissance vocale ; reconnaissance de l’empreinte vocale"},{"title":"Précision","desc":"Précision","content":"Taux de précision par phrase : 95 %"}],"datatag":"Accent Mandarin,Taiwanese,Spontaneous Dialogue","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[],"officialSummary":"Ce corpus de 534 heures de dialogues spontanés en mandarin avec accent taïwanais, collecté via smartphone autour d’une trentaine de thèmes courants, inclut des annotations telles que le contenu textuel, les horodatages, l’identité et le sexe des locuteurs. Il a été enregistré par des locuteurs originaires de Taïwan. Grâce à son haut niveau de précision, ce corpus constitue une ressource précieuse pour les systèmes de reconnaissance vocale. Validé par de nombreuses entreprises d’IA, il offre une grande robustesse face aux situations du monde réel. Le traitement des données est conforme au RGPD, au CCPA et à la PIPL.","dataexampl":null,"datakeyword":["Mandarin avec accent"," taïwanais"," dialogue spontané"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"}]","productNameEn":"534 Hours - Taiwanese Accent Mandarin Spontaneous Dialogue Smartphone speech dataset","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
534 heures de données vocales en mandarin avec accent taïwanais – conversation naturelle – téléphone mobile
Mandarin avec accent
taïwanais
dialogue spontané
Ce corpus de 534 heures de dialogues spontanés en mandarin avec accent taïwanais, collecté via smartphone autour d’une trentaine de thèmes courants, inclut des annotations telles que le contenu textuel, les horodatages, l’identité et le sexe des locuteurs. Il a été enregistré par des locuteurs originaires de Taïwan. Grâce à son haut niveau de précision, ce corpus constitue une ressource précieuse pour les systèmes de reconnaissance vocale. Validé par de nombreuses entreprises d’IA, il offre une grande robustesse face aux situations du monde réel. Le traitement des données est conforme au RGPD, au CCPA et à la PIPL.
Il s'agit d'un ensemble de données payant destiné à un usage commercial, à la recherche et plus encore. Ces Jeux de données prêts à l'emploi et sous licence contribuent au lancement de projets d'IA.
Spécifications
Format
16 kHz, 16 bits, format WAV non compressé, mono
Environnement d'enregistrement
Environnement intérieur relativement silencieux, sans réverbération
Contenu d'enregistrement
Une liste de sujets est fournie ; les locuteurs en sélectionnent plusieurs qu’ils maîtrisent afin de garantir la fluidité des échanges, puis enregistrent une conversation autour de chaque sujet
Intervenants
480 locuteurs originaires de Taïwan, avec une répartition équilibrée entre hommes et femmes
Caractéristiques d'annotation
Annotation de phrases individuelles valides, incluant les points de début et de fin, l’identifiant du locuteur, le contenu textuel, ainsi que la présence éventuelle de bruit de fond
Pays
Chine
Langue
Mandarin (chinois standard)
Scène d'application
Reconnaissance vocale ; reconnaissance de l’empreinte vocale