[{"@type":"PropertyValue","name":"Format","value":"24 kHz, 16 bits, wav non compressé, mono"},{"@type":"PropertyValue","name":"Environnement d'enregistrement","value":"Intérieur relativement calme, pas d'écho"},{"@type":"PropertyValue","name":"Contenu d'enregistrement","value":"Une liste de sujets est fournie ; l'orateur en sélectionne plusieurs qu'il maîtrise afin d'assurer une conversation fluide et naturelle, et développe un dialogue autour de chaque sujet lors de l'enregistrement"},{"@type":"PropertyValue","name":"Personnel","value":"Environ 500 enregistreurs, originaires des comtés et des villes de Wuhan, avec un rapport équilibré d'hommes et de femmes, couvrant plusieurs groupes d'âge"},{"@type":"PropertyValue","name":"Caractéristiques de l'annotation","value":"Annotation du contenu textuel, traduction en mandarin standard, points de début et de fin des phrases valides, identifiant du locuteur"},{"@type":"PropertyValue","name":"Appareil","value":"Téléphones Android, Téléphones Apple"},{"@type":"PropertyValue","name":"Langue","value":"Dialecte de Wuhan"},{"@type":"PropertyValue","name":"Taux de précision","value":"Précision caractère 98 % ; Précision de la traduction en mandarin standard 90%"},{"@type":"PropertyValue","name":"Scénarios d'application","value":"Reconnaissance vocale, reconnaissance d'empreintes vocales"}]
{"id":1686,"datatype":"1","titleimg":"https://fr.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"500 heures de données vocales de conversation naturelle en dialecte de Wuhan (annotation bilingue) collectées par téléphone portable","datazy":[{"title":"Format","desc":"Format","content":"24 kHz, 16 bits, wav non compressé, mono"},{"title":"Environnement d'enregistrement","desc":"Environnement d'enregistrement","content":"Intérieur relativement calme, pas d'écho"},{"title":"Contenu d'enregistrement","desc":"Contenu d'enregistrement","content":"Une liste de sujets est fournie ; l'orateur en sélectionne plusieurs qu'il maîtrise afin d'assurer une conversation fluide et naturelle, et développe un dialogue autour de chaque sujet lors de l'enregistrement"},{"title":"Personnel","desc":"Personnel","content":"Environ 500 enregistreurs, originaires des comtés et des villes de Wuhan, avec un rapport équilibré d'hommes et de femmes, couvrant plusieurs groupes d'âge"},{"title":"Caractéristiques de l'annotation","desc":"Caractéristiques de l'annotation","content":"Annotation du contenu textuel, traduction en mandarin standard, points de début et de fin des phrases valides, identifiant du locuteur"},{"title":"Appareil","desc":"Appareil","content":"Téléphones Android, Téléphones Apple"},{"title":"Langue","desc":"Langue","content":"Dialecte de Wuhan"},{"title":"Taux de précision","desc":"Taux de précision","content":"Précision caractère 98 % ; Précision de la traduction en mandarin standard 90%"},{"title":"Scénarios d'application","desc":"Scénarios d'application","content":"Reconnaissance vocale, reconnaissance d'empreintes vocales"}],"datatag":"Wuhan ,Dialect ,Conversation","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"00006_001_phone-1.wav","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250728133832/00006_001_phone-1.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=o3isSUaGwgLv%2Fc384dSgEzTO2mA%3D","intro":"要是如果说哎反正正咱觉得出去玩啊。[N]\t要是如果说哎反正现在觉得出去玩啊。","size":254012,"progress":100,"type":"mp3"},{"name":"00006_001_phone-2.wav","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250728133832/00006_001_phone-2.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=VNpAOvl25M2YpkMCWd4tGrM9ShI%3D","intro":"开拓眼界确实是,让人蛮心情蛮蛮愉快呀。[N]\t开拓眼界确实是,让人很心情很很愉快呀。","size":226748,"progress":100,"type":"mp3"},{"name":"00006_001_phone-3.wav","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250728133832/00006_001_phone-3.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=ECqQXn0JqPDBqGeOWM5YxPzfP%2Bg%3D","intro":"是的你要谈那个旅行的话,正咱的话就蛮提倡周边游。[N]\t是的你要谈那个旅行的话,现在的话就很提倡周边游。","size":373436,"progress":100,"type":"mp3"},{"name":"00006_001_phone-4.wav","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250728133832/00006_001_phone-4.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=ZlWQb7sokqYAiMojREz4JKsWmCo%3D","intro":"乡村游,是不是啊,一日游两日游是吧,我觉得这还是蛮好。[N]\t乡村游,是不是啊,一日游两日游是吧,我觉得这还是很好。","size":346892,"progress":100,"type":"mp3"},{"name":"00006_001_phone-5.wav","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250728133832/00006_001_phone-5.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=RIYGKGORQUMy1EKq9L0Zio%2Fhuz0%3D","intro":"大家都出去玩哈子,看哈子,看哈子那个呢,你像正咱马上也可以看油菜花了呢。[N]\t大家都出去玩一下,看一下,看一下那个呢,你像现在马上也可以看油菜花了呢。","size":350252,"progress":100,"type":"mp3"}],"officialSummary":"Données vocales de conversation en dialecte de Wuhan collectées par téléphone portable, librement parlée et enregistrée par l'enregistreur. Cet ensemble de données est marqué avec divers attributs tels que le contenu du texte, l'horodatage des phrases, l'identité du locuteur, le sexe, etc., enregistrés par des locuteurs natifs du dialecte, il garantit une grande exactitude. Cette ressource riche constitue un outil précieux pour la recherche et les applications liées à la reconnaissance vocale. Validé par plusieurs entreprises en intelligence artificielle, il contribue à améliorer les performances des modèles face à la diversité des situations réelles. Nous respectons strictement les réglementations sur la protection des données et de la vie privée, en veillant à préserver la confidentialité et les droits légitimes des utilisateurs tout au long des processus d'acquisition, de stockage et d'utilisation. Toutes les données sont conformes au RGPD, à la CCPA et à la PIPL.","dataexampl":null,"datakeyword":["Wuhan"," Dialecte"," Conversation"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,PT,DE,KO,FR,ES\"}]","productNameEn":"500 Hours - Wuhan Dialect Conversation (Bilingual Annotated) Speech Data by Mobile Phone","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
500 heures de données vocales de conversation naturelle en dialecte de Wuhan (annotation bilingue) collectées par téléphone portable
Wuhan
Dialecte
Conversation
Données vocales de conversation en dialecte de Wuhan collectées par téléphone portable, librement parlée et enregistrée par l'enregistreur. Cet ensemble de données est marqué avec divers attributs tels que le contenu du texte, l'horodatage des phrases, l'identité du locuteur, le sexe, etc., enregistrés par des locuteurs natifs du dialecte, il garantit une grande exactitude. Cette ressource riche constitue un outil précieux pour la recherche et les applications liées à la reconnaissance vocale. Validé par plusieurs entreprises en intelligence artificielle, il contribue à améliorer les performances des modèles face à la diversité des situations réelles. Nous respectons strictement les réglementations sur la protection des données et de la vie privée, en veillant à préserver la confidentialité et les droits légitimes des utilisateurs tout au long des processus d'acquisition, de stockage et d'utilisation. Toutes les données sont conformes au RGPD, à la CCPA et à la PIPL.
Il s'agit d'un ensemble de données payant destiné à un usage commercial, à la recherche et plus encore. Ces Jeux de données prêts à l'emploi et sous licence contribuent au lancement de projets d'IA.
Spécifications
Format
24 kHz, 16 bits, wav non compressé, mono
Environnement d'enregistrement
Intérieur relativement calme, pas d'écho
Contenu d'enregistrement
Une liste de sujets est fournie ; l'orateur en sélectionne plusieurs qu'il maîtrise afin d'assurer une conversation fluide et naturelle, et développe un dialogue autour de chaque sujet lors de l'enregistrement
Personnel
Environ 500 enregistreurs, originaires des comtés et des villes de Wuhan, avec un rapport équilibré d'hommes et de femmes, couvrant plusieurs groupes d'âge
Caractéristiques de l'annotation
Annotation du contenu textuel, traduction en mandarin standard, points de début et de fin des phrases valides, identifiant du locuteur
Appareil
Téléphones Android, Téléphones Apple
Langue
Dialecte de Wuhan
Taux de précision
Précision caractère 98 % ; Précision de la traduction en mandarin standard 90%