[{"@type":"PropertyValue","name":"Format","value":"16 kHz/24 kHz, 16 bits, WAV non compressé, mono"},{"@type":"PropertyValue","name":"Environnement d'enregistrement","value":"Intérieur relativement calme, sans écho"},{"@type":"PropertyValue","name":"Contenu de l'enregistrement","value":"Une liste de sujets était fournie, les locuteurs en choisissaient plusieurs qui leur étaient familiers pour assurer la fluidité et le naturel des conversations. Pour chaque sujet, un dialogue était engagé et enregistré."},{"@type":"PropertyValue","name":"Personnel","value":"Environ 500 locuteurs, provenant des villes et districts de la région de Guilin, ratio hommes-femmes équilibré, couvrant plusieurs tranches d'âge."},{"@type":"PropertyValue","name":"Caractéristiques des annotations","value":"Transcription du contenu texte, explication en mandarin standard, points de début et de fin des phrases valides, identifiant du locuteur."},{"@type":"PropertyValue","name":"Appareil","value":"Téléphones Android, téléphones Apple"},{"@type":"PropertyValue","name":"Langue","value":"Dialecte de Guilin"},{"@type":"PropertyValue","name":"Précision","value":"Précision au niveau du caractère : 98% ; Précision des annotations en mandarin : 90%"},{"@type":"PropertyValue","name":"Scénarios d'application","value":"Reconnaissance vocale, reconnaissance du locuteur"}]
{"id":1682,"datatype":"1","titleimg":"https://fr.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"500 heures de dialogues naturels en dialecte de Guilin (annotations bilingues) - Données vocales collectées par smartphone","datazy":[{"title":"Format","desc":"Format","content":"16 kHz/24 kHz, 16 bits, WAV non compressé, mono"},{"title":"Environnement d'enregistrement","desc":"Environnement d'enregistrement","content":"Intérieur relativement calme, sans écho"},{"title":"Contenu de l'enregistrement","desc":"Contenu de l'enregistrement","content":"Une liste de sujets était fournie, les locuteurs en choisissaient plusieurs qui leur étaient familiers pour assurer la fluidité et le naturel des conversations. Pour chaque sujet, un dialogue était engagé et enregistré."},{"title":"Personnel","desc":"Personnel","content":"Environ 500 locuteurs, provenant des villes et districts de la région de Guilin, ratio hommes-femmes équilibré, couvrant plusieurs tranches d'âge."},{"title":"Caractéristiques des annotations","desc":"Caractéristiques des annotations","content":"Transcription du contenu texte, explication en mandarin standard, points de début et de fin des phrases valides, identifiant du locuteur."},{"title":"Appareil","desc":"Appareil","content":"Téléphones Android, téléphones Apple"},{"title":"Langue","desc":"Langue","content":"Dialecte de Guilin"},{"title":"Précision","desc":"Précision","content":"Précision au niveau du caractère : 98% ; Précision des annotations en mandarin : 90%"},{"title":"Scénarios d'application","desc":"Scénarios d'application","content":"Reconnaissance vocale, reconnaissance du locuteur"}],"datatag":"ast,Dialect ,guilin","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"wea_001_00428_16k-1.wav","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250728104926/wea_001_00428_16k-1.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=hrwhkGRxXISVobVkRDURULYmswY%3D","intro":"就是特别特别冷滴时候,那你,出去,\t就是特别特别冷的时候,那你,出去,","size":77164,"progress":100,"type":"mp3"},{"name":"wea_001_00428_16k-2.wav","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250728104926/wea_001_00428_16k-2.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=0TOE62FZNkDOIAh0%2BBeujeXl8rA%3D","intro":"开电动车倒是没有。\t骑电动车倒是没有。","size":45516,"progress":100,"type":"mp3"},{"name":"wea_001_00428_16k-3.wav","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250728104926/wea_001_00428_16k-3.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=gLsxIqegpSGeAMVvHbtWQsMlhFc%3D","intro":"那不是就是穿起多多哩。\t那不是就是穿得多多的。","size":61196,"progress":100,"type":"mp3"},{"name":"wea_001_00428_16k-4.wav","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250728104926/wea_001_00428_16k-4.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=2Q39u6rWZn7DJFQ8tbymuIxF1OY%3D","intro":"然后桂林南方这种就是湿冷天气,这不[OVERLAP/]是,不[/OVERLAP]是你穿好多就能够解决问题哩。\t然后桂林南方这种就是湿冷天气,这不是,不是你穿很多就能够解决问题的。","size":179116,"progress":100,"type":"mp3"},{"name":"wea_001_00428_16k-5.wav","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250728104926/wea_001_00428_16k-5.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=OrylBVGjLZr3bMPU0J6mcMNT34w%3D","intro":"但是我们去去北方,去北方其实北方也是,北方是真滴冷但人家室内有有地暖。\t但是我们去去北方,去北方其实北方也是,北方是真的冷但人家室内有有地暖。","size":176780,"progress":100,"type":"mp3"}],"officialSummary":"Données vocales en dialecte de Guilin - Dialogue (téléphone), enregistrées par des locuteurs conversant librement. Ce jeu de données est annoté avec le contenu textuel, les horodatages des phrases, l'identité du locuteur, le genre et d'autres attributs. Enregistré par des locuteurs natifs du dialecte, il est d'une grande précision et constitue une ressource riche pour la recherche et les applications liées à la reconnaissance vocale. Validé par de nombreuses entreprises d'IA : il aide les modèles à exceller face à la diversité du monde réel. Nous suivons strictement les lois sur la protection des données et les règlements sur la vie privée, garantissant le respect de la vie privée et des droits des utilisateurs lors de la collecte, du stockage et de l'utilisation des données. Toutes les données sont conformes au RGPD, au CCPA, et au PIPL.","dataexampl":null,"datakeyword":["ast"," Dialecte"," guilin"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"}]","productNameEn":"100 Hours - Guilin Dialect Conversation (Bilingual Annotated) Speech Data by Mobile Phone","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
500 heures de dialogues naturels en dialecte de Guilin (annotations bilingues) - Données vocales collectées par smartphone
ast
Dialecte
guilin
Données vocales en dialecte de Guilin - Dialogue (téléphone), enregistrées par des locuteurs conversant librement. Ce jeu de données est annoté avec le contenu textuel, les horodatages des phrases, l'identité du locuteur, le genre et d'autres attributs. Enregistré par des locuteurs natifs du dialecte, il est d'une grande précision et constitue une ressource riche pour la recherche et les applications liées à la reconnaissance vocale. Validé par de nombreuses entreprises d'IA : il aide les modèles à exceller face à la diversité du monde réel. Nous suivons strictement les lois sur la protection des données et les règlements sur la vie privée, garantissant le respect de la vie privée et des droits des utilisateurs lors de la collecte, du stockage et de l'utilisation des données. Toutes les données sont conformes au RGPD, au CCPA, et au PIPL.
Il s'agit d'un ensemble de données payant destiné à un usage commercial, à la recherche et plus encore. Ces Jeux de données prêts à l'emploi et sous licence contribuent au lancement de projets d'IA.
Spécifications
Format
16 kHz/24 kHz, 16 bits, WAV non compressé, mono
Environnement d'enregistrement
Intérieur relativement calme, sans écho
Contenu de l'enregistrement
Une liste de sujets était fournie, les locuteurs en choisissaient plusieurs qui leur étaient familiers pour assurer la fluidité et le naturel des conversations. Pour chaque sujet, un dialogue était engagé et enregistré.
Personnel
Environ 500 locuteurs, provenant des villes et districts de la région de Guilin, ratio hommes-femmes équilibré, couvrant plusieurs tranches d'âge.
Caractéristiques des annotations
Transcription du contenu texte, explication en mandarin standard, points de début et de fin des phrases valides, identifiant du locuteur.
Appareil
Téléphones Android, téléphones Apple
Langue
Dialecte de Guilin
Précision
Précision au niveau du caractère : 98% ; Précision des annotations en mandarin : 90%