[{"@type":"PropertyValue","name":"Format","value":"24 kHz, 16 bits, wav non compressé, mono"},{"@type":"PropertyValue","name":"Environnement d'enregistrement","value":"Intérieur relativement calme, pas d'écho"},{"@type":"PropertyValue","name":"Contenu d'enregistrement","value":"Une liste de sujets est fournie ; l'orateur en sélectionne plusieurs qu'il maîtrise afin d'assurer une conversation fluide et naturelle, et développe un dialogue autour de chaque sujet lors de l'enregistrement"},{"@type":"PropertyValue","name":"Personnel","value":"L'enregistreur est de Lanzhou, avec un rapport équilibré d'hommes et de femmes, couvrant plusieurs groupes d'âge"},{"@type":"PropertyValue","name":"Caractéristiques de l'annotation","value":"Annotation du contenu textuel, traduction en mandarin standard, points de début et de fin des phrases valides, identifiant du locuteur"},{"@type":"PropertyValue","name":"Appareil","value":"Téléphones Android, Téléphones Apple"},{"@type":"PropertyValue","name":"Langue","value":"Dialecte de Lanzhou"},{"@type":"PropertyValue","name":"Taux de précision","value":"Précision caractère 98 % ; Précision de la traduction en mandarin standard 90%"},{"@type":"PropertyValue","name":"Scénarios d'application","value":"Reconnaissance vocale, reconnaissance d'empreintes vocales"}]
{"id":1707,"datatype":"1","titleimg":"https://fr.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"800 heures de données vocales de conversation naturelle en dialecte de Lanzhou (annotation bilingue) collectées par téléphone portable","datazy":[{"title":"Format","desc":"Format","content":"24 kHz, 16 bits, wav non compressé, mono"},{"title":"Environnement d'enregistrement","desc":"Environnement d'enregistrement","content":"Intérieur relativement calme, pas d'écho"},{"title":"Contenu d'enregistrement","desc":"Contenu d'enregistrement","content":"Une liste de sujets est fournie ; l'orateur en sélectionne plusieurs qu'il maîtrise afin d'assurer une conversation fluide et naturelle, et développe un dialogue autour de chaque sujet lors de l'enregistrement"},{"title":"Personnel","desc":"Personnel","content":"L'enregistreur est de Lanzhou, avec un rapport équilibré d'hommes et de femmes, couvrant plusieurs groupes d'âge"},{"title":"Caractéristiques de l'annotation","desc":"Caractéristiques de l'annotation","content":"Annotation du contenu textuel, traduction en mandarin standard, points de début et de fin des phrases valides, identifiant du locuteur"},{"title":"Appareil","desc":"Appareil","content":"Téléphones Android, Téléphones Apple"},{"title":"Langue","desc":"Langue","content":"Dialecte de Lanzhou"},{"title":"Taux de précision","desc":"Taux de précision","content":"Précision caractère 98 % ; Précision de la traduction en mandarin standard 90%"},{"title":"Scénarios d'application","desc":"Scénarios d'application","content":"Reconnaissance vocale, reconnaissance d'empreintes vocales"}],"datatag":"AST,Dialect,Conversation","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"00003_014_phone_2.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250819133508/00003_014_phone_2.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=pA1wn4HplW1CQISdFJ3W%2FBsR%2FXs%3D","intro":"我感觉这已经,好几个月没有,领上朋友们好好的出去聚一哈了。[N]\t我感觉这已经,好几个月没有,领上朋友们好好的出去聚一下了。","size":219294,"progress":100,"type":"mp3"},{"name":"00003_014_phone_3.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250819133508/00003_014_phone_3.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=sxeRxJZjzkc3r05CHzoz20L7Ti8%3D","intro":"这一天工作把人忙的。[N]\t这一天工作把人忙的。","size":76132,"progress":100,"type":"mp3"},{"name":"00003_014_phone_4.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250819133508/00003_014_phone_4.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=bBdkGd0kEUgpiPlAozjzPq%2FLNU8%3D","intro":"哎,有是一直有哩嘛,这冬天一直冷着,人也一直没出去过。[N]\t哎,有是一直有呢嘛,这冬天一直冷着,人也一直没出去过。","size":209604,"progress":100,"type":"mp3"},{"name":"00003_014_phone_5.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250819133508/00003_014_phone_5.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=kkRjCdeDbHMP%2FSUT0qnIzqSywXM%3D","intro":"再加上工作又忙是,也没时间组织。\t再加上工作又忙是,也没时间组织。","size":132986,"progress":100,"type":"mp3"},{"name":"00003_014_phone_7.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250819133508/00003_014_phone_7.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=hQh604AF7sF7VnC6ImL51S5%2F6wo%3D","intro":"等啥时候找个时间出来了,我们热闹热闹,也坐一会儿,也春游一哈。[N]\t等啥时候找个时间出来了,我们热闹热闹,也坐一会,也春游一下。","size":194458,"progress":100,"type":"mp3"}],"officialSummary":"Données vocales de conversation en dialecte de Lanzhou collectées par téléphone portable, librement parlée et enregistrée par l'enregistreur. Cet ensemble de données est marqué avec divers attributs tels que le contenu du texte, l'horodatage des phrases, l'identité du locuteur, le sexe, etc., enregistrés par des locuteurs natifs du dialecte, il garantit une grande exactitude. Cette ressource riche constitue un outil précieux pour la recherche et les applications liées à la reconnaissance vocale. Validé par plusieurs entreprises en intelligence artificielle, il contribue à améliorer les performances des modèles face à la diversité des situations réelles. Nous respectons strictement les réglementations sur la protection des données et de la vie privée, en veillant à préserver la confidentialité et les droits légitimes des utilisateurs tout au long des processus d'acquisition, de stockage et d'utilisation. Toutes les données sont conformes au RGPD, à la CCPA et à la PIPL.","dataexampl":null,"datakeyword":["AST"," Dialecte"," Conversation"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"}]","productNameEn":"800 Hours - Lanzhou Dialect Conversation (Bilingual Annotated) Speech Data by Mobile Phone","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
800 heures de données vocales de conversation naturelle en dialecte de Lanzhou (annotation bilingue) collectées par téléphone portable
AST
Dialecte
Conversation
Données vocales de conversation en dialecte de Lanzhou collectées par téléphone portable, librement parlée et enregistrée par l'enregistreur. Cet ensemble de données est marqué avec divers attributs tels que le contenu du texte, l'horodatage des phrases, l'identité du locuteur, le sexe, etc., enregistrés par des locuteurs natifs du dialecte, il garantit une grande exactitude. Cette ressource riche constitue un outil précieux pour la recherche et les applications liées à la reconnaissance vocale. Validé par plusieurs entreprises en intelligence artificielle, il contribue à améliorer les performances des modèles face à la diversité des situations réelles. Nous respectons strictement les réglementations sur la protection des données et de la vie privée, en veillant à préserver la confidentialité et les droits légitimes des utilisateurs tout au long des processus d'acquisition, de stockage et d'utilisation. Toutes les données sont conformes au RGPD, à la CCPA et à la PIPL.
Il s'agit d'un ensemble de données payant destiné à un usage commercial, à la recherche et plus encore. Ces Jeux de données prêts à l'emploi et sous licence contribuent au lancement de projets d'IA.
Spécifications
Format
24 kHz, 16 bits, wav non compressé, mono
Environnement d'enregistrement
Intérieur relativement calme, pas d'écho
Contenu d'enregistrement
Une liste de sujets est fournie ; l'orateur en sélectionne plusieurs qu'il maîtrise afin d'assurer une conversation fluide et naturelle, et développe un dialogue autour de chaque sujet lors de l'enregistrement
Personnel
L'enregistreur est de Lanzhou, avec un rapport équilibré d'hommes et de femmes, couvrant plusieurs groupes d'âge
Caractéristiques de l'annotation
Annotation du contenu textuel, traduction en mandarin standard, points de début et de fin des phrases valides, identifiant du locuteur
Appareil
Téléphones Android, Téléphones Apple
Langue
Dialecte de Lanzhou
Taux de précision
Précision caractère 98 % ; Précision de la traduction en mandarin standard 90%