[{"@type":"PropertyValue","name":"Format","value":"16kHz, 16 bits, format WAV, mono"},{"@type":"PropertyValue","name":"Environnement d'enregistrement","value":"Faible bruit de fond"},{"@type":"PropertyValue","name":"Pays","value":"Chine"},{"@type":"PropertyValue","name":"Code de région linguistique","value":"kk-CN"},{"@type":"PropertyValue","name":"Langue","value":"Kazakh"},{"@type":"PropertyValue","name":"Caractéristiques d'annotation","value":"Annotation du contenu textuel, des horodatages de phrases, des identifiants des locuteurs et du genre"},{"@type":"PropertyValue","name":"Précision","value":"Taux de précision par phrase : 95 %"}]
{"id":1119,"datatype":"1","titleimg":"https://fr.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"557 heures de données vocales en kazakh – style oral","datazy":[{"title":"Format","desc":"Format","content":"16kHz, 16 bits, format WAV, mono"},{"title":"Environnement d'enregistrement","desc":"Environnement d'enregistrement","content":"Faible bruit de fond"},{"title":"Pays","desc":"Pays","content":"Chine"},{"title":"Code de région linguistique","desc":"Code de région linguistique","content":"kk-CN"},{"title":"Langue","desc":"Langue","content":"Kazakh"},{"title":"Caractéristiques d'annotation","desc":"Caractéristiques d'annotation","content":"Annotation du contenu textuel, des horodatages de phrases, des identifiants des locuteurs et du genre"},{"title":"Précision","desc":"Précision","content":"Taux de précision par phrase : 95 %"}],"datatag":"Kazakh,Colloquial Video,Conversation","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[],"officialSummary":"Les données vocales en kazakh - conversation informelle, reflétant des situations d’interaction authentiques. L’ensemble de données comprend des annotations sur le contenu textuel, l’identité des locuteurs, leur sexe ainsi que d’autres attributs. Elles ont été collectées auprès de locuteurs kazakhs provenant de divers horizons régionaux et culturels, avec un haut niveau de précision et une grande facilité d’exploitation. Ces données constituent une ressource précieuse pour la recherche et les applications en reconnaissance vocale, permettant aux modèles d’être performants dans des environnements variés. Nous respectons strictement les réglementations relatives à la protection des données et à la vie privée, en assurant la conformité à chaque étape du traitement. Toutes les données sont conformes au GDPR, au CCPA et à la PIPL.","dataexampl":null,"datakeyword":["Ouïghour"," Vidéo en langage courant"," Conversation"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"535 Hours - Kazakh Spontaneous Speech Data","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
557 heures de données vocales en kazakh – style oral
Ouïghour
Vidéo en langage courant
Conversation
Les données vocales en kazakh - conversation informelle, reflétant des situations d’interaction authentiques. L’ensemble de données comprend des annotations sur le contenu textuel, l’identité des locuteurs, leur sexe ainsi que d’autres attributs. Elles ont été collectées auprès de locuteurs kazakhs provenant de divers horizons régionaux et culturels, avec un haut niveau de précision et une grande facilité d’exploitation. Ces données constituent une ressource précieuse pour la recherche et les applications en reconnaissance vocale, permettant aux modèles d’être performants dans des environnements variés. Nous respectons strictement les réglementations relatives à la protection des données et à la vie privée, en assurant la conformité à chaque étape du traitement. Toutes les données sont conformes au GDPR, au CCPA et à la PIPL.
Il s'agit d'un ensemble de données payant destiné à un usage commercial, à la recherche et plus encore. Ces Jeux de données prêts à l'emploi et sous licence contribuent au lancement de projets d'IA.
Spécifications
Format
16kHz, 16 bits, format WAV, mono
Environnement d'enregistrement
Faible bruit de fond
Pays
Chine
Code de région linguistique
kk-CN
Langue
Kazakh
Caractéristiques d'annotation
Annotation du contenu textuel, des horodatages de phrases, des identifiants des locuteurs et du genre