[{"@type":"PropertyValue","name":"Format","value":"16kHz, 16 bits, format WAV, mono;"},{"@type":"PropertyValue","name":"Catégorisation du contenu","value":"Les locuteurs sélectionnent plusieurs sujets familiers à partir d’une liste prédéfinie, et enregistrent des dialogues fluides et naturels;"},{"@type":"PropertyValue","name":"Conditions d'enregistrement","value":"Environnement intérieur relativement silencieux, sans réverbération;"},{"@type":"PropertyValue","name":"Dispositifs d'enregistrement","value":"Smartphones Android et iPhone;"},{"@type":"PropertyValue","name":"Informations d'enregisteur","value":"504 locuteurs afghans natifs : 83 % hommes, 17 % femmes"},{"@type":"PropertyValue","name":"Pays","value":"Afghanistan"},{"@type":"PropertyValue","name":"Langue","value":"Dari;"},{"@type":"PropertyValue","name":"Caractéristiques d'annotation","value":"Annotation du contenu textuel, des horodatages de phrases, des identifiants des locuteurs et du genre;"},{"@type":"PropertyValue","name":"Précision","value":"Taux de précision lexicale : 95%"}]
{"id":1474,"datatype":"1","titleimg":"https://fr.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"373 heures de données vocales en dari (téléphone mobile)","datazy":[{"title":"Format","desc":"Format","content":"16kHz, 16 bits, format WAV, mono;"},{"title":"Catégorisation du contenu","desc":"Catégorisation du contenu","content":"Les locuteurs sélectionnent plusieurs sujets familiers à partir d’une liste prédéfinie, et enregistrent des dialogues fluides et naturels;"},{"title":"Conditions d'enregistrement","desc":"Conditions d'enregistrement","content":"Environnement intérieur relativement silencieux, sans réverbération;"},{"title":"Dispositifs d'enregistrement","desc":"Dispositifs d'enregistrement","content":"Smartphones Android et iPhone;"},{"title":"Informations d'enregisteur","desc":"Informations d'enregisteur","content":"504 locuteurs afghans natifs : 83 % hommes, 17 % femmes"},{"title":"Pays","desc":"Pays","content":"Afghanistan"},{"title":"Langue","desc":"Langue","content":"Dari;"},{"title":"Caractéristiques d'annotation","desc":"Caractéristiques d'annotation","content":"Annotation du contenu textuel, des horodatages de phrases, des identifiants des locuteurs et du genre;"},{"title":"Précision","desc":"Précision","content":"Taux de précision lexicale : 95%"}],"datatag":"Dari,Phone,","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"/data/apps/damp/temp/ziptemp/APY240328001_demo1715248803682/APY240328001_demo/0006_001_phone-5.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY240328001_demo1715248803682/APY240328001_demo/0006_001_phone-5.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=HWC13l1wvgXxu0flenahB5QPgXA%3D","intro":"یا انسان ها ره کمک کنه نام شه ماشین می مانیم","size":0,"progress":100,"type":"mp3"},{"name":"/data/apps/damp/temp/ziptemp/APY240328001_demo1715248803682/APY240328001_demo/0006_001_phone-6.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY240328001_demo1715248803682/APY240328001_demo/0006_001_phone-6.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=slJhe9lqiz2kIOUgTlsrvykXW3k%3D","intro":"یا ای که از توته چوب گرفته","size":0,"progress":100,"type":"mp3"},{"name":"/data/apps/damp/temp/ziptemp/APY240328001_demo1715248803682/APY240328001_demo/0006_001_phone-3.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY240328001_demo1715248803682/APY240328001_demo/0006_001_phone-3.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=J48yJNv08p6vbLf9l7kTwgWx8bA%3D","intro":"موتر یکی طبق که گفتیم یکی از نوع ماشین است","size":0,"progress":100,"type":"mp3"},{"name":"/data/apps/damp/temp/ziptemp/APY240328001_demo1715248803682/APY240328001_demo/0006_001_phone-10.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY240328001_demo1715248803682/APY240328001_demo/0006_001_phone-10.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=89WGg%2BBz9hLQKyTvk6ZsquEoiIA%3D","intro":"هر چیزی که","size":0,"progress":100,"type":"mp3"},{"name":"/data/apps/damp/temp/ziptemp/APY240328001_demo1715248803682/APY240328001_demo/0006_001_phone-8.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY240328001_demo1715248803682/APY240328001_demo/0006_001_phone-8.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=vjM8VyQZmiV9G5lqrldZwbQrPS8%3D","intro":"تا هواپیما های پیشرفته","size":0,"progress":100,"type":"mp3"}],"officialSummary":"Les données vocales en dari _ conversations (téléphone portable) ont été enregistrées sur la base d’environ une vingtaine de thèmes courants. Cet ensemble de données contient des annotations détaillant le contenu textuel, les horodatages des phrases, l'identité des locuteurs, leur sexe, ainsi que d'autres attributs. Il a été enregistré par 504 locuteurs natifs dari, issus de différentes régions et cultures, garantissant ainsi une grande précision. Ces données constituent une ressource précieuse pour la recherche et les applications en reconnaissance vocale, validée par plusieurs entreprises spécialisées en intelligence artificielle. Elles permettent aux modèles d’atteindre des performances exceptionnelles face à la diversité du monde réel. Nous respectons scrupuleusement les réglementations en matière de protection des données et de confidentialité, garantissant ainsi la protection des droits et de la vie privée des utilisateurs tout au long de la collecte, du stockage et de l'utilisation des données. Toutes les données respectent le GDPR, le CCPA et la PIPL.","dataexampl":null,"datakeyword":["asr"," audio"," conversationnel"," données ASR"," dari"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Language,Data Type","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"373 Hours - Dari(Afghanistan) Spontaneous Dialogue Smartphone speech dataset","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
373 heures de données vocales en dari (téléphone mobile)
asr
audio
conversationnel
données ASR
dari
Les données vocales en dari _ conversations (téléphone portable) ont été enregistrées sur la base d’environ une vingtaine de thèmes courants. Cet ensemble de données contient des annotations détaillant le contenu textuel, les horodatages des phrases, l'identité des locuteurs, leur sexe, ainsi que d'autres attributs. Il a été enregistré par 504 locuteurs natifs dari, issus de différentes régions et cultures, garantissant ainsi une grande précision. Ces données constituent une ressource précieuse pour la recherche et les applications en reconnaissance vocale, validée par plusieurs entreprises spécialisées en intelligence artificielle. Elles permettent aux modèles d’atteindre des performances exceptionnelles face à la diversité du monde réel. Nous respectons scrupuleusement les réglementations en matière de protection des données et de confidentialité, garantissant ainsi la protection des droits et de la vie privée des utilisateurs tout au long de la collecte, du stockage et de l'utilisation des données. Toutes les données respectent le GDPR, le CCPA et la PIPL.
Il s'agit d'un ensemble de données payant destiné à un usage commercial, à la recherche et plus encore. Ces Jeux de données prêts à l'emploi et sous licence contribuent au lancement de projets d'IA.
Spécifications
Format
16kHz, 16 bits, format WAV, mono;
Catégorisation du contenu
Les locuteurs sélectionnent plusieurs sujets familiers à partir d’une liste prédéfinie, et enregistrent des dialogues fluides et naturels;
Conditions d'enregistrement
Environnement intérieur relativement silencieux, sans réverbération;