[{"@type":"PropertyValue","name":"Format","value":"8 kHz, 8 bits, PCM (u-law/a-law), mono"},{"@type":"PropertyValue","name":"Catégorisation du contenu","value":"Les locuteurs sélectionnent plusieurs sujets familiers à partir d’une liste prédéfinie, et enregistrent des dialogues fluides et naturels"},{"@type":"PropertyValue","name":"Conditions d'enregistrement","value":"Environnement intérieur relativement silencieux, sans réverbération"},{"@type":"PropertyValue","name":"Dispositifs d'enregistrement","value":"Système d’enregistrement téléphonique"},{"@type":"PropertyValue","name":"Informations d'enregisteur","value":"270 participants au total, dont 150 hommes et 120 femmes ;"},{"@type":"PropertyValue","name":"Pays","value":"Pakistan"},{"@type":"PropertyValue","name":"Code de région linguistique","value":"ur-PK"},{"@type":"PropertyValue","name":"Langue","value":"Ourdou"},{"@type":"PropertyValue","name":"Caractéristiques d'annotation","value":"Annotation du contenu textuel, des horodatages de phrases, des identifiants des locuteurs et du genre"},{"@type":"PropertyValue","name":"Précision","value":"Taux de précision lexicale : 95%"}]
{"id":1242,"datatype":"1","titleimg":"https://fr.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"196 heures de dialogues en ourdou (téléphone)","datazy":[{"title":"Format","desc":"Format","content":"8 kHz, 8 bits, PCM (u-law/a-law), mono"},{"title":"Catégorisation du contenu","desc":"Catégorisation du contenu","content":"Les locuteurs sélectionnent plusieurs sujets familiers à partir d’une liste prédéfinie, et enregistrent des dialogues fluides et naturels"},{"title":"Conditions d'enregistrement","desc":"Conditions d'enregistrement","content":"Environnement intérieur relativement silencieux, sans réverbération"},{"title":"Dispositifs d'enregistrement","desc":"Dispositifs d'enregistrement","content":"Système d’enregistrement téléphonique"},{"title":"Informations d'enregisteur","desc":"Informations d'enregisteur","content":"270 participants au total, dont 150 hommes et 120 femmes ;"},{"title":"Pays","desc":"Pays","content":"Pakistan"},{"title":"Code de région linguistique","desc":"Code de région linguistique","content":"ur-PK"},{"title":"Langue","desc":"Langue","content":"Ourdou"},{"title":"Caractéristiques d'annotation","desc":"Caractéristiques d'annotation","content":"Annotation du contenu textuel, des horodatages de phrases, des identifiants des locuteurs et du genre"},{"title":"Précision","desc":"Précision","content":"Taux de précision lexicale : 95%"}],"datatag":"Conversational Speech,Telephone,Urdu","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"/data/apps/damp/temp/ziptemp/APY230716001_demo1725530400187/APY230716001_demo/cov_001_00202_8k-7.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230716001_demo1725530400187/APY230716001_demo/cov_001_00202_8k-7.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=9OFuuaPAmeNan5off2%2F6oj%2BT6%2Bw%3D","intro":"کہ یہ کرو، اور وہ کرو، اور احتیاطی تدابیر وغیرہ بھی نا۔","size":0,"progress":100,"type":"mp3"},{"name":"/data/apps/damp/temp/ziptemp/APY230716001_demo1725530400187/APY230716001_demo/cov_001_00202_8k-9.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230716001_demo1725530400187/APY230716001_demo/cov_001_00202_8k-9.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=SRkh%2BMPsFh9MiaZbCmASEAV82LA%3D","intro":"اچھا اور جب دیکھیں، ہمارا پہلے ہوتا تھا، یہ نزلہ وغیرہ اور ہم کہتے تھے، چلو ہم،","size":0,"progress":100,"type":"mp3"},{"name":"/data/apps/damp/temp/ziptemp/APY230716001_demo1725530400187/APY230716001_demo/cov_001_00202_8k-6.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230716001_demo1725530400187/APY230716001_demo/cov_001_00202_8k-6.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=ve42CpgQON0aVljdvvM9DEJh7%2B4%3D","intro":"ہمم، اور دیکھیں ذرا، covid کا اور کورونا کا آج کل جو ہے، وہ اخبار اور ٹی وی میں بھی اتنا بتا رہے ہیں،","size":0,"progress":100,"type":"mp3"},{"name":"/data/apps/damp/temp/ziptemp/APY230716001_demo1725530400187/APY230716001_demo/cov_001_00202_8k-1.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230716001_demo1725530400187/APY230716001_demo/cov_001_00202_8k-1.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=4Rr5svFZ%2B0AjTuqo2uuw%2BcbWjmY%3D","intro":"ہاں تمہیں پتہ ہے نا، پچھلے دو سالوں سے سردی زیادہ ہوتی ہے، تو سردی کے موسم میں کورونا کے پھیلنے کا خطرہ بھی زیادہ ہوتا ہے۔","size":0,"progress":100,"type":"mp3"},{"name":"/data/apps/damp/temp/ziptemp/APY230716001_demo1725530400187/APY230716001_demo/cov_001_00202_8k-5.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230716001_demo1725530400187/APY230716001_demo/cov_001_00202_8k-5.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=15Ai6ApMMr3pFZ%2FpXohi3SeWm6U%3D","intro":"سال میں دو، تین دفعہ تو سکول یہ کہہ کر بند کر دیے جاتے ہیں کہ کورونا کے پھیلنے کا خطرہ ہے۔","size":0,"progress":100,"type":"mp3"}],"officialSummary":"Les données vocales en ourdou _ conversations (téléphone portable) ont été enregistrées sur la base d’environ une vingtaine de thèmes courants. Cet ensemble de données contient des annotations détaillant le contenu textuel, les horodatages des phrases, l'identité des locuteurs, leur sexe, ainsi que d'autres attributs. Il a été enregistré par 270 locuteurs natifs ourdous, issus de différentes régions et cultures, garantissant ainsi une grande précision. Ces données constituent une ressource précieuse pour la recherche et les applications en reconnaissance vocale, validée par plusieurs entreprises spécialisées en intelligence artificielle. Elles permettent aux modèles d’atteindre des performances exceptionnelles face à la diversité du monde réel. Nous respectons scrupuleusement les réglementations en matière de protection des données et de confidentialité, garantissant ainsi la protection des droits et de la vie privée des utilisateurs tout au long de la collecte, du stockage et de l'utilisation des données. Toutes les données respectent le GDPR, le CCPA et la PIPL.","dataexampl":null,"datakeyword":["audio"," données"," ensemble de données"," conversationnel"," données ASR"," ourdou"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Language,Data Type","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"196 Hours - Urdu Conversational Speech Data by Telephone","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
Les données vocales en ourdou _ conversations (téléphone portable) ont été enregistrées sur la base d’environ une vingtaine de thèmes courants. Cet ensemble de données contient des annotations détaillant le contenu textuel, les horodatages des phrases, l'identité des locuteurs, leur sexe, ainsi que d'autres attributs. Il a été enregistré par 270 locuteurs natifs ourdous, issus de différentes régions et cultures, garantissant ainsi une grande précision. Ces données constituent une ressource précieuse pour la recherche et les applications en reconnaissance vocale, validée par plusieurs entreprises spécialisées en intelligence artificielle. Elles permettent aux modèles d’atteindre des performances exceptionnelles face à la diversité du monde réel. Nous respectons scrupuleusement les réglementations en matière de protection des données et de confidentialité, garantissant ainsi la protection des droits et de la vie privée des utilisateurs tout au long de la collecte, du stockage et de l'utilisation des données. Toutes les données respectent le GDPR, le CCPA et la PIPL.
Il s'agit d'un ensemble de données payant destiné à un usage commercial, à la recherche et plus encore. Ces Jeux de données prêts à l'emploi et sous licence contribuent au lancement de projets d'IA.
Spécifications
Format
8 kHz, 8 bits, PCM (u-law/a-law), mono
Catégorisation du contenu
Les locuteurs sélectionnent plusieurs sujets familiers à partir d’une liste prédéfinie, et enregistrent des dialogues fluides et naturels
Conditions d'enregistrement
Environnement intérieur relativement silencieux, sans réverbération
Dispositifs d'enregistrement
Système d’enregistrement téléphonique
Informations d'enregisteur
270 participants au total, dont 150 hommes et 120 femmes ;
Pays
Pakistan
Code de région linguistique
ur-PK
Langue
Ourdou
Caractéristiques d'annotation
Annotation du contenu textuel, des horodatages de phrases, des identifiants des locuteurs et du genre
Précision
Taux de précision lexicale : 95%
Exemple
Audio
کہ یہ کرو، اور وہ کرو، اور احتیاطی تدابیر وغیرہ بھی نا۔
Audio
اچھا اور جب دیکھیں، ہمارا پہلے ہوتا تھا، یہ نزلہ وغیرہ اور ہم کہتے تھے، چلو ہم،
Audio
ہمم، اور دیکھیں ذرا، covid کا اور کورونا کا آج کل جو ہے، وہ اخبار اور ٹی وی میں بھی اتنا بتا رہے ہیں،
Audio
ہاں تمہیں پتہ ہے نا، پچھلے دو سالوں سے سردی زیادہ ہوتی ہے، تو سردی کے موسم میں کورونا کے پھیلنے کا خطرہ بھی زیادہ ہوتا ہے۔
Audio
سال میں دو، تین دفعہ تو سکول یہ کہہ کر بند کر دیے جاتے ہیں کہ کورونا کے پھیلنے کا خطرہ ہے۔