[{"@type":"PropertyValue","name":"Format","value":"16kHz, 16 bits, format WAV, mono"},{"@type":"PropertyValue","name":"Environnement d'enregistrement","value":"Environnement intérieur relativement calme"},{"@type":"PropertyValue","name":"Catégorisation du contenu","value":"Conversations informelles, interactions, contenus liés aux systèmes embarqués, à la domotique et aux séquences numériques"},{"@type":"PropertyValue","name":"Pays","value":"Malaisie"},{"@type":"PropertyValue","name":"Langue","value":"Malais"},{"@type":"PropertyValue","name":"Précision","value":"Taux de précision lexicale : 98 % (la ponctuation et les annotations non vocales étant relativement subjectives, les erreurs de ponctuation ou d'autres marqueurs ne sont pas prises en compte dans le calcul de la précision)"},{"@type":"PropertyValue","name":"Dispositifs d'enregistrement","value":"Smartphones Android et iPhone"},{"@type":"PropertyValue","name":"Informations d'enregisteur","value":"300 participants au total, dont 134 hommes et 166 femmes"},{"@type":"PropertyValue","name":"Code de région linguistique","value":"ms-MY"}]
{"id":1605,"datatype":"1","titleimg":"https://fr.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"341 heures de lecture en malais (collectées sur téléphone mobile)","datazy":[{"title":"Format","desc":"Format","content":"16kHz, 16 bits, format WAV, mono"},{"title":"Environnement d'enregistrement","desc":"Environnement d'enregistrement","content":"Environnement intérieur relativement calme"},{"title":"Catégorisation du contenu","desc":"Catégorisation du contenu","content":"Conversations informelles, interactions, contenus liés aux systèmes embarqués, à la domotique et aux séquences numériques"},{"title":"Pays","desc":"Pays","content":"Malaisie"},{"title":"Langue","desc":"Langue","content":"Malais"},{"title":"Précision","desc":"Précision","content":"Taux de précision lexicale : 98 % (la ponctuation et les annotations non vocales étant relativement subjectives, les erreurs de ponctuation ou d'autres marqueurs ne sont pas prises en compte dans le calcul de la précision)"},{"title":"Dispositifs d'enregistrement","desc":"Dispositifs d'enregistrement","content":"Smartphones Android et iPhone"},{"title":"Informations d'enregisteur","desc":"Informations d'enregisteur","content":"300 participants au total, dont 134 hommes et 166 femmes"},{"title":"Code de région linguistique","desc":"Code de région linguistique","content":"ms-MY"}],"datatag":"Malay,Malaysia,Smartphone,Reading,Scripted Monologue","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"G00001S1001.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250718180131/G00001S1001.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=kAj6u%2FWgqDTOo4mfaNnGB7bUco0%3D","intro":"Nyalakan enjin.","size":60844,"progress":100,"type":"mp3"},{"name":"G00003S4097.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250718180131/G00003S4097.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=bjAneCGcJpYUK8SUtSFgUkjcnBw%3D","intro":"Saya sedang mencari kursus bahasa Inggeris, boleh beri cadangan?","size":159820,"progress":100,"type":"mp3"},{"name":"G00028S4446.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250718180131/G00028S4446.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=Rt8K5Wtowk%2FV%2Bt2IQJTryPkjbs4%3D","intro":"Cubalah bersiar-siar di luar setiap hari.","size":121428,"progress":100,"type":"mp3"}],"officialSummary":"Les données vocales en malais de Malaisie - lecture (téléphone portable) ont été enregistrées à partir de scripts prédéfinis couvrant divers domaines tels que les commentaires de chat, les interactions, les commandes embarquées, les instructions domestiques et les chaînes numériques. Cet ensemble de données comporte des annotations du contenu textuel et d'autres attributs. D’une grande précision, il constitue une ressource précieuse pour la recherche et les applications en reconnaissance vocale, validée par plusieurs entreprises d’intelligence artificielle. Nous respectons strictement les lois sur la protection des données et la confidentialité, assurant la sauvegarde des droits et de la vie privée des utilisateurs tout au long du cycle de vie des données. Toutes les données sont conformes au GDPR, au CCPA et à la PIPL.","dataexampl":null,"datakeyword":["Malais"," Malaisie"," Smartphone"," Lecture"," Monologue scripté"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"341 Hours - Malay(Malaysia) Scripted Monologue Smartphone speech dataset","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
341 heures de lecture en malais (collectées sur téléphone mobile)
Malais
Malaisie
Smartphone
Lecture
Monologue scripté
Les données vocales en malais de Malaisie - lecture (téléphone portable) ont été enregistrées à partir de scripts prédéfinis couvrant divers domaines tels que les commentaires de chat, les interactions, les commandes embarquées, les instructions domestiques et les chaînes numériques. Cet ensemble de données comporte des annotations du contenu textuel et d'autres attributs. D’une grande précision, il constitue une ressource précieuse pour la recherche et les applications en reconnaissance vocale, validée par plusieurs entreprises d’intelligence artificielle. Nous respectons strictement les lois sur la protection des données et la confidentialité, assurant la sauvegarde des droits et de la vie privée des utilisateurs tout au long du cycle de vie des données. Toutes les données sont conformes au GDPR, au CCPA et à la PIPL.
Il s'agit d'un ensemble de données payant destiné à un usage commercial, à la recherche et plus encore. Ces Jeux de données prêts à l'emploi et sous licence contribuent au lancement de projets d'IA.
Spécifications
Format
16kHz, 16 bits, format WAV, mono
Environnement d'enregistrement
Environnement intérieur relativement calme
Catégorisation du contenu
Conversations informelles, interactions, contenus liés aux systèmes embarqués, à la domotique et aux séquences numériques
Pays
Malaisie
Langue
Malais
Précision
Taux de précision lexicale : 98 % (la ponctuation et les annotations non vocales étant relativement subjectives, les erreurs de ponctuation ou d'autres marqueurs ne sont pas prises en compte dans le calcul de la précision)
Dispositifs d'enregistrement
Smartphones Android et iPhone
Informations d'enregisteur
300 participants au total, dont 134 hommes et 166 femmes
Code de région linguistique
ms-MY
Exemple
Audio
Nyalakan enjin.
Audio
Saya sedang mencari kursus bahasa Inggeris, boleh beri cadangan?