[{"@type":"PropertyValue","name":"Format","value":"16 kHz, 16 bits, format WAV non compressé, mono"},{"@type":"PropertyValue","name":"Catégorisation du contenu","value":"Les locuteurs sélectionnent plusieurs sujets familiers à partir d’une liste prédéfinie, et enregistrent des dialogues fluides et naturels"},{"@type":"PropertyValue","name":"Conditions d'enregistrement","value":"Environnement intérieur relativement silencieux, sans réverbération"},{"@type":"PropertyValue","name":"Dispositifs d'enregistrement","value":"Smartphones Android et iPhone ;"},{"@type":"PropertyValue","name":"Informations d'enregisteur","value":"228 participants au total, dont 85 hommes et 143 femmes ;"},{"@type":"PropertyValue","name":"Pays","value":"Malaisie"},{"@type":"PropertyValue","name":"Code de région linguistique","value":"ms-MY"},{"@type":"PropertyValue","name":"Langue","value":"Malais"},{"@type":"PropertyValue","name":"Caractéristiques d'annotation","value":"Annotation du contenu textuel, des horodatages de phrases, de l’identifiant du locuteur, du sexe et du bruit de fond"},{"@type":"PropertyValue","name":"Précision","value":"Taux de précision lexicale : 98%"}]
{"id":1280,"datatype":"1","titleimg":"https://fr.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"200 heures de dialogues en malais (téléphone mobile)","datazy":[{"title":"Format","desc":"Format","content":"16 kHz, 16 bits, format WAV non compressé, mono"},{"title":"Catégorisation du contenu","desc":"Catégorisation du contenu","content":"Les locuteurs sélectionnent plusieurs sujets familiers à partir d’une liste prédéfinie, et enregistrent des dialogues fluides et naturels"},{"title":"Conditions d'enregistrement","desc":"Conditions d'enregistrement","content":"Environnement intérieur relativement silencieux, sans réverbération"},{"title":"Dispositifs d'enregistrement","desc":"Dispositifs d'enregistrement","content":"Smartphones Android et iPhone ;"},{"title":"Informations d'enregisteur","desc":"Informations d'enregisteur","content":"228 participants au total, dont 85 hommes et 143 femmes ;"},{"title":"Pays","desc":"Pays","content":"Malaisie"},{"title":"Code de région linguistique","desc":"Code de région linguistique","content":"ms-MY"},{"title":"Langue","desc":"Langue","content":"Malais"},{"title":"Caractéristiques d'annotation","desc":"Caractéristiques d'annotation","content":"Annotation du contenu textuel, des horodatages de phrases, de l’identifiant du locuteur, du sexe et du bruit de fond"},{"title":"Précision","desc":"Précision","content":"Taux de précision lexicale : 98%"}],"datatag":"Malay,Conversational","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"/data/apps/damp/temp/ziptemp/APY230728001_demo1726135200146/APY230728001_demo/foo_G00059_16k-10.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230728001_demo1726135200146/APY230728001_demo/foo_G00059_16k-10.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=ZdxUjSHT8KULECNQZ3lWxtqWyd8%3D","intro":"Apa tu?","size":0,"progress":100,"type":"mp3"},{"name":"/data/apps/damp/temp/ziptemp/APY230728001_demo1726135200146/APY230728001_demo/foo_G00059_16k-5.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230728001_demo1726135200146/APY230728001_demo/foo_G00059_16k-5.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=N%2Fi7PErsLwpvOP7%2BChUsWI6plGI%3D","intro":"Masakan dia ini sedap.","size":0,"progress":100,"type":"mp3"},{"name":"/data/apps/damp/temp/ziptemp/APY230728001_demo1726135200146/APY230728001_demo/foo_G00059_16k-4.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230728001_demo1726135200146/APY230728001_demo/foo_G00059_16k-4.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=eji9SBDtPKy6jajSp3wHkFWh%2B1A%3D","intro":"Jangan tangkis aih, masakan dia tu bolehlah sedap kalau kata budak-budak sana tu ah.","size":0,"progress":100,"type":"mp3"},{"name":"/data/apps/damp/temp/ziptemp/APY230728001_demo1726135200146/APY230728001_demo/foo_G00059_16k-2.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230728001_demo1726135200146/APY230728001_demo/foo_G00059_16k-2.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=KYofPJ5Xrl1OBaXWXDg06By5m%2FM%3D","intro":"Ah uncle Muhto tu pak cik.","size":0,"progress":100,"type":"mp3"},{"name":"/data/apps/damp/temp/ziptemp/APY230728001_demo1726135200146/APY230728001_demo/foo_G00059_16k-7.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230728001_demo1726135200146/APY230728001_demo/foo_G00059_16k-7.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=jZZgvAg0Zy6ekWuYwvoW96SsSEo%3D","intro":"Kalau saya ni dekat sana tu kalau dah boleh makan tempat ini.","size":0,"progress":100,"type":"mp3"}],"officialSummary":"Les données vocales en malais _ conversations (téléphone portable) ont été enregistrées sur la base d’environ une trentaine de thèmes courants. Cet ensemble de données contient des annotations détaillant le contenu textuel, les horodatages des phrases, l'identité des locuteurs, leur sexe, ainsi que d'autres attributs. Il a été enregistré par 228 locuteurs natifs malaisiens, issus de différentes régions et cultures, garantissant ainsi une grande précision. Ces données constituent une ressource précieuse pour la recherche et les applications en reconnaissance vocale, validée par plusieurs entreprises spécialisées en intelligence artificielle. Elles permettent aux modèles d’atteindre des performances exceptionnelles face à la diversité du monde réel. Nous respectons scrupuleusement les réglementations en matière de protection des données et de confidentialité, garantissant ainsi la protection des droits et de la vie privée des utilisateurs tout au long de la collecte, du stockage et de l'utilisation des données. Toutes les données respectent le GDPR, le CCPA et la PIPL.","dataexampl":null,"datakeyword":["Comportement normal des passagers"," comportement de mal des transports"," comportement de somnolence"," comportement de perte d’objets"," groupes d’âge variés"," périodes temporelles multiples"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"200 Hours - Malay Conversational Speech Data by Mobile Phone","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
200 heures de dialogues en malais (téléphone mobile)
Comportement normal des passagers
comportement de mal des transports
comportement de somnolence
comportement de perte d’objets
groupes d’âge variés
périodes temporelles multiples
Les données vocales en malais _ conversations (téléphone portable) ont été enregistrées sur la base d’environ une trentaine de thèmes courants. Cet ensemble de données contient des annotations détaillant le contenu textuel, les horodatages des phrases, l'identité des locuteurs, leur sexe, ainsi que d'autres attributs. Il a été enregistré par 228 locuteurs natifs malaisiens, issus de différentes régions et cultures, garantissant ainsi une grande précision. Ces données constituent une ressource précieuse pour la recherche et les applications en reconnaissance vocale, validée par plusieurs entreprises spécialisées en intelligence artificielle. Elles permettent aux modèles d’atteindre des performances exceptionnelles face à la diversité du monde réel. Nous respectons scrupuleusement les réglementations en matière de protection des données et de confidentialité, garantissant ainsi la protection des droits et de la vie privée des utilisateurs tout au long de la collecte, du stockage et de l'utilisation des données. Toutes les données respectent le GDPR, le CCPA et la PIPL.
Il s'agit d'un ensemble de données payant destiné à un usage commercial, à la recherche et plus encore. Ces Jeux de données prêts à l'emploi et sous licence contribuent au lancement de projets d'IA.
Spécifications
Format
16 kHz, 16 bits, format WAV non compressé, mono
Catégorisation du contenu
Les locuteurs sélectionnent plusieurs sujets familiers à partir d’une liste prédéfinie, et enregistrent des dialogues fluides et naturels
Conditions d'enregistrement
Environnement intérieur relativement silencieux, sans réverbération
Dispositifs d'enregistrement
Smartphones Android et iPhone ;
Informations d'enregisteur
228 participants au total, dont 85 hommes et 143 femmes ;
Pays
Malaisie
Code de région linguistique
ms-MY
Langue
Malais
Caractéristiques d'annotation
Annotation du contenu textuel, des horodatages de phrases, de l’identifiant du locuteur, du sexe et du bruit de fond
Précision
Taux de précision lexicale : 98%
Exemple
Audio
Apa tu?
Audio
Masakan dia ini sedap.
Audio
Jangan tangkis aih, masakan dia tu bolehlah sedap kalau kata budak-budak sana tu ah.
Audio
Ah uncle Muhto tu pak cik.
Audio
Kalau saya ni dekat sana tu kalau dah boleh makan tempat ini.