[{"@type":"PropertyValue","name":"Format","value":"16 kHz, 16 bits, format WAV non compressé, mono"},{"@type":"PropertyValue","name":"Catégorisation du contenu","value":"Les locuteurs sélectionnent plusieurs sujets familiers à partir d’une liste prédéfinie, et enregistrent des dialogues fluides et naturels"},{"@type":"PropertyValue","name":"Conditions d'enregistrement","value":"Environnement intérieur relativement silencieux, sans réverbération"},{"@type":"PropertyValue","name":"Dispositifs d'enregistrement","value":"Smartphones Android et iPhone ;"},{"@type":"PropertyValue","name":"Informations d'enregisteur","value":"338 participants au total, dont 152 hommes et 186 femmes ;"},{"@type":"PropertyValue","name":"Pays","value":"Mexique"},{"@type":"PropertyValue","name":"Code de région linguistique","value":"es-MX"},{"@type":"PropertyValue","name":"Langue","value":"Espagnol"},{"@type":"PropertyValue","name":"Caractéristiques d'annotation","value":"Annotation du contenu textuel, des horodatages de phrases, de l’identifiant du locuteur, du sexe et du bruit de fond"},{"@type":"PropertyValue","name":"Précision","value":"Taux de précision lexicale : 98%"}]
{"id":1303,"datatype":"1","titleimg":"https://fr.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"346 heures de dialogues en espagnol mexicain (téléphone mobile)","datazy":[{"title":"Format","desc":"Format","content":"16 kHz, 16 bits, format WAV non compressé, mono"},{"title":"Catégorisation du contenu","desc":"Catégorisation du contenu","content":"Les locuteurs sélectionnent plusieurs sujets familiers à partir d’une liste prédéfinie, et enregistrent des dialogues fluides et naturels"},{"title":"Conditions d'enregistrement","desc":"Conditions d'enregistrement","content":"Environnement intérieur relativement silencieux, sans réverbération"},{"title":"Dispositifs d'enregistrement","desc":"Dispositifs d'enregistrement","content":"Smartphones Android et iPhone ;"},{"title":"Informations d'enregisteur","desc":"Informations d'enregisteur","content":"338 participants au total, dont 152 hommes et 186 femmes ;"},{"title":"Pays","desc":"Pays","content":"Mexique"},{"title":"Code de région linguistique","desc":"Code de région linguistique","content":"es-MX"},{"title":"Langue","desc":"Langue","content":"Espagnol"},{"title":"Caractéristiques d'annotation","desc":"Caractéristiques d'annotation","content":"Annotation du contenu textuel, des horodatages de phrases, de l’identifiant du locuteur, du sexe et du bruit de fond"},{"title":"Précision","desc":"Précision","content":"Taux de précision lexicale : 98%"}],"datatag":"Spanish,Mexican,Conversation,Phone","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"/data/apps/damp/temp/ziptemp/APY230720001_demo1729159202534/APY230720001_demo/hea_G00005_16k-8.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230720001_demo1729159202534/APY230720001_demo/hea_G00005_16k-8.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=2hr81KdneXaMYoenMJPCqZdbRcM%3D","intro":"Doy esta clase cuatro semestres,","size":0,"progress":100,"type":"mp3"},{"name":"/data/apps/damp/temp/ziptemp/APY230720001_demo1729159202534/APY230720001_demo/hea_G00005_16k-7.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230720001_demo1729159202534/APY230720001_demo/hea_G00005_16k-7.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=hWG4Q75JSOueMKKLCDbQdKCjxRQ%3D","intro":"porque doy la asignatura de desarrollo físico y salud.","size":0,"progress":100,"type":"mp3"},{"name":"/data/apps/damp/temp/ziptemp/APY230720001_demo1729159202534/APY230720001_demo/hea_G00005_16k-6.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230720001_demo1729159202534/APY230720001_demo/hea_G00005_16k-6.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=YfqIGpivorlcL4%2BE6VdmL8LHaVo%3D","intro":"Pues más o menos, qué crees que este es un tema que yo trabajo regularmente con mis alumnos","size":0,"progress":100,"type":"mp3"},{"name":"/data/apps/damp/temp/ziptemp/APY230720001_demo1729159202534/APY230720001_demo/hea_G00005_16k-3.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230720001_demo1729159202534/APY230720001_demo/hea_G00005_16k-3.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=%2F%2BaZH%2BalghvUUJnP0t7AL6K%2FnlQ%3D","intro":"sentirte bien físicamente en movilidad,","size":0,"progress":100,"type":"mp3"},{"name":"/data/apps/damp/temp/ziptemp/APY230720001_demo1729159202534/APY230720001_demo/hea_G00005_16k-2.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230720001_demo1729159202534/APY230720001_demo/hea_G00005_16k-2.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=Ul9SFZDszg2oDQo9W%2F5Dq2Bi5Cg%3D","intro":"físico del, del cuerpo, o sea,","size":0,"progress":100,"type":"mp3"}],"officialSummary":"Le corpus de données vocales en espagnol mexicain — constitué à partir de conversations téléphoniques simulées — couvre une trentaine de thématiques courantes. Il comprend des annotations exhaustives, notamment le contenu textuel, les horodatages des phrases, l’identité des locuteurs ainsi que leur sexe. Les enregistrements ont été réalisés par 338 locuteurs natifs du Mexique, représentant une diversité de régions et de milieux culturels. Doté d’une grande précision et d’une facilité d’exploitation remarquable, ce corpus constitue une ressource précieuse pour la recherche et les applications en reconnaissance vocale. Son efficacité a été confirmée par de nombreuses entreprises spécialisées en intelligence artificielle, notamment pour l’entraînement de modèles robustes capables de s’adapter à la diversité des situations du monde réel. Toutes les données ont été collectées, stockées et utilisées dans le strict respect des réglementations en matière de protection des données personnelles, conformément au RGPD, au CCPA et au PIPL.","dataexampl":null,"datakeyword":["audio"," données"," ensemble de données"," conversationnel"," données ASR"," espagnol"," mexicain"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Language,Data Type","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"346 Hours - Mexican Spanish Conversational Speech Data by Mobile Phone","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
346 heures de dialogues en espagnol mexicain (téléphone mobile)
audio
données
ensemble de données
conversationnel
données ASR
espagnol
mexicain
Le corpus de données vocales en espagnol mexicain — constitué à partir de conversations téléphoniques simulées — couvre une trentaine de thématiques courantes. Il comprend des annotations exhaustives, notamment le contenu textuel, les horodatages des phrases, l’identité des locuteurs ainsi que leur sexe. Les enregistrements ont été réalisés par 338 locuteurs natifs du Mexique, représentant une diversité de régions et de milieux culturels. Doté d’une grande précision et d’une facilité d’exploitation remarquable, ce corpus constitue une ressource précieuse pour la recherche et les applications en reconnaissance vocale. Son efficacité a été confirmée par de nombreuses entreprises spécialisées en intelligence artificielle, notamment pour l’entraînement de modèles robustes capables de s’adapter à la diversité des situations du monde réel. Toutes les données ont été collectées, stockées et utilisées dans le strict respect des réglementations en matière de protection des données personnelles, conformément au RGPD, au CCPA et au PIPL.
Il s'agit d'un ensemble de données payant destiné à un usage commercial, à la recherche et plus encore. Ces Jeux de données prêts à l'emploi et sous licence contribuent au lancement de projets d'IA.
Spécifications
Format
16 kHz, 16 bits, format WAV non compressé, mono
Catégorisation du contenu
Les locuteurs sélectionnent plusieurs sujets familiers à partir d’une liste prédéfinie, et enregistrent des dialogues fluides et naturels
Conditions d'enregistrement
Environnement intérieur relativement silencieux, sans réverbération
Dispositifs d'enregistrement
Smartphones Android et iPhone ;
Informations d'enregisteur
338 participants au total, dont 152 hommes et 186 femmes ;
Pays
Mexique
Code de région linguistique
es-MX
Langue
Espagnol
Caractéristiques d'annotation
Annotation du contenu textuel, des horodatages de phrases, de l’identifiant du locuteur, du sexe et du bruit de fond
Précision
Taux de précision lexicale : 98%
Exemple
Audio
Doy esta clase cuatro semestres,
Audio
porque doy la asignatura de desarrollo físico y salud.
Audio
Pues más o menos, qué crees que este es un tema que yo trabajo regularmente con mis alumnos