[{"@type":"PropertyValue","name":"Format","value":"16kHz, 16 bits, format WAV, mono"},{"@type":"PropertyValue","name":"Catégorisation du contenu","value":"Élocution spontanée par une seule personne, contenu libre ; chaque locuteur enregistre 20 phrases par langue (soit 40 au total), avec une durée de 10 à 20 secondes chacune"},{"@type":"PropertyValue","name":"Conditions d'enregistrement","value":"Environnement calme, sans écho, sans voix de fond ni bruits parasites tels que claquements de porte, bruits de rue ou voix tierces"},{"@type":"PropertyValue","name":"Dispositifs d'enregistrement","value":"Smartphones Android et iPhone"},{"@type":"PropertyValue","name":"Informations d'enregisteur","value":"Total : 302 participants, dont 46 % d’hommes et 54 % de femmes.291 personnes âgées de 18 à 37 ans, 10 de 38 à 45 ans, et 1 de 46 à 65 ans."},{"@type":"PropertyValue","name":"Pays","value":"Inde"},{"@type":"PropertyValue","name":"Langue","value":"Hindi, anglais"}]
{"id":1420,"datatype":"1","titleimg":"https://fr.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"302 participants – données vocales bilingues hindi/anglais – monologues – téléphone mobile","datazy":[{"title":"Format","desc":"Format","content":"16kHz, 16 bits, format WAV, mono"},{"title":"Catégorisation du contenu","desc":"Catégorisation du contenu","content":"Élocution spontanée par une seule personne, contenu libre ; chaque locuteur enregistre 20 phrases par langue (soit 40 au total), avec une durée de 10 à 20 secondes chacune"},{"title":"Conditions d'enregistrement","desc":"Conditions d'enregistrement","content":"Environnement calme, sans écho, sans voix de fond ni bruits parasites tels que claquements de porte, bruits de rue ou voix tierces"},{"title":"Dispositifs d'enregistrement","desc":"Dispositifs d'enregistrement","content":"Smartphones Android et iPhone"},{"title":"Informations d'enregisteur","desc":"Informations d'enregisteur","content":"Total : 302 participants, dont 46 % d’hommes et 54 % de femmes.291 personnes âgées de 18 à 37 ans, 10 de 38 à 45 ans, et 1 de 46 à 65 ans."},{"title":"Pays","desc":"Pays","content":"Inde"},{"title":"Langue","desc":"Langue","content":"Hindi, anglais"}],"datatag":"Spontaneous monologue,Natural Speech,Hindi,English,Bilingual","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"G00004S1021.wav","url":"https://storage-product.datatang.com/damp/product/samplePresentation_ipad/20250721152216/G00004S1021.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=jRqYujueWG1GwZHXDURjsXC%2BrI4%3D","intro":"","size":487620,"progress":100,"type":"mp3"},{"name":"G00004S1001.wav","url":"https://storage-product.datatang.com/damp/product/samplePresentation_ipad/20250721152216/G00004S1001.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=VZdf%2BKxijtgeFXcMD3u%2FGVYAkf8%3D","intro":"","size":364000,"progress":100,"type":"mp3"},{"name":"G00019S1023.wav","url":"https://storage-product.datatang.com/damp/product/samplePresentation_ipad/20250721152216/G00019S1023.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=NTW7R5ytHLsZ6eLeaDHdlkyoIz8%3D","intro":"","size":439086,"progress":100,"type":"mp3"},{"name":"G00019S1006.wav","url":"https://storage-product.datatang.com/damp/product/samplePresentation_ipad/20250721152216/G00019S1006.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=JcR90mFM0FNryXKERgYAT8sxUlM%3D","intro":"","size":530508,"progress":100,"type":"mp3"}],"officialSummary":"Ce corpus bilingue (hindi-anglais) de monologues enregistrés sur téléphone portable a été produit à partir de thèmes prédéfinis, couvrant divers sujets d’intérêt général. Il a été réalisé par 302 locuteurs âgés de 18 à 46 ans, issus de régions et de milieux culturels variés. Grâce à sa précision élevée, ce corpus constitue une ressource fiable pour la recherche et les applications en reconnaissance vocale. Validé par plusieurs entreprises spécialisées dans l’intelligence artificielle, il améliore significativement les performances des modèles face à la diversité du monde réel. Toutes les données ont été recueillies, stockées et exploitées dans le strict respect des réglementations sur la protection des données personnelles (RGPD, CCPA, PIPL).","dataexampl":null,"datakeyword":["Monologue spontané"," parole naturelle"," hindi"," anglais"," bilingue"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"302 Person - Hindi and English Bilingual Spontaneous Monologue smartphone speech dataset","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
Ce corpus bilingue (hindi-anglais) de monologues enregistrés sur téléphone portable a été produit à partir de thèmes prédéfinis, couvrant divers sujets d’intérêt général. Il a été réalisé par 302 locuteurs âgés de 18 à 46 ans, issus de régions et de milieux culturels variés. Grâce à sa précision élevée, ce corpus constitue une ressource fiable pour la recherche et les applications en reconnaissance vocale. Validé par plusieurs entreprises spécialisées dans l’intelligence artificielle, il améliore significativement les performances des modèles face à la diversité du monde réel. Toutes les données ont été recueillies, stockées et exploitées dans le strict respect des réglementations sur la protection des données personnelles (RGPD, CCPA, PIPL).
Il s'agit d'un ensemble de données payant destiné à un usage commercial, à la recherche et plus encore. Ces Jeux de données prêts à l'emploi et sous licence contribuent au lancement de projets d'IA.
Spécifications
Format
16kHz, 16 bits, format WAV, mono
Catégorisation du contenu
Élocution spontanée par une seule personne, contenu libre ; chaque locuteur enregistre 20 phrases par langue (soit 40 au total), avec une durée de 10 à 20 secondes chacune
Conditions d'enregistrement
Environnement calme, sans écho, sans voix de fond ni bruits parasites tels que claquements de porte, bruits de rue ou voix tierces
Dispositifs d'enregistrement
Smartphones Android et iPhone
Informations d'enregisteur
Total : 302 participants, dont 46 % d’hommes et 54 % de femmes.291 personnes âgées de 18 à 37 ans, 10 de 38 à 45 ans, et 1 de 46 à 65 ans.