[{"@type":"PropertyValue","name":"Format","value":"16kHz, 16 bits, format WAV, mono"},{"@type":"PropertyValue","name":"Catégorisation du contenu","value":"Conversations, contenus de médias sociaux, émissions de variétés, etc."},{"@type":"PropertyValue","name":"Environnement d'enregistrement","value":"Faible bruit de fond"},{"@type":"PropertyValue","name":"Pays","value":"Canada"},{"@type":"PropertyValue","name":"Code de région linguistique","value":"fr-CA"},{"@type":"PropertyValue","name":"Langue","value":"Français"},{"@type":"PropertyValue","name":"Caractéristiques d'annotation","value":"Annotation du contenu textuel, des horodatages de phrases, de l’identifiant du locuteur, du sexe et du bruit de fond"},{"@type":"PropertyValue","name":"Précision","value":"Taux de précision lexicale : 98 % (hors étiquettes, genre, identifiants de locuteur, accent ou sujet)"}]
{"id":1705,"datatype":"1","titleimg":"https://fr.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"1 500 heures de données vocales en français canadien — style oral","datazy":[{"title":"Format","desc":"Format","content":"16kHz, 16 bits, format WAV, mono"},{"title":"Catégorisation du contenu","desc":"Catégorisation du contenu","content":"Conversations, contenus de médias sociaux, émissions de variétés, etc."},{"title":"Environnement d'enregistrement","desc":"Environnement d'enregistrement","content":"Faible bruit de fond"},{"title":"Pays","desc":"Pays","content":"Canada"},{"title":"Code de région linguistique","desc":"Code de région linguistique","content":"fr-CA"},{"title":"Langue","desc":"Langue","content":"Français"},{"title":"Caractéristiques d'annotation","desc":"Caractéristiques d'annotation","content":"Annotation du contenu textuel, des horodatages de phrases, de l’identifiant du locuteur, du sexe et du bruit de fond"},{"title":"Précision","desc":"Précision","content":"Taux de précision lexicale : 98 % (hors étiquettes, genre, identifiants de locuteur, accent ou sujet)"}],"datatag":"Canada,French,Casual Conversation,ASR","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"000087_1.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250722160934/000087_1.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=s8S0BuLoQpJhhWfy6qdZhxrgr7o%3D","intro":"Nous sommes le trois août deux mille onze dans la ville de Victoria, en Colombie-Britannique.","size":193324,"progress":100,"type":"mp3"},{"name":"000087_5.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250722160934/000087_5.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=wk1mBo4mrrcpABD98iUB3pXMRuY%3D","intro":"Il y a deux hommes, deux jeunes hommes sur le plancher, couchés.","size":117164,"progress":100,"type":"mp3"},{"name":"000052_15.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250722160934/000052_15.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=s2YHi9%2FHgMtTR6AQzAqmMoasgd8%3D","intro":"On faisait référence beaucoup à la série Selling Sunset. [N]","size":100790,"progress":100,"type":"mp3"}],"officialSummary":"Les données vocales en français canadien _ conversation informelle, couvrent des domaines généraux tels que les dialogues, les médias sociaux et les émissions de divertissement, reflétant des contextes interactifs du monde réel. Cet ensemble de données comprend des annotations relatives au contenu textuel, à l’identité et au sexe des locuteurs. Ces données sont précises, faciles à utiliser et constituent une ressource essentielle pour les recherches et applications en reconnaissance vocale. Elles permettent aux modèles de faire face efficacement à la diversité du monde réel. Nous respectons strictement les lois en matière de protection des données et de la vie privée, garantissant la sécurité des utilisateurs tout au long du processus de collecte, de stockage et d’utilisation. Toutes les données sont conformes au GDPR, au CCPA et à la PIPL.","dataexampl":null,"datakeyword":["Canada"," français"," conversation informelle"," ASR"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"1464 Hours - French(Canada) Real-world Casual Conversation and Monologue speech dataset","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
1 500 heures de données vocales en français canadien — style oral
Canada
français
conversation informelle
ASR
Les données vocales en français canadien _ conversation informelle, couvrent des domaines généraux tels que les dialogues, les médias sociaux et les émissions de divertissement, reflétant des contextes interactifs du monde réel. Cet ensemble de données comprend des annotations relatives au contenu textuel, à l’identité et au sexe des locuteurs. Ces données sont précises, faciles à utiliser et constituent une ressource essentielle pour les recherches et applications en reconnaissance vocale. Elles permettent aux modèles de faire face efficacement à la diversité du monde réel. Nous respectons strictement les lois en matière de protection des données et de la vie privée, garantissant la sécurité des utilisateurs tout au long du processus de collecte, de stockage et d’utilisation. Toutes les données sont conformes au GDPR, au CCPA et à la PIPL.
Il s'agit d'un ensemble de données payant destiné à un usage commercial, à la recherche et plus encore. Ces Jeux de données prêts à l'emploi et sous licence contribuent au lancement de projets d'IA.
Spécifications
Format
16kHz, 16 bits, format WAV, mono
Catégorisation du contenu
Conversations, contenus de médias sociaux, émissions de variétés, etc.
Environnement d'enregistrement
Faible bruit de fond
Pays
Canada
Code de région linguistique
fr-CA
Langue
Français
Caractéristiques d'annotation
Annotation du contenu textuel, des horodatages de phrases, de l’identifiant du locuteur, du sexe et du bruit de fond
Précision
Taux de précision lexicale : 98 % (hors étiquettes, genre, identifiants de locuteur, accent ou sujet)
Exemple
Audio
Nous sommes le trois août deux mille onze dans la ville de Victoria, en Colombie-Britannique.
Audio
Il y a deux hommes, deux jeunes hommes sur le plancher, couchés.
Audio
On faisait référence beaucoup à la série Selling Sunset. [N]