[{"@type":"PropertyValue","name":"Format","value":"16 kHz, 16 bits, format WAV non compressé, mono"},{"@type":"PropertyValue","name":"Environnement d'enregistrement","value":"Environnement intérieur relativement silencieux, sans réverbération"},{"@type":"PropertyValue","name":"Contenu d'enregistrement","value":"Une liste de sujets est fournie ; les locuteurs en sélectionnent plusieurs qu’ils maîtrisent afin de garantir la fluidité des échanges, puis enregistrent une conversation autour de chaque sujet"},{"@type":"PropertyValue","name":"Intervenants","value":"238 locuteurs au total, dont 85 hommes et 153 femmes"},{"@type":"PropertyValue","name":"Caractéristiques d'annotation","value":"Annotation du contenu textuel, des points de début et de fin des phrases valides, de l’identifiant du locuteur et des étiquettes de bruit"},{"@type":"PropertyValue","name":"Dispositifs","value":"Smartphones Android et iPhone"},{"@type":"PropertyValue","name":"Langue","value":"Français canadien"},{"@type":"PropertyValue","name":"Scène d'application","value":"Reconnaissance vocale ; reconnaissance de l’empreinte vocale"},{"@type":"PropertyValue","name":"Précision","value":"Taux de précision lexicale : 98%"}]
{"id":1695,"datatype":"1","titleimg":"https://fr.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"155 heures de conversations naturelles en français canadien — collectées via téléphone mobile","datazy":[{"title":"Format","desc":"Format","content":"16 kHz, 16 bits, format WAV non compressé, mono"},{"title":"Environnement d'enregistrement","desc":"Environnement d'enregistrement","content":"Environnement intérieur relativement silencieux, sans réverbération"},{"title":"Contenu d'enregistrement","desc":"Contenu d'enregistrement","content":"Une liste de sujets est fournie ; les locuteurs en sélectionnent plusieurs qu’ils maîtrisent afin de garantir la fluidité des échanges, puis enregistrent une conversation autour de chaque sujet"},{"title":"Intervenants","desc":"Intervenants","content":"238 locuteurs au total, dont 85 hommes et 153 femmes"},{"title":"Caractéristiques d'annotation","desc":"Caractéristiques d'annotation","content":"Annotation du contenu textuel, des points de début et de fin des phrases valides, de l’identifiant du locuteur et des étiquettes de bruit"},{"title":"Dispositifs","desc":"Dispositifs","content":"Smartphones Android et iPhone"},{"title":"Langue","desc":"Langue","content":"Français canadien"},{"title":"Scène d'application","desc":"Scène d'application","content":"Reconnaissance vocale ; reconnaissance de l’empreinte vocale"},{"title":"Précision","desc":"Précision","content":"Taux de précision lexicale : 98%"}],"datatag":"Canada,French,Dialogue ","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"0001_005_phone-1.wav","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250402104054/0001_005_phone-1.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=S%2BNWcRCnE%2F0PWGKNbM5NavJ9btk%3D","intro":"Ses premiers amours, tout ça t'sais ?[N]","size":75020,"progress":100,"type":"mp3"},{"name":"0001_005_phone-2.wav","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250402104054/0001_005_phone-2.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=P%2BusA%2BfEVyxglTV2ozy4jiNs0yM%3D","intro":"Non, mais c'est c'est quoi que j'trouve beau?","size":76300,"progress":100,"type":"mp3"},{"name":"0001_005_phone-3.wav","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250402104054/0001_005_phone-3.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=VfgAN53VaArLA5R4i6Lc%2B9MWgGM%3D","intro":"Puis t'sais quand t'écoutes mettons des séries que là, ils ont trente-cinq ans puis tout ça puis là ta fille est une personne puis tout?","size":201644,"progress":100,"type":"mp3"},{"name":"0001_005_phone-4.wav","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250402104054/0001_005_phone-4.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=yO3NlmNhd0vjSSb%2FyqilLj3e1ME%3D","intro":"Tu es comme ah ah ah!","size":44972,"progress":100,"type":"mp3"},{"name":"0001_005_phone-5.wav","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250402104054/0001_005_phone-5.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=bDs8%2FnV2qOE35zG%2B5GvDlDiODck%3D","intro":"Donc euh t'sais quand tu vois des des premiers amours entre jeunes, puis t'sais c'est peu c'est c'est passionné c'est c'est ça ça c'est moins blasé.","size":253164,"progress":100,"type":"mp3"}],"officialSummary":"Les données vocales en français canadien _ conversations (téléphone portable) ont été enregistrées sur la base d’environ une trentaine de thèmes courants. Cet ensemble de données contient des annotations détaillant le contenu textuel, les horodatages des phrases, l'identité des locuteurs, leur sexe, ainsi que d'autres attributs. Il a été enregistré par 238 locuteurs natifs du Québec, issus de différentes régions et cultures, garantissant ainsi une grande précision. Ces données constituent une ressource précieuse pour la recherche et les applications en reconnaissance vocale, validée par plusieurs entreprises spécialisées en intelligence artificielle. Elles permettent aux modèles d’atteindre des performances exceptionnelles face à la diversité du monde réel. Nous respectons scrupuleusement les réglementations en matière de protection des données et de confidentialité, garantissant ainsi la protection des droits et de la vie privée des utilisateurs tout au long de la collecte, du stockage et de l'utilisation des données. Toutes les données respectent le GDPR, le CCPA et la PIPL.","dataexampl":null,"datakeyword":["Canada"," français"," dialogue"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,PT,DE,KO,FR,ES\"},{\"code\":\"4\",\"language\":\"JP\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"3\",\"language\":\"EN\"}]","productNameEn":"155 Hours - French(Canada) Spontaneous Dialogue Smartphone speech dataset","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
155 heures de conversations naturelles en français canadien — collectées via téléphone mobile
Canada
français
dialogue
Les données vocales en français canadien _ conversations (téléphone portable) ont été enregistrées sur la base d’environ une trentaine de thèmes courants. Cet ensemble de données contient des annotations détaillant le contenu textuel, les horodatages des phrases, l'identité des locuteurs, leur sexe, ainsi que d'autres attributs. Il a été enregistré par 238 locuteurs natifs du Québec, issus de différentes régions et cultures, garantissant ainsi une grande précision. Ces données constituent une ressource précieuse pour la recherche et les applications en reconnaissance vocale, validée par plusieurs entreprises spécialisées en intelligence artificielle. Elles permettent aux modèles d’atteindre des performances exceptionnelles face à la diversité du monde réel. Nous respectons scrupuleusement les réglementations en matière de protection des données et de confidentialité, garantissant ainsi la protection des droits et de la vie privée des utilisateurs tout au long de la collecte, du stockage et de l'utilisation des données. Toutes les données respectent le GDPR, le CCPA et la PIPL.
Il s'agit d'un ensemble de données payant destiné à un usage commercial, à la recherche et plus encore. Ces Jeux de données prêts à l'emploi et sous licence contribuent au lancement de projets d'IA.
Spécifications
Format
16 kHz, 16 bits, format WAV non compressé, mono
Environnement d'enregistrement
Environnement intérieur relativement silencieux, sans réverbération
Contenu d'enregistrement
Une liste de sujets est fournie ; les locuteurs en sélectionnent plusieurs qu’ils maîtrisent afin de garantir la fluidité des échanges, puis enregistrent une conversation autour de chaque sujet
Intervenants
238 locuteurs au total, dont 85 hommes et 153 femmes
Caractéristiques d'annotation
Annotation du contenu textuel, des points de début et de fin des phrases valides, de l’identifiant du locuteur et des étiquettes de bruit
Dispositifs
Smartphones Android et iPhone
Langue
Français canadien
Scène d'application
Reconnaissance vocale ; reconnaissance de l’empreinte vocale
Précision
Taux de précision lexicale : 98%
Exemple
Audio
Ses premiers amours, tout ça t'sais ?[N]
Audio
Non, mais c'est c'est quoi que j'trouve beau?
Audio
Puis t'sais quand t'écoutes mettons des séries que là, ils ont trente-cinq ans puis tout ça puis là ta fille est une personne puis tout?
Audio
Tu es comme ah ah ah!
Audio
Donc euh t'sais quand tu vois des des premiers amours entre jeunes, puis t'sais c'est peu c'est c'est passionné c'est c'est ça ça c'est moins blasé.