[{"@type":"PropertyValue","name":"Format","value":"16 kHz, 16 bits, wav non compressé, mono"},{"@type":"PropertyValue","name":"Environnement d'enregistrement","value":"Intérieur relativement calme, pas d'écho"},{"@type":"PropertyValue","name":"Contenu d'enregistrement","value":"Une liste de sujets est fournie ; l'orateur en sélectionne plusieurs qu'il maîtrise afin d'assurer une conversation fluide et naturelle, et développe un dialogue autour de chaque sujet lors de l'enregistrement"},{"@type":"PropertyValue","name":"Caractéristiques de l'annotation","value":"Annotation du contenu du texte, de l'heure de début et de fin des phrases valides et du logo de l'orateur"},{"@type":"PropertyValue","name":"Appareil","value":"Téléphones Android, Téléphones Apple"},{"@type":"PropertyValue","name":"Langues","value":"Anglais américain, Anglais britannique, Anglais philippin, Anglais australien, Anglais indien, Français, Allemand, Italien, Japonais, Coréen, Portugais, Russe, Espagnol, Thaï, Vietnamien."}]
{"id":1892,"datatype":"1","titleimg":"https://fr.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"Ensemble de données pour le concours de dialogue vocal multilingue Interspeech 2025 - MLC-SLM","datazy":[{"title":"Format","desc":"Format","content":"16 kHz, 16 bits, wav non compressé, mono"},{"title":"Environnement d'enregistrement","desc":"Environnement d'enregistrement","content":"Intérieur relativement calme, pas d'écho"},{"title":"Contenu d'enregistrement","desc":"Contenu d'enregistrement","content":"Une liste de sujets est fournie ; l'orateur en sélectionne plusieurs qu'il maîtrise afin d'assurer une conversation fluide et naturelle, et développe un dialogue autour de chaque sujet lors de l'enregistrement"},{"title":"Caractéristiques de l'annotation","desc":"Caractéristiques de l'annotation","content":"Annotation du contenu du texte, de l'heure de début et de fin des phrases valides et du logo de l'orateur"},{"title":"Appareil","desc":"Appareil","content":"Téléphones Android, Téléphones Apple"},{"title":"Langues","desc":"Langues","content":"Anglais américain, Anglais britannique, Anglais philippin, Anglais australien, Anglais indien, Français, Allemand, Italien, Japonais, Coréen, Portugais, Russe, Espagnol, Thaï, Vietnamien."}],"datatag":"Challenge ,interspeech,mlc-slm,Conversational ","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"0022_001-1.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250815102905/0022_001-1.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=hzFnDSJljVWVQ0tPwyC0lHgLpLY%3D","intro":"one direction is the first thing like in the mind","size":89964,"progress":100,"type":"mp3"},{"name":"0019_001_phone-1.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250815102905/0019_001_phone-1.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=brQmectqi5gBtR5JBtozW2AZlcI%3D","intro":"Parce que j'ai plus l'ancien, j'en ai que celui-là dorénavant.","size":133452,"progress":100,"type":"mp3"},{"name":"0019_001_phone-2.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250815102905/0019_001_phone-2.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=PYIHEbEPwyvvnnaw3QcxA6RDBUI%3D","intro":"D'accord très bien l'autre, je vais l'effacer alors.","size":90220,"progress":100,"type":"mp3"},{"name":"0001_001-1.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250815102905/0001_001-1.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=N9kseFImwstZ6%2BVdh6JcvzEmqz8%3D","intro":"조금 이제 날씨도 더워지는데 덜 답답하구","size":136620,"progress":100,"type":"mp3"},{"name":"0001_001-6.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250815102905/0001_001-6.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=9WxMMMfd0avEp9uywfxFpTf7RZ4%3D","intro":"이천치십 년이랑 이천이십일 년 진짜 학교 못 간게","size":169036,"progress":100,"type":"mp3"}],"officialSummary":"Le contexte de l'ensemble de données pour le concours de dialogue vocal multilingue Interspeech 2025 - MLC-SLM est que Datatang a organisé le concours de discours de dialogue multilingue MLC-SLM en 2025, et l'ensemble de données provient des 15 ensembles de données de discours de dialogue de Datatang. Il est conçu pour briser le goulot d'étranglement de la reconnaissance vocale multilingue et de la technologie de compréhension de contexte long, et capturer véritablement des scénarios d'interaction complexes tels que le chevauchement des locuteurs et l'interruption impromptue, fournissant ainsi de riches ressources pour la recherche et les applications liées à la reconnaissance vocale, et aidant le modèle à bien fonctionner face à la diversité du monde réel. Nous respectons strictement les réglementations sur la protection des données et de la vie privée, en veillant à préserver la confidentialité et les droits légitimes des utilisateurs tout au long des processus d'acquisition, de stockage et d'utilisation. Toutes les données sont conformes au RGPD, à la CCPA et à la PIPL.","dataexampl":null,"datakeyword":["ensemble de données audio d'atelier"," ensemble de données mlc-slm"," données de reconnaissance vocale ASR"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"}]","productNameEn":"INTERSPEECH 2025 MLC-SLM Challenge Dataset","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
Ensemble de données pour le concours de dialogue vocal multilingue Interspeech 2025 - MLC-SLM
ensemble de données audio d'atelier
ensemble de données mlc-slm
données de reconnaissance vocale ASR
Le contexte de l'ensemble de données pour le concours de dialogue vocal multilingue Interspeech 2025 - MLC-SLM est que Datatang a organisé le concours de discours de dialogue multilingue MLC-SLM en 2025, et l'ensemble de données provient des 15 ensembles de données de discours de dialogue de Datatang. Il est conçu pour briser le goulot d'étranglement de la reconnaissance vocale multilingue et de la technologie de compréhension de contexte long, et capturer véritablement des scénarios d'interaction complexes tels que le chevauchement des locuteurs et l'interruption impromptue, fournissant ainsi de riches ressources pour la recherche et les applications liées à la reconnaissance vocale, et aidant le modèle à bien fonctionner face à la diversité du monde réel. Nous respectons strictement les réglementations sur la protection des données et de la vie privée, en veillant à préserver la confidentialité et les droits légitimes des utilisateurs tout au long des processus d'acquisition, de stockage et d'utilisation. Toutes les données sont conformes au RGPD, à la CCPA et à la PIPL.
Il s'agit d'un ensemble de données payant destiné à un usage commercial, à la recherche et plus encore. Ces Jeux de données prêts à l'emploi et sous licence contribuent au lancement de projets d'IA.
Spécifications
Format
16 kHz, 16 bits, wav non compressé, mono
Environnement d'enregistrement
Intérieur relativement calme, pas d'écho
Contenu d'enregistrement
Une liste de sujets est fournie ; l'orateur en sélectionne plusieurs qu'il maîtrise afin d'assurer une conversation fluide et naturelle, et développe un dialogue autour de chaque sujet lors de l'enregistrement
Caractéristiques de l'annotation
Annotation du contenu du texte, de l'heure de début et de fin des phrases valides et du logo de l'orateur