[{"@type":"PropertyValue","name":"Volume des données","value":"202 participants, chacun avec 13 segments audio-vidéo sous différents angles et un fichier texte"},{"@type":"PropertyValue","name":"Répartition des intervenants","value":"Répartition ethnique : personnes d’origine asiatique (Indonésie) ; sexe : 89 hommes, 113 femmes ; tranches d’âge : 165 entre 18-30 ans, 32 entre 31-45 ans, 5 entre 46-60 ans"},{"@type":"PropertyValue","name":"Environnement de collecte","value":"Scènes en intérieur avec lumière naturelle ou lumière fluorescente"},{"@type":"PropertyValue","name":"Diversité des données","value":"Divers environnements, tranches d’âge et angles de prise de vue"},{"@type":"PropertyValue","name":"Appareils de collecte","value":"Smartphone, résolution vidéo : 1 920 × 1 080"},{"@type":"PropertyValue","name":"Angle de prise de son","value":"Captation audio-vidéo sous 13 angles : face, 3 angles côté gauche, 3 angles côté droit, vue plongeante, contre-plongée, côté gauche en vue plongeante et contre-plongée, côté droit en vue plongeante et contre-plongée"},{"@type":"PropertyValue","name":"Contenu d'enregistrement","value":"Domaine général, contenu non restreint"},{"@type":"PropertyValue","name":"Langue","value":"Mandarin standard, durée de chaque segment vidéo supérieure à 20 secondes"},{"@type":"PropertyValue","name":"Format des données","value":"Format vidéo : .mp4 ; audio ≥ 16 kHz, 16 bits ; fréquence d’images : 25 à 30 fps"},{"@type":"PropertyValue","name":"Précision","value":"Précision des caractères ≥ 95 %"}]
{"id":1298,"datatype":"1","titleimg":"https://fr.nexdata.ai/shujutang/static/image/index/datatang_tuxiang_default.webp","type1":"147","type1str":null,"type2":"149","type2str":null,"dataname":"Données vidéo multimodales de mouvements labiaux sous angles multiples – 202 participants","datazy":[{"title":"Volume des données","desc":"Volume des données","content":"202 participants, chacun avec 13 segments audio-vidéo sous différents angles et un fichier texte"},{"title":"Répartition des intervenants","desc":"Répartition des intervenants","content":"Répartition ethnique : personnes d’origine asiatique (Indonésie) ; sexe : 89 hommes, 113 femmes ; tranches d’âge : 165 entre 18-30 ans, 32 entre 31-45 ans, 5 entre 46-60 ans"},{"title":"Environnement de collecte","desc":"Environnement de collecte","content":"Scènes en intérieur avec lumière naturelle ou lumière fluorescente"},{"title":"Diversité des données","desc":"Diversité des données","content":"Divers environnements, tranches d’âge et angles de prise de vue"},{"title":"Appareils de collecte","desc":"Appareils de collecte","content":"Smartphone, résolution vidéo : 1 920 × 1 080"},{"title":"Angle de prise de son","desc":"Angle de prise de son","content":"Captation audio-vidéo sous 13 angles : face, 3 angles côté gauche, 3 angles côté droit, vue plongeante, contre-plongée, côté gauche en vue plongeante et contre-plongée, côté droit en vue plongeante et contre-plongée"},{"title":"Contenu d'enregistrement","desc":"Contenu d'enregistrement","content":"Domaine général, contenu non restreint"},{"title":"Langue","desc":"Langue","content":"Mandarin standard, durée de chaque segment vidéo supérieure à 20 secondes"},{"title":"Format des données","desc":"Format des données","content":"Format vidéo : .mp4 ; audio ≥ 16 kHz, 16 bits ; fréquence d’images : 25 à 30 fps"},{"title":"Précision","desc":"Précision","content":"Précision des caractères ≥ 95 %"}],"datatag":"Lip multimodal,Mandarin Chinese,Multiple scenes,Different ages,Different shooting angles","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"/data/apps/damp/temp/ziptemp/APY230627001_demo1715767204254/APY230627001_demo/002_male_29.png","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230627001_demo1715767204254/APY230627001_demo/002_male_29.png?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=ALASNNOKRu%2FsdItuxWu7btO8Gqs%3D","intro":"","size":0,"progress":100,"type":"jpg"},{"name":"/data/apps/damp/temp/ziptemp/APY230627001_demo1715767204254/APY230627001_demo/001_female_30.png","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230627001_demo1715767204254/APY230627001_demo/001_female_30.png?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=mZRLnTYk5W0s3jRzP7Um81hhRvw%3D","intro":"","size":0,"progress":100,"type":"jpg"},{"name":"/data/apps/damp/temp/ziptemp/APY230627001_demo1715767204254/APY230627001_demo/156_male_42.png","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230627001_demo1715767204254/APY230627001_demo/156_male_42.png?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=2wVvKW6e6XgkYOi9kPqptswFKGs%3D","intro":"","size":0,"progress":100,"type":"jpg"}],"officialSummary":"Ce corpus multimodal dédié à l’analyse des mouvements labiaux comprend des vidéos de 202 participants, filmées sous 13 angles distincts. Les enregistrements ont été réalisés en intérieur, sous lumière naturelle et artificielle, à l’aide de téléphones portables. Il intègre une diversité de scènes et de tranches d’âge. Les contenus, enregistrés en mandarin standard, couvrent un large éventail de domaines. Cette ressource est destinée à la recherche avancée en apprentissage multimodal dans le domaine audio-visuel.","dataexampl":null,"datakeyword":["Multi-angles"," multimodalité labiale"," scènes intérieures en lumière naturelle"," scènes intérieures sous éclairage fluorescent"," 13 angles de prise de vue"," chinois mandarin"," domaine général"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"202 People - Multi-angle Lip Multimodal Video Data","BGimg":"","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"],"firstList":[{"name":"/data/apps/damp/temp/ziptemp/APY230627001_demo1715767204254/APY230627001_demo/090_female_38.png","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230627001_demo1715767204254/APY230627001_demo/090_female_38.png?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=c6Jkb362VMrtxemlPNPSW%2FkEH%2Fk%3D","intro":"","size":0,"progress":100,"type":"jpg"}]}
Données vidéo multimodales de mouvements labiaux sous angles multiples – 202 participants
Multi-angles
multimodalité labiale
scènes intérieures en lumière naturelle
scènes intérieures sous éclairage fluorescent
13 angles de prise de vue
chinois mandarin
domaine général
Ce corpus multimodal dédié à l’analyse des mouvements labiaux comprend des vidéos de 202 participants, filmées sous 13 angles distincts. Les enregistrements ont été réalisés en intérieur, sous lumière naturelle et artificielle, à l’aide de téléphones portables. Il intègre une diversité de scènes et de tranches d’âge. Les contenus, enregistrés en mandarin standard, couvrent un large éventail de domaines. Cette ressource est destinée à la recherche avancée en apprentissage multimodal dans le domaine audio-visuel.
Il s'agit d'un ensemble de données payant destiné à un usage commercial, à la recherche et plus encore. Ces Jeux de données prêts à l'emploi et sous licence contribuent au lancement de projets d'IA.
Spécifications
Volume des données
202 participants, chacun avec 13 segments audio-vidéo sous différents angles et un fichier texte
Répartition des intervenants
Répartition ethnique : personnes d’origine asiatique (Indonésie) ; sexe : 89 hommes, 113 femmes ; tranches d’âge : 165 entre 18-30 ans, 32 entre 31-45 ans, 5 entre 46-60 ans
Environnement de collecte
Scènes en intérieur avec lumière naturelle ou lumière fluorescente
Diversité des données
Divers environnements, tranches d’âge et angles de prise de vue
Appareils de collecte
Smartphone, résolution vidéo : 1 920 × 1 080
Angle de prise de son
Captation audio-vidéo sous 13 angles : face, 3 angles côté gauche, 3 angles côté droit, vue plongeante, contre-plongée, côté gauche en vue plongeante et contre-plongée, côté droit en vue plongeante et contre-plongée
Contenu d'enregistrement
Domaine général, contenu non restreint
Langue
Mandarin standard, durée de chaque segment vidéo supérieure à 20 secondes
Format des données
Format vidéo : .mp4 ; audio ≥ 16 kHz, 16 bits ; fréquence d’images : 25 à 30 fps