[{"@type":"PropertyValue","name":"Format","value":"8 kHz, 8 bits, format pcm ulaw/alaw, mono;"},{"@type":"PropertyValue","name":"Catégorisation du contenu","value":"Les locuteurs sélectionnent plusieurs sujets familiers à partir d’une liste prédéfinie, et enregistrent des dialogues fluides et naturels;"},{"@type":"PropertyValue","name":"Conditions d'enregistrement","value":"Environnement intérieur relativement silencieux, sans réverbération;"},{"@type":"PropertyValue","name":"Dispositifs d'enregistrement","value":"Système d’enregistrement téléphonique;"},{"@type":"PropertyValue","name":"Informations d'enregisteur","value":"264 participants au total, dont 99 hommes et 165 femmes ;"},{"@type":"PropertyValue","name":"Pays","value":"Philippines"},{"@type":"PropertyValue","name":"Code de région linguistique","value":"tl-PH;"},{"@type":"PropertyValue","name":"Langue","value":"Philippin"},{"@type":"PropertyValue","name":"Caractéristiques d'annotation","value":"Annotation du contenu textuel, des horodatages de phrases, de l’identifiant du locuteur, du sexe et du bruit de fond;"},{"@type":"PropertyValue","name":"Précision","value":"Taux de précision lexicale : 98%;"}]
{"id":1415,"datatype":"1","titleimg":"https://fr.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"147 heures de dialogues naturels en philippin – canal téléphonique","datazy":[{"title":"Format","desc":"Format","content":"8 kHz, 8 bits, format pcm ulaw/alaw, mono;"},{"title":"Catégorisation du contenu","desc":"Catégorisation du contenu","content":"Les locuteurs sélectionnent plusieurs sujets familiers à partir d’une liste prédéfinie, et enregistrent des dialogues fluides et naturels;"},{"title":"Conditions d'enregistrement","desc":"Conditions d'enregistrement","content":"Environnement intérieur relativement silencieux, sans réverbération;"},{"title":"Dispositifs d'enregistrement","desc":"Dispositifs d'enregistrement","content":"Système d’enregistrement téléphonique;"},{"title":"Informations d'enregisteur","desc":"Informations d'enregisteur","content":"264 participants au total, dont 99 hommes et 165 femmes ;"},{"title":"Pays","desc":"Pays","content":"Philippines"},{"title":"Code de région linguistique","desc":"Code de région linguistique","content":"tl-PH;"},{"title":"Langue","desc":"Langue","content":"Philippin"},{"title":"Caractéristiques d'annotation","desc":"Caractéristiques d'annotation","content":"Annotation du contenu textuel, des horodatages de phrases, de l’identifiant du locuteur, du sexe et du bruit de fond;"},{"title":"Précision","desc":"Précision","content":"Taux de précision lexicale : 98%;"}],"datatag":"Filipino,Conversational,Telephone,Tagalog","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"/data/apps/damp/temp/ziptemp/APY240115001_demo1712829644266/APY240115001_demo/00024_001_telephone-1.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY240115001_demo1712829644266/APY240115001_demo/00024_001_telephone-1.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=rf3qTg2SKLwV2ZMsT2sgKrltSps%3D","intro":"Ang bata na nasa wastong edad ay dadaan sa ibat-ibang yugto ng pag-aaral.","size":0,"progress":100,"type":"mp3"},{"name":"/data/apps/damp/temp/ziptemp/APY240115001_demo1712829644266/APY240115001_demo/00024_001_telephone-3.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY240115001_demo1712829644266/APY240115001_demo/00024_001_telephone-3.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=WKu8Kdp5%2BW3VHrK2TyS30dOc1P4%3D","intro":"Pagkatapos niya makapagtapos ng sekondarya, tutungo naman ang mag-aaral sa kolehiyo. [N]","size":0,"progress":100,"type":"mp3"},{"name":"/data/apps/damp/temp/ziptemp/APY240115001_demo1712829644266/APY240115001_demo/00024_001_telephone-5.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY240115001_demo1712829644266/APY240115001_demo/00024_001_telephone-5.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=f%2FPhcuXHch9O259uC%2FOPoTbZPxY%3D","intro":"Hindi lamang sa paaralan naka-sentro ang edukasyon. Ito ay makikita rin maging sa ating tahanan at kapaligiran.","size":0,"progress":100,"type":"mp3"},{"name":"/data/apps/damp/temp/ziptemp/APY240115001_demo1712829644266/APY240115001_demo/00024_001_telephone-2.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY240115001_demo1712829644266/APY240115001_demo/00024_001_telephone-2.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=rTqd0Wed94FEQR%2Bgx0APZi8dKfI%3D","intro":"Simula, elementarya, patungo sa ekse- sekondarya o mataas na paaralan.","size":0,"progress":100,"type":"mp3"},{"name":"/data/apps/damp/temp/ziptemp/APY240115001_demo1712829644266/APY240115001_demo/00024_001_telephone-6.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY240115001_demo1712829644266/APY240115001_demo/00024_001_telephone-6.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=umEWosDp3R5bfUspSVaGVxLVsIg%3D","intro":"Simula pa man nung noong tayo ay mga bata pa, tinuturuan na tayo ng ating mga magulang ng mabuting asal. [N]","size":0,"progress":100,"type":"mp3"}],"officialSummary":"Ce corpus de conversations téléphoniques en philippin a été conçu à partir d’enregistrements simulés autour d’une trentaine de thématiques courantes. Il est enrichi de métadonnées incluant les transcriptions, les horodatages par phrase, l’identité et le genre des locuteurs. Enregistré par environ 264 locuteurs natifs provenant de diverses régions et cultures des Philippines, ce jeu de données se distingue par sa grande précision. Il constitue une ressource stratégique pour les recherches et applications en reconnaissance vocale, validée par plusieurs entreprises du secteur de l’IA. L’ensemble du processus de collecte, de stockage et d’exploitation respecte rigoureusement les normes de protection des données personnelles (RGPD, CCPA, PIPL).","dataexampl":null,"datakeyword":["Philippin"," conversationnel"," téléphone"," données vocales tagalog"," données audio tagalog"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"147 Hours - Tagalog(the Philippines) Spontaneous Dialogue Telephony speech dataset","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
147 heures de dialogues naturels en philippin – canal téléphonique
Philippin
conversationnel
téléphone
données vocales tagalog
données audio tagalog
Ce corpus de conversations téléphoniques en philippin a été conçu à partir d’enregistrements simulés autour d’une trentaine de thématiques courantes. Il est enrichi de métadonnées incluant les transcriptions, les horodatages par phrase, l’identité et le genre des locuteurs. Enregistré par environ 264 locuteurs natifs provenant de diverses régions et cultures des Philippines, ce jeu de données se distingue par sa grande précision. Il constitue une ressource stratégique pour les recherches et applications en reconnaissance vocale, validée par plusieurs entreprises du secteur de l’IA. L’ensemble du processus de collecte, de stockage et d’exploitation respecte rigoureusement les normes de protection des données personnelles (RGPD, CCPA, PIPL).
Il s'agit d'un ensemble de données payant destiné à un usage commercial, à la recherche et plus encore. Ces Jeux de données prêts à l'emploi et sous licence contribuent au lancement de projets d'IA.
Spécifications
Format
8 kHz, 8 bits, format pcm ulaw/alaw, mono;
Catégorisation du contenu
Les locuteurs sélectionnent plusieurs sujets familiers à partir d’une liste prédéfinie, et enregistrent des dialogues fluides et naturels;
Conditions d'enregistrement
Environnement intérieur relativement silencieux, sans réverbération;
Dispositifs d'enregistrement
Système d’enregistrement téléphonique;
Informations d'enregisteur
264 participants au total, dont 99 hommes et 165 femmes ;
Pays
Philippines
Code de région linguistique
tl-PH;
Langue
Philippin
Caractéristiques d'annotation
Annotation du contenu textuel, des horodatages de phrases, de l’identifiant du locuteur, du sexe et du bruit de fond;
Précision
Taux de précision lexicale : 98%;
Exemple
Audio
Ang bata na nasa wastong edad ay dadaan sa ibat-ibang yugto ng pag-aaral.
Audio
Pagkatapos niya makapagtapos ng sekondarya, tutungo naman ang mag-aaral sa kolehiyo. [N]
Audio
Hindi lamang sa paaralan naka-sentro ang edukasyon. Ito ay makikita rin maging sa ating tahanan at kapaligiran.
Audio
Simula, elementarya, patungo sa ekse- sekondarya o mataas na paaralan.
Audio
Simula pa man nung noong tayo ay mga bata pa, tinuturuan na tayo ng ating mga magulang ng mabuting asal. [N]