[{"@type":"PropertyValue","name":"Format","value":"16 kHz, 16 bits, format WAV non compressé, mono"},{"@type":"PropertyValue","name":"Catégorisation du contenu","value":"Les locuteurs sélectionnent plusieurs sujets familiers à partir d’une liste prédéfinie, et enregistrent des dialogues fluides et naturels"},{"@type":"PropertyValue","name":"Conditions d'enregistrement","value":"Environnement intérieur relativement silencieux, sans réverbération"},{"@type":"PropertyValue","name":"Dispositifs d'enregistrement","value":"Smartphones Android et iPhone ;"},{"@type":"PropertyValue","name":"Informations d'enregisteur","value":"168 participants au total, dont 82 hommes et 86 femmes ;"},{"@type":"PropertyValue","name":"Pays","value":"Indonésie"},{"@type":"PropertyValue","name":"Code de région linguistique","value":"id-ID"},{"@type":"PropertyValue","name":"Langue","value":"Indonésien"},{"@type":"PropertyValue","name":"Caractéristiques d'annotation","value":"Annotation du contenu textuel, des horodatages de phrases, des identifiants des locuteurs et du genre"},{"@type":"PropertyValue","name":"Précision","value":"Taux de précision lexicale : 98%"}]
{"id":1447,"datatype":"1","titleimg":"https://fr.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"103 heures de données vocales en indonésien (Indonésie) – téléphone mobile","datazy":[{"title":"Format","desc":"Format","content":"16 kHz, 16 bits, format WAV non compressé, mono"},{"title":"Catégorisation du contenu","desc":"Catégorisation du contenu","content":"Les locuteurs sélectionnent plusieurs sujets familiers à partir d’une liste prédéfinie, et enregistrent des dialogues fluides et naturels"},{"title":"Conditions d'enregistrement","desc":"Conditions d'enregistrement","content":"Environnement intérieur relativement silencieux, sans réverbération"},{"title":"Dispositifs d'enregistrement","desc":"Dispositifs d'enregistrement","content":"Smartphones Android et iPhone ;"},{"title":"Informations d'enregisteur","desc":"Informations d'enregisteur","content":"168 participants au total, dont 82 hommes et 86 femmes ;"},{"title":"Pays","desc":"Pays","content":"Indonésie"},{"title":"Code de région linguistique","desc":"Code de région linguistique","content":"id-ID"},{"title":"Langue","desc":"Langue","content":"Indonésien"},{"title":"Caractéristiques d'annotation","desc":"Caractéristiques d'annotation","content":"Annotation du contenu textuel, des horodatages de phrases, des identifiants des locuteurs et du genre"},{"title":"Précision","desc":"Précision","content":"Taux de précision lexicale : 98%"}],"datatag":"Indonesian,Indonesia,Dialogue,Phone","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"/data/apps/damp/temp/ziptemp/APY240228001_demo1715248803296/APY240228001_demo/00006_001-2.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY240228001_demo1715248803296/APY240228001_demo/00006_001-2.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=BatCWa2NyAYC6VNOsAIHB0nyIsc%3D","intro":"Oh iya, torch itu yang di kayak dibakar pake api.","size":0,"progress":100,"type":"mp3"},{"name":"/data/apps/damp/temp/ziptemp/APY240228001_demo1715248803296/APY240228001_demo/00006_001-5.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY240228001_demo1715248803296/APY240228001_demo/00006_001-5.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=Lu34T0D%2FL%2F0Ihp2NHwcuoOy%2BHH8%3D","intro":"Kayaknya sih dikasih apa, kayaknya tuh ada top beberapa topping gitu loh, ada beberapa topping. Kayaknya ada keju juga deh kuliat kemaren, kalo enggak salah.","size":0,"progress":100,"type":"mp3"},{"name":"/data/apps/damp/temp/ziptemp/APY240228001_demo1715248803296/APY240228001_demo/00006_001-4.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY240228001_demo1715248803296/APY240228001_demo/00006_001-4.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=hR0SI8zYQsXKPJ0tenP755yC%2Bfs%3D","intro":"Dikasih keju?","size":0,"progress":100,"type":"mp3"},{"name":"/data/apps/damp/temp/ziptemp/APY240228001_demo1715248803296/APY240228001_demo/00006_001-8.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY240228001_demo1715248803296/APY240228001_demo/00006_001-8.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=yLrX5byXOvAI7Zc4bwkbPiiUwgk%3D","intro":"Range harga kemaren itu tu, orang itu bilang murah.","size":0,"progress":100,"type":"mp3"},{"name":"/data/apps/damp/temp/ziptemp/APY240228001_demo1715248803296/APY240228001_demo/00006_001-10.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY240228001_demo1715248803296/APY240228001_demo/00006_001-10.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=KjItjOdL5aAkr6o9pGUMWEjCp4g%3D","intro":"Kayaknya murah sih. Terus yang ngeja yang lebih menarik lagi refill, jadi itu nasinya bisa ngambil lagi, gitu.","size":0,"progress":100,"type":"mp3"}],"officialSummary":"Les données vocales en indonésien _ conversations (téléphone portable) ont été enregistrées sur la base d’environ une trentaine de thèmes courants. Cet ensemble de données contient des annotations détaillant le contenu textuel, les horodatages des phrases, l'identité des locuteurs, leur sexe, ainsi que d'autres attributs. Il a été enregistré par 168 locuteurs natifs indonésiens, issus de différentes régions et cultures, garantissant ainsi une grande précision. Ces données constituent une ressource précieuse pour la recherche et les applications en reconnaissance vocale, validée par plusieurs entreprises spécialisées en intelligence artificielle. Elles permettent aux modèles d’atteindre des performances exceptionnelles face à la diversité du monde réel. Nous respectons scrupuleusement les réglementations en matière de protection des données et de confidentialité, garantissant ainsi la protection des droits et de la vie privée des utilisateurs tout au long de la collecte, du stockage et de l'utilisation des données. Toutes les données respectent le GDPR, le CCPA et la PIPL.","dataexampl":null,"datakeyword":["audio"," données"," ensemble de données"," conversationnel"," données ASR"," indonésien"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"747 Hours - Indonesian(Indonesia) Spontaneous Dialogue Smartphone Speech Dataset","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
103 heures de données vocales en indonésien (Indonésie) – téléphone mobile
audio
données
ensemble de données
conversationnel
données ASR
indonésien
Les données vocales en indonésien _ conversations (téléphone portable) ont été enregistrées sur la base d’environ une trentaine de thèmes courants. Cet ensemble de données contient des annotations détaillant le contenu textuel, les horodatages des phrases, l'identité des locuteurs, leur sexe, ainsi que d'autres attributs. Il a été enregistré par 168 locuteurs natifs indonésiens, issus de différentes régions et cultures, garantissant ainsi une grande précision. Ces données constituent une ressource précieuse pour la recherche et les applications en reconnaissance vocale, validée par plusieurs entreprises spécialisées en intelligence artificielle. Elles permettent aux modèles d’atteindre des performances exceptionnelles face à la diversité du monde réel. Nous respectons scrupuleusement les réglementations en matière de protection des données et de confidentialité, garantissant ainsi la protection des droits et de la vie privée des utilisateurs tout au long de la collecte, du stockage et de l'utilisation des données. Toutes les données respectent le GDPR, le CCPA et la PIPL.
Il s'agit d'un ensemble de données payant destiné à un usage commercial, à la recherche et plus encore. Ces Jeux de données prêts à l'emploi et sous licence contribuent au lancement de projets d'IA.
Spécifications
Format
16 kHz, 16 bits, format WAV non compressé, mono
Catégorisation du contenu
Les locuteurs sélectionnent plusieurs sujets familiers à partir d’une liste prédéfinie, et enregistrent des dialogues fluides et naturels
Conditions d'enregistrement
Environnement intérieur relativement silencieux, sans réverbération
Dispositifs d'enregistrement
Smartphones Android et iPhone ;
Informations d'enregisteur
168 participants au total, dont 82 hommes et 86 femmes ;
Pays
Indonésie
Code de région linguistique
id-ID
Langue
Indonésien
Caractéristiques d'annotation
Annotation du contenu textuel, des horodatages de phrases, des identifiants des locuteurs et du genre
Précision
Taux de précision lexicale : 98%
Exemple
Audio
Oh iya, torch itu yang di kayak dibakar pake api.
Audio
Kayaknya sih dikasih apa, kayaknya tuh ada top beberapa topping gitu loh, ada beberapa topping. Kayaknya ada keju juga deh kuliat kemaren, kalo enggak salah.
Audio
Dikasih keju?
Audio
Range harga kemaren itu tu, orang itu bilang murah.
Audio
Kayaknya murah sih. Terus yang ngeja yang lebih menarik lagi refill, jadi itu nasinya bisa ngambil lagi, gitu.