[{"@type":"PropertyValue","name":"Format","value":"16 kHz, 16 bits, WAV non compressé, mono"},{"@type":"PropertyValue","name":"Classification du contenu","value":"Les locuteurs choisissaient plusieurs sujets familiers dans une liste spécifique, enregistrant un dialogue fluide et naturel pour chacun."},{"@type":"PropertyValue","name":"Conditions d'enregistrement","value":"Intérieur relativement calme, sans écho"},{"@type":"PropertyValue","name":"Appareil d'enregistrement","value":"Téléphones Android, téléphones Apple"},{"@type":"PropertyValue","name":"Informations sur les locuteurs","value":"Environ 400 personnes"},{"@type":"PropertyValue","name":"Pays","value":"Tanzanie"},{"@type":"PropertyValue","name":"Langue","value":"Swahili"},{"@type":"PropertyValue","name":"Caractéristiques des annotations","value":"Transcription du contenu texte, horodatages des phrases, identifiant du locuteur, genre, annotation du bruit"},{"@type":"PropertyValue","name":"Précision","value":"Précision au niveau du mot : 98%"}]
{"id":1692,"datatype":"1","titleimg":"https://fr.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"300 heures de données collectées de dialogues naturels en swahili","datazy":[{"title":"Format","desc":"Format","content":"16 kHz, 16 bits, WAV non compressé, mono"},{"title":"Classification du contenu","desc":"Classification du contenu","content":"Les locuteurs choisissaient plusieurs sujets familiers dans une liste spécifique, enregistrant un dialogue fluide et naturel pour chacun."},{"title":"Conditions d'enregistrement","desc":"Conditions d'enregistrement","content":"Intérieur relativement calme, sans écho"},{"title":"Appareil d'enregistrement","desc":"Appareil d'enregistrement","content":"Téléphones Android, téléphones Apple"},{"title":"Informations sur les locuteurs","desc":"Informations sur les locuteurs","content":"Environ 400 personnes"},{"title":"Pays","desc":"Pays","content":"Tanzanie"},{"title":"Langue","desc":"Langue","content":"Swahili"},{"title":"Caractéristiques des annotations","desc":"Caractéristiques des annotations","content":"Transcription du contenu texte, horodatages des phrases, identifiant du locuteur, genre, annotation du bruit"},{"title":"Précision","desc":"Précision","content":"Précision au niveau du mot : 98%"}],"datatag":" Swahili,Tanzania, Dialogue ","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"00004_003_phone-1.wav","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250709115524/00004_003_phone-1.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=71UTbrBMic7F%2BdDCWxfazTlPPJQ%3D","intro":"Mmmh kwangu mimi napenda wali na njegele, [N]","size":237452,"progress":100,"type":"mp3"},{"name":"00004_003_phone-2.wav","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250709115524/00004_003_phone-2.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=RvNHzPf38BEfn3%2FoEczHRUziwqA%3D","intro":"sababu ni chakula kinachonivutia na kinachoongeza madini mwilini.","size":171212,"progress":100,"type":"mp3"},{"name":"00004_003_phone-4.wav","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250709115524/00004_003_phone-4.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=bXiFzyjjEXx1rEIm4TodCG3Yra8%3D","intro":"Ya hayo madini ambayo unazungumzia wewe.","size":116924,"progress":100,"type":"mp3"},{"name":"00004_003_phone-5.wav","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250709115524/00004_003_phone-5.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=OQs%2F8Zn9ye%2FISKXFACfiSPbmdzA%3D","intro":"Kwamba yanaongeza inaongeza afya mwilini pamoja na madini.","size":211004,"progress":100,"type":"mp3"},{"name":"00004_003_phone-6.wav","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250709115524/00004_003_phone-6.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=oDSdQMY9yIafWEqTt6RC%2FIYkAMw%3D","intro":"Lakini pia mimi napokula ugali na dagaa, ni chakula ambacho kinanifanya nijisikie nimeshiba. [N]","size":326396,"progress":100,"type":"mp3"}],"officialSummary":"Données de conversation naturelle en swahili, enregistré sur la base d'une simulation de thèmes courants. Cet ensemble de données est marqué avec divers attributs tels que le contenu du texte, l'horodatage des phrases, l'identité du locuteur, le sexe, etc., et est enregistré par des natifs de différents milieux géographiques et culturels, il garantit une grande exactitude. Cette ressource riche constitue un outil précieux pour la recherche et les applications liées à la reconnaissance vocale. Validé par plusieurs entreprises en intelligence artificielle, il contribue à améliorer les performances des modèles face à la diversité des situations réelles. Nous respectons strictement les réglementations sur la protection des données et de la vie privée, en veillant à préserver la confidentialité et les droits légitimes des utilisateurs tout au long des processus d'acquisition, de stockage et d'utilisation. Toutes les données sont conformes au RGPD, à la CCPA et à la PIPL.","dataexampl":null,"datakeyword":["Jeu de données vocales en swahili"," données vocales de Tanzanie"," corpus audio en swahili"," jeu de données de transcription en swahili"," jeu de données vocales smartphone"," jeu de données de parole conversationnelle"," jeu de données de langues africaines"," données ASR multilingues"," corpus vocal de langue à ressources limitées"," jeu de données pour IA vocale"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"310 Hours - Swahili(Tanzania) Spontaneous Dialogue Smartphone speech dataset","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
300 heures de données collectées de dialogues naturels en swahili
Jeu de données vocales en swahili
données vocales de Tanzanie
corpus audio en swahili
jeu de données de transcription en swahili
jeu de données vocales smartphone
jeu de données de parole conversationnelle
jeu de données de langues africaines
données ASR multilingues
corpus vocal de langue à ressources limitées
jeu de données pour IA vocale
Données de conversation naturelle en swahili, enregistré sur la base d'une simulation de thèmes courants. Cet ensemble de données est marqué avec divers attributs tels que le contenu du texte, l'horodatage des phrases, l'identité du locuteur, le sexe, etc., et est enregistré par des natifs de différents milieux géographiques et culturels, il garantit une grande exactitude. Cette ressource riche constitue un outil précieux pour la recherche et les applications liées à la reconnaissance vocale. Validé par plusieurs entreprises en intelligence artificielle, il contribue à améliorer les performances des modèles face à la diversité des situations réelles. Nous respectons strictement les réglementations sur la protection des données et de la vie privée, en veillant à préserver la confidentialité et les droits légitimes des utilisateurs tout au long des processus d'acquisition, de stockage et d'utilisation. Toutes les données sont conformes au RGPD, à la CCPA et à la PIPL.
Il s'agit d'un ensemble de données payant destiné à un usage commercial, à la recherche et plus encore. Ces Jeux de données prêts à l'emploi et sous licence contribuent au lancement de projets d'IA.
Spécifications
Format
16 kHz, 16 bits, WAV non compressé, mono
Classification du contenu
Les locuteurs choisissaient plusieurs sujets familiers dans une liste spécifique, enregistrant un dialogue fluide et naturel pour chacun.
Conditions d'enregistrement
Intérieur relativement calme, sans écho
Appareil d'enregistrement
Téléphones Android, téléphones Apple
Informations sur les locuteurs
Environ 400 personnes
Pays
Tanzanie
Langue
Swahili
Caractéristiques des annotations
Transcription du contenu texte, horodatages des phrases, identifiant du locuteur, genre, annotation du bruit
Précision
Précision au niveau du mot : 98%
Exemple
Audio
Mmmh kwangu mimi napenda wali na njegele, [N]
Audio
sababu ni chakula kinachonivutia na kinachoongeza madini mwilini.
Audio
Ya hayo madini ambayo unazungumzia wewe.
Audio
Kwamba yanaongeza inaongeza afya mwilini pamoja na madini.
Audio
Lakini pia mimi napokula ugali na dagaa, ni chakula ambacho kinanifanya nijisikie nimeshiba. [N]