[{"@type":"PropertyValue","name":"Format","value":"16kHz, 16 bits, format WAV, mono"},{"@type":"PropertyValue","name":"Catégorisation du contenu","value":"Conversations, contenus de médias sociaux, émissions de variétés, etc."},{"@type":"PropertyValue","name":"Environnement d'enregistrement","value":"Faible bruit de fond"},{"@type":"PropertyValue","name":"Pays","value":"Thaïlande"},{"@type":"PropertyValue","name":"Code de région linguistique","value":"th-TH"},{"@type":"PropertyValue","name":"Langue","value":"Thaï"},{"@type":"PropertyValue","name":"Caractéristiques d'annotation","value":"Annotation du contenu textuel, des horodatages de phrases, de l’identifiant du locuteur, du sexe et du bruit de fond"},{"@type":"PropertyValue","name":"Précision","value":"Taux de précision lexicale : 98 % (hors étiquettes, genre, identifiants de locuteur, accent ou sujet)"}]
{"id":1687,"datatype":"1","titleimg":"https://fr.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"900 heures de données vocales en thaï – style oral","datazy":[{"title":"Format","desc":"Format","content":"16kHz, 16 bits, format WAV, mono"},{"title":"Catégorisation du contenu","desc":"Catégorisation du contenu","content":"Conversations, contenus de médias sociaux, émissions de variétés, etc."},{"title":"Environnement d'enregistrement","desc":"Environnement d'enregistrement","content":"Faible bruit de fond"},{"title":"Pays","desc":"Pays","content":"Thaïlande"},{"title":"Code de région linguistique","desc":"Code de région linguistique","content":"th-TH"},{"title":"Langue","desc":"Langue","content":"Thaï"},{"title":"Caractéristiques d'annotation","desc":"Caractéristiques d'annotation","content":"Annotation du contenu textuel, des horodatages de phrases, de l’identifiant du locuteur, du sexe et du bruit de fond"},{"title":"Précision","desc":"Précision","content":"Taux de précision lexicale : 98 % (hors étiquettes, genre, identifiants de locuteur, accent ou sujet)"}],"datatag":"Thai,Casual Conversation,ASR","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"500001_6.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250721175406/500001_6.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=2OvhfaFaWY3zdwE%2BIHh5Rg8oXJg%3D","intro":"คุณผู้ฟังมีความคิดแบบนี้ไหมคะ ในวันที่เราเหนื่อยมากมาก เราท้อมากมาก เราเริ่มไม่อยากจะมีชีวิตอยู่แล้ว","size":241800,"progress":100,"type":"mp3"},{"name":"500002_8.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250721175406/500002_8.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=%2BXu1ouOHCx9fViVsDUxgWwASHxw%3D","intro":"อยู่ที่โคราช แล้วจะมีการซ้อมรบกันอยู่ ฝึกซ้อมรบกันอยู่น่ะ ก็ตั้งชื่อผมอะคลอดพอดี ก็ตั้งชื่อผมว่าประลองยุทธ์","size":253750,"progress":100,"type":"mp3"},{"name":"500004_4.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250721175406/500004_4.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=UI2MbKqovKI%2Fx0Rl8er4Ho3658w%3D","intro":"ปรุงแต่งอยู่ในนั้น","size":45930,"progress":100,"type":"mp3"},{"name":"500004_8.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250721175406/500004_8.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=7Bd6uuRU0TtemREj9fJavah7cRI%3D","intro":"มันก็จะทำให้ใจรู้สึกปฏิเสธมากมาก เนี่ย แล้วมันก็เลยส่งผลออกมาเป็นความจำความรู้สึก","size":185224,"progress":100,"type":"mp3"}],"officialSummary":"Les données vocales en thaï _ conversation informelle, couvrent des domaines généraux tels que les dialogues, les médias sociaux et les émissions de divertissement, reflétant des situations d’interaction réelles. L’ensemble contient des annotations sur le contenu textuel, l’identité et le sexe des locuteurs. Ces données, précises et faciles à exploiter, constituent une ressource précieuse pour les recherches et les applications en reconnaissance vocale. Elles permettent aux modèles de mieux s’adapter à la diversité du monde réel. Nous respectons rigoureusement les réglementations en matière de protection des données et de la vie privée, assurant la sécurité des utilisateurs tout au long du processus de collecte, de stockage et d’utilisation. Toutes les données sont conformes au GDPR, au CCPA et à la PIPL.","dataexampl":null,"datakeyword":["Thaï"," conversation informelle"," ASR"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"1004 Hours - Thai(Thailand) Real-world Casual Conversation and Monologue speech dataset","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
900 heures de données vocales en thaï – style oral
Thaï
conversation informelle
ASR
Les données vocales en thaï _ conversation informelle, couvrent des domaines généraux tels que les dialogues, les médias sociaux et les émissions de divertissement, reflétant des situations d’interaction réelles. L’ensemble contient des annotations sur le contenu textuel, l’identité et le sexe des locuteurs. Ces données, précises et faciles à exploiter, constituent une ressource précieuse pour les recherches et les applications en reconnaissance vocale. Elles permettent aux modèles de mieux s’adapter à la diversité du monde réel. Nous respectons rigoureusement les réglementations en matière de protection des données et de la vie privée, assurant la sécurité des utilisateurs tout au long du processus de collecte, de stockage et d’utilisation. Toutes les données sont conformes au GDPR, au CCPA et à la PIPL.
Il s'agit d'un ensemble de données payant destiné à un usage commercial, à la recherche et plus encore. Ces Jeux de données prêts à l'emploi et sous licence contribuent au lancement de projets d'IA.
Spécifications
Format
16kHz, 16 bits, format WAV, mono
Catégorisation du contenu
Conversations, contenus de médias sociaux, émissions de variétés, etc.
Environnement d'enregistrement
Faible bruit de fond
Pays
Thaïlande
Code de région linguistique
th-TH
Langue
Thaï
Caractéristiques d'annotation
Annotation du contenu textuel, des horodatages de phrases, de l’identifiant du locuteur, du sexe et du bruit de fond
Précision
Taux de précision lexicale : 98 % (hors étiquettes, genre, identifiants de locuteur, accent ou sujet)