en

Please fill in your name

Mobile phone format error

Veuillez entrer le téléphone

Veuillez entrer le nom de votre entreprise

Veuillez entrer votre e-mail professionnel

Veuillez entrer l'exigence de données

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

L'exigence de données ne peut pas faire moins de 5 mots et ne peut pas être constituée uniquement de chiffres

12 heures de corpus de synthèse vocale – voix féminine en chinois – style animatrice de divertissement avec expressions émotionnelles variées

Corpus de synthèse
TTS (synthèse vocale)
mandarin
multi-émotionnel
présentateur de divertissement

Ce corpus de synthèse vocale de 12 heures simule différents styles émotionnels, caractéristiques des présentateurs de programmes de divertissement. Enregistré par des locuteurs natifs du mandarin, il couvre sept émotions distinctes ainsi que diverses interjections. Le contenu phonétique est équilibré et rigoureusement annoté par des phonéticiens professionnels, afin de répondre précisément aux exigences du développement en synthèse vocale.

Données payantes
Il s'agit d'un ensemble de données payant destiné à un usage commercial, à la recherche et plus encore. Ces Jeux de données prêts à l'emploi et sous licence contribuent au lancement de projets d'IA.
SpécificationsSpécifications
Format
48 kHz, 24 bits, WAV, mono
Environnement d'enregistrement
Environnement de studio d’enregistrement professionnel
Contenu d'enregistrement
Phrases exprimant sept émotions (joie, colère, tristesse, surprise, peur, dégoût, neutre) + phrases contenant des particules modales
Intervenants
Doubleuse professionnelle ; personnage : jeune fille de 18 ans, animatrice de divertissement, passionnée de chant et de danse
Caractéristiques d'annotation
Annotation phonème-caractère, annotation prosodique et délimitation des phonèmes
Dispositifs
Équipements et logiciels d’enregistrement professionnels
Scène d'application
Synthèse vocale
Volume des données
Données neutres ≥ 1,6 h ; données avec particules modales ≥ 0,4 h ; données pour les 6 autres émotions ≥ 1,67 h
Échantillon Exemple
  • Audio

    希望#1能够#1呼吸#1新鲜#1空气#3而不是#1被污染#1物质#1包裹着#4。xi1 wang4 neng2 gou4 hu1 xi1 xin1 xian1 kong1 qi4 er2 bu2 shi4 bei4 wu1 ran3 wu4 zhi4 bao1 guo3 zhe5

  • Audio

    请不要#1太过分#3,我是#1有#1边界的#4。qing3 bu2 yao4 tai4 guo4 fen4 wo3 shi4 you3 bian1 jie4 de5

  • Audio

    我#1找不到#1任何#1颜色#1和#1乐趣#4。wo6 zhao3 bu2 dao4 ren4 he2 yan2 se4 he2 le4 qu4

  • Audio

    跟着#1我的#1节奏#2一起#1舞动吧#4!gen1 zhe5 wo3 de5 jie2 zou4 yi4 qi6 wu3 dong4 ba5

  • Audio

    仿佛有#1一只手#3正从#1我的#1后背#1伸出来#4。fang3 fu2 you3 yi4 zhi1 shou3 zheng4 cong2 wo3 de5 hou4 bei4 shen1 chu1 lai5

Données recommandéesJeux de données recommandés
Veuillez nous indiquer vos besoins particuliers

En soumettant, j’accepte la politique de confidentialité

6958cc87-b2eb-4678-ba27-f5654575ab7a

e589325b-6ab0-4bca-a29d-812332479855