12 heures de corpus de synthèse vocale – voix féminine en chinois – style animatrice de divertissement avec expressions émotionnelles variées

Corpus de synthèse

TTS (synthèse vocale)

mandarin

multi-émotionnel

présentateur de divertissement

Ce corpus de synthèse vocale de 12 heures simule différents styles émotionnels, caractéristiques des présentateurs de programmes de divertissement. Enregistré par des locuteurs natifs du mandarin, il couvre sept émotions distinctes ainsi que diverses interjections. Le contenu phonétique est équilibré et rigoureusement annoté par des phonéticiens professionnels, afin de répondre précisément aux exigences du développement en synthèse vocale.

Il s'agit d'un ensemble de données payant destiné à un usage commercial, à la recherche et plus encore. Ces Jeux de données prêts à l'emploi et sous licence contribuent au lancement de projets d'IA.

Jeux de données recommandés

Base de synthèse de timbre moyen à haute expressivité pour narration de 4 locuteurs en chinois

Base de synthèse de timbre moyen à haute expressivité pour narration de 4 locuteurs en chinois, collectée par des comédiens vocaux professionnels, compte tenu des livres, l'orateur lit dans le style d'une narration très expressive.

Haute expressivité Narration TTS Chinois

Base de synthèse de timbre moyen multistyle et multi-émotions pour 4 locuteurs

Base de synthèse de timbre moyen multistyle et multi-émotions pour 4 locuteurs, collectée par des comédiens de doublage professionnels. Le style comprend 4 types de patronnes capables, des princes audacieux, des servantes habiles et des belles-mères gentilles ; Les émotions comprennent le dédain, la colère, la joie, l'inquiétude, la surprise, le halètement de peur, le reniflement (dédain), la sympathie, le rire, l'activité mentale, le sérieux, le dégoût, le doute, la neutralité.

Corpus de Synthèse TTS Mandarin Chinois Multi-style Multi-émotionnel

Base de synthèse d'interjections et de dialogue libre multi-émotions en chinois

Base de synthèse d'interjections et de dialogue libre multi-émotions en chinois, enregistrés par un certain nombre d'acteurs de doublage natifs chinois. Il comprend des phrases avec des mots d'humeur riches, qui sont en ligne avec les habitudes d'expression quotidiennes ; Il contient également des données de dialogue libres pour un sujet donné, et l'audio de chaque intervenant est stocké indépendamment dans sa propre piste audio. Les phonéticiens professionnels ont étiqueté le contenu textuel et d'autres informations pour répondre pleinement aux besoins précis de la recherche et du développement de la synthèse vocale.

Données de discours émotionnel chinois Corpus de discours conversationnel chinois Ensemble de données de conversation naturelle chinoise Ensemble de données de prosodie chinoise

Base de synthèse de dialogue libre multi-émotions pour 8 locuteurs en chinois

Base de synthèse de dialogue libre multi-émotions pour 8 locuteurs en chinois, enregistrée par des locuteurs natifs chinois, style de dialogue libre. Étant donné un sujet, le prononciateur joue seul, et ses émotions comprennent principalement le bonheur, la curiosité, la confusion, le confort et la neutralité. Les phonéticiens professionnels participent aux annotations, avec des annotations émotionnelles et paralinguistiques. Répondez précisément aux besoins de R&D en matière de synthèse vocale naturelle et émotionnelle.

Conservation naturelle Langue secondaire Multi-émotionnel TTS Chinois chinois/anglais mixte

Base de synthèse de paralangage finement annotée de conversations naturelles avec pistes séparées en chinois

Base de synthèse de paralangage finement annotée de conversations naturelles en chinois, enregistrée par plusieurs locuteurs natifs chinois, style de dialogue libre. À partir d'un sujet, l'orateur joue de son propre chef, et l'audio de chaque personne est stocké dans un fichier WAV distinct dans chaque conversation. Des phonéticiens professionnels ont annoté 16 annotations de sous-langue, annotations de texte, horodatages et autres informations pour répondre précisément aux besoins de recherche et de développement de la synthèse vocale.

ensemble de données de synthèse vocale paralinguistique corpus de synthèse vocale en mandarin ensemble de données de synthèse vocale chinoise synthèse vocale de dialogue spontané ensemble de données de synthèse vocale annotée ensemble de données de synthèse vocale de dialogue ensemble de données de synthèse vocale multi-flux ensemble de données paralinguistiques chinois ensemble de données de dialogue spontané corpus de parole multi-flux

Base de synthèse de paralangage finement annotée de conversations naturelles en chinois

Base de synthèse de paralangage finement annotée de conversations naturelles en chinois, enregistrée par 370 locuteurs natifs chinois, style de dialogue libre. Étant donné un sujet, le prononciateur joue de son propre chef. Les phonéticiens professionnels ont annoté 14 catégories paraverbales, des annotations de texte, des locuteurs et d'autres informations pour répondre avec précision aux besoins de recherche et de développement de la synthèse vocale.

Ensemble de données paralinguistiques chinois ensemble de données de dialogue spontané Corpus de discours conversationnel chinois Corpus de synthèse vocale en mandarin Ensemble de données de synthèse vocale chinoise

Base de synthèse de timbre moyen pour 4 locuteurs en cantonais de Hong Kong et de Guangdong

Base de synthèse de timbre moyen pour 4 locuteurs en cantonais de Hong Kong et de Guangdong, enregistrée par des habitants de Hong Kong. Le texte de l'enregistrement audio contient du contenu éducatif, ludique et familier en général. La couverture du corpus phonème est équilibrée, et des phonéticiens professionnels participent à l'annotation pour correspondre précisément aux besoins de recherche et développement de la synthèse vocale.

Ensemble de données vocales cantonais Corpus vocal cantonais de Hong Kong Ensemble de données vocales cantonaises Ensemble de données vocales cantonais pour l'IA Enregistrements vocaux cantonais natifs Ensemble de données TTS cantonais Ensemble de données vocales d'accent de Hong Kong

2 participants – corpus de synthèse vocale – voix moyenne – coréen

Corpus de synthèse vocale coréenne réalisé avec la participation de deux locuteurs natifs. Les enregistrements couvrent un large éventail de phonèmes à travers des textes journalistiques et conversationnels. Toutes les annotations ont été effectuées par des phonéticiens qualifiés afin d’optimiser l’adéquation aux applications de synthèse vocale.

TTS (synthèse vocale) coréen ton moyen

12 heures de corpus de synthèse vocale – voix féminine en chinois – style animatrice de divertissement avec expressions émotionnelles variées

Corpus de synthèse TTS (synthèse vocale) mandarin multi-émotionnel présentateur de divertissement

Niveau de maturité du projet

Corpus de synthèse

TTS (synthèse vocale)

mandarin

multi-émotionnel

présentateur de divertissement