en

Please fill in your name

Mobile phone format error

Veuillez entrer le téléphone

Veuillez entrer le nom de votre entreprise

Veuillez entrer votre e-mail professionnel

Veuillez entrer l'exigence de données

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

L'exigence de données ne peut pas faire moins de 5 mots et ne peut pas être constituée uniquement de chiffres

100 000 paires de textes complexes pour l'ajustement SFT dans le domaine général des grands modèles chinois

LLM
suivi des instructions
SFT

Ce corpus comprend 100 000 paires de prompts complexes rédigés en chinois, comportant entre 50 et 400 caractères chacun, avec au moins trois contraintes explicites par consigne. Conçu pour entraîner les modèles à suivre des instructions complexes, le jeu couvre quatre grandes catégories : la génération de texte (rédaction de communiqués, plans d’interview, création de contenus, révision, poésie, plans d’étude, rédaction administrative, etc.), la réécriture (paraphrase, correction, fusion de phrases, simplification), le résumé (synthèse de contenu), et l’extraction (éléments d’événement, opinions, mots-clés, entités, positionnement). Toutes les consignes ont été rédigées manuellement afin de garantir diversité et pertinence.

Données payantes
Il s'agit d'un ensemble de données payant destiné à un usage commercial, à la recherche et plus encore. Ces Jeux de données prêts à l'emploi et sous licence contribuent au lancement de projets d'IA.
SpécificationsSpécifications
Volume des données
100 000
Finalité des données
Destiné à entraîner la capacité des grands modèles à suivre des instructions
Contenu des données
Prompts complexes (50–400 caractères), contenant au moins trois contraintes par prompt
Couverture des catégories
Types : génération (communiqués, plans d’entretien, rédaction de textes, correction, essais bilingues, grammaire, rapports, plans d’étude, poésie, cuisine, publicité, argumentaires de vente, écriture officielle, relecture, Q&A réglementaire, etc.), réécriture (révision, correction, fusion, simplification), résumé, extraction (éléments d’événements, opinions, mots-clés, positions, entités)
Mode de production
Tous les prompts sont rédigés manuellement pour assurer une large diversité
Langue
Chinois
Échantillon Exemple
  • 100 000 paires de textes complexes pour l'ajustement SFT dans le domaine général des grands modèles chinois
  • 100 000 paires de textes complexes pour l'ajustement SFT dans le domaine général des grands modèles chinois
  • 100 000 paires de textes complexes pour l'ajustement SFT dans le domaine général des grands modèles chinois
Données recommandéesJeux de données recommandés
Veuillez nous indiquer vos besoins particuliers

En soumettant, j’accepte la politique de confidentialité

9b732c3f-7405-4948-b647-a5db4102dcc4

3dc24628-e000-4fb0-a702-a871feb7066f