en

Please fill in your name

Mobile phone format error

Veuillez entrer le téléphone

Veuillez entrer le nom de votre entreprise

Veuillez entrer votre e-mail professionnel

Veuillez entrer l'exigence de données

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

L'exigence de données ne peut pas faire moins de 5 mots et ne peut pas être constituée uniquement de chiffres

1,3 milliard de questions d'examen en chinois – du primaire à l'université

Questions professionnelles
texte
LLM

Ce corpus comprend 1,3 milliard de questions d’examen en chinois couvrant tous les niveaux scolaires, de l’école primaire à l’université. Il se compose de 20,87 millions de questions K12 (dont 16 millions accompagnées d’explications) et de 117 millions de questions universitaires et professionnelles (dont 7 millions annotées). Les données K12 intègrent des métadonnées telles que la qualité, les points évalués, le type de contenu, le format des questions, le niveau d’enseignement, la difficulté, la classe, la matière, la source, la réponse et l’explication. Les questions de l’enseignement supérieur et professionnel comprennent les champs : réponse, explication et catégorie. Les matières du segment K12 incluent : chinois, mathématiques, anglais, histoire, géographie, sciences politiques, biologie, physique, chimie et sciences générales. Les domaines universitaires et professionnels couvrent notamment la sécurité publique, les concours administratifs, la médecine, les langues étrangères, l’éducation, le droit, l’économie, l’informatique, les certifications professionnelles et la finance. Les formats de question incluent : QCM, choix unique, vrai/faux et complétion. Ce jeu de données constitue une base précieuse pour renforcer les connaissances disciplinaires des grands modèles.

Données payantes
Il s'agit d'un ensemble de données payant destiné à un usage commercial, à la recherche et plus encore. Ces Jeux de données prêts à l'emploi et sous licence contribuent au lancement de projets d'IA.
SpécificationsSpécifications
Contenu des données
Données d’examens K12 + examens universitaires et professionnels
Volume des données
20,87 millions de questions K12 (dont 16 millions avec corrigé) ; 117 millions de questions universitaires et professionnelles (dont 7 millions corrigées)
Champs des données
Les don­nées K12 incluent des champs tels que qualité, type de contenu, type de question, cycle scolaire, difficulté, niveau, matière, réponse et corrigé ; les examens supérieurs/pro professionnels contiennent réponse, corrigé et catégorie
Domaine professionnel
Les cycles scolaires K12 comprennent école primaire, collège et lycée ; les matières sont : chinois, mathématiques, anglais, histoire, géographie, sciences politiques, biologie, physique, chimie et sciences. Les examens supérieurs/pro couvrent : sécurité publique, concours administratifs, médecine, langues étrangères, diplômes, ingénierie, enseignement, droit, économie, professions, informatique, certifications, finance
Catégorie de questions
Questions à choix multiple, à réponse unique, vrai/faux, à compléter, etc.
Format de stockage
Json
Langue
Chinois
Traitement des données
Analyse des catégories, énoncés, options, réponses et corrigés ; conversion des formules en LaTeX et des tableaux ; nettoyage des données effectué
Échantillon Exemple
  • 1,3 milliard de questions d'examen en chinois – du primaire à l'université
  • 1,3 milliard de questions d'examen en chinois – du primaire à l'université
  • 1,3 milliard de questions d'examen en chinois – du primaire à l'université
Données recommandéesJeux de données recommandés
Veuillez nous indiquer vos besoins particuliers

En soumettant, j’accepte la politique de confidentialité

adf7754c-a0c6-4917-9b94-0376164926a2

48500231-4aae-4e8a-9019-821f1384ffea