[{"@type":"PropertyValue","name":"Contenu des données","value":"Données d’examens K12 + examens universitaires et professionnels"},{"@type":"PropertyValue","name":"Volume des données","value":"20,87 millions de questions K12 (dont 16 millions avec corrigé) ; 117 millions de questions universitaires et professionnelles (dont 7 millions corrigées)"},{"@type":"PropertyValue","name":"Champs des données","value":"Les données K12 incluent des champs tels que qualité, type de contenu, type de question, cycle scolaire, difficulté, niveau, matière, réponse et corrigé ; les examens supérieurs/pro professionnels contiennent réponse, corrigé et catégorie"},{"@type":"PropertyValue","name":"Domaine professionnel","value":"Les cycles scolaires K12 comprennent école primaire, collège et lycée ; les matières sont : chinois, mathématiques, anglais, histoire, géographie, sciences politiques, biologie, physique, chimie et sciences. Les examens supérieurs/pro couvrent : sécurité publique, concours administratifs, médecine, langues étrangères, diplômes, ingénierie, enseignement, droit, économie, professions, informatique, certifications, finance"},{"@type":"PropertyValue","name":"Catégorie de questions","value":"Questions à choix multiple, à réponse unique, vrai/faux, à compléter, etc."},{"@type":"PropertyValue","name":"Format de stockage","value":"Json"},{"@type":"PropertyValue","name":"Langue","value":"Chinois"},{"@type":"PropertyValue","name":"Traitement des données","value":"Analyse des catégories, énoncés, options, réponses et corrigés ; conversion des formules en LaTeX et des tableaux ; nettoyage des données effectué"}]
{"id":1448,"datatype":"1","titleimg":"https://fr.nexdata.ai/shujutang/static/image/index/datatang_tuxiang_default.webp","type1":"226","type1str":null,"type2":"227","type2str":null,"dataname":"1,3 milliard de questions d'examen en chinois – du primaire à l'université","datazy":[{"title":"Contenu des données","desc":"Contenu des données","content":"Données d’examens K12 + examens universitaires et professionnels"},{"title":"Volume des données","desc":"Volume des données","content":"20,87 millions de questions K12 (dont 16 millions avec corrigé) ; 117 millions de questions universitaires et professionnelles (dont 7 millions corrigées)"},{"title":"Champs des données","desc":"Champs des données","content":"Les données K12 incluent des champs tels que qualité, type de contenu, type de question, cycle scolaire, difficulté, niveau, matière, réponse et corrigé ; les examens supérieurs/pro professionnels contiennent réponse, corrigé et catégorie"},{"title":"Domaine professionnel","desc":"Domaine professionnel","content":"Les cycles scolaires K12 comprennent école primaire, collège et lycée ; les matières sont : chinois, mathématiques, anglais, histoire, géographie, sciences politiques, biologie, physique, chimie et sciences. Les examens supérieurs/pro couvrent : sécurité publique, concours administratifs, médecine, langues étrangères, diplômes, ingénierie, enseignement, droit, économie, professions, informatique, certifications, finance"},{"title":"Catégorie de questions","desc":"Catégorie de questions","content":"Questions à choix multiple, à réponse unique, vrai/faux, à compléter, etc."},{"title":"Format de stockage","desc":"Format de stockage","content":"Json"},{"title":"Langue","desc":"Langue","content":"Chinois"},{"title":"Traitement des données","desc":"Traitement des données","content":"Analyse des catégories, énoncés, options, réponses et corrigés ; conversion des formules en LaTeX et des tableaux ; nettoyage des données effectué"}],"datatag":"Professional questions,Text,LLM","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"1.png","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250715171814/1.png?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=G9HonMSpRnpOq5SiWDNF1oxPmzs%3D","intro":"","size":185620,"progress":100,"type":"jpg"},{"name":"2.png","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250715171814/2.png?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=wIPVfccuhMYS0D%2B%2BZKCP%2B02CezE%3D","intro":"","size":184109,"progress":100,"type":"jpg"},{"name":"3.png","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250715171814/3.png?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=jzS3WlFJ8%2FN4gE09SPxCXPV%2Bu%2FM%3D","intro":"","size":118110,"progress":100,"type":"jpg"}],"officialSummary":"Ce corpus comprend 1,3 milliard de questions d’examen en chinois couvrant tous les niveaux scolaires, de l’école primaire à l’université. Il se compose de 20,87 millions de questions K12 (dont 16 millions accompagnées d’explications) et de 117 millions de questions universitaires et professionnelles (dont 7 millions annotées). Les données K12 intègrent des métadonnées telles que la qualité, les points évalués, le type de contenu, le format des questions, le niveau d’enseignement, la difficulté, la classe, la matière, la source, la réponse et l’explication. Les questions de l’enseignement supérieur et professionnel comprennent les champs : réponse, explication et catégorie. Les matières du segment K12 incluent : chinois, mathématiques, anglais, histoire, géographie, sciences politiques, biologie, physique, chimie et sciences générales. Les domaines universitaires et professionnels couvrent notamment la sécurité publique, les concours administratifs, la médecine, les langues étrangères, l’éducation, le droit, l’économie, l’informatique, les certifications professionnelles et la finance. Les formats de question incluent : QCM, choix unique, vrai/faux et complétion. Ce jeu de données constitue une base précieuse pour renforcer les connaissances disciplinaires des grands modèles.","dataexampl":null,"datakeyword":["Questions professionnelles"," texte"," LLM"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Type","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"llm","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"130 Million - Chinese Test Question Texts from Elementary School to University Parsing And Processing Data","BGimg":"","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
1,3 milliard de questions d'examen en chinois – du primaire à l'université
Questions professionnelles
texte
LLM
Ce corpus comprend 1,3 milliard de questions d’examen en chinois couvrant tous les niveaux scolaires, de l’école primaire à l’université. Il se compose de 20,87 millions de questions K12 (dont 16 millions accompagnées d’explications) et de 117 millions de questions universitaires et professionnelles (dont 7 millions annotées). Les données K12 intègrent des métadonnées telles que la qualité, les points évalués, le type de contenu, le format des questions, le niveau d’enseignement, la difficulté, la classe, la matière, la source, la réponse et l’explication. Les questions de l’enseignement supérieur et professionnel comprennent les champs : réponse, explication et catégorie. Les matières du segment K12 incluent : chinois, mathématiques, anglais, histoire, géographie, sciences politiques, biologie, physique, chimie et sciences générales. Les domaines universitaires et professionnels couvrent notamment la sécurité publique, les concours administratifs, la médecine, les langues étrangères, l’éducation, le droit, l’économie, l’informatique, les certifications professionnelles et la finance. Les formats de question incluent : QCM, choix unique, vrai/faux et complétion. Ce jeu de données constitue une base précieuse pour renforcer les connaissances disciplinaires des grands modèles.
Il s'agit d'un ensemble de données payant destiné à un usage commercial, à la recherche et plus encore. Ces Jeux de données prêts à l'emploi et sous licence contribuent au lancement de projets d'IA.
Spécifications
Contenu des données
Données d’examens K12 + examens universitaires et professionnels
Volume des données
20,87 millions de questions K12 (dont 16 millions avec corrigé) ; 117 millions de questions universitaires et professionnelles (dont 7 millions corrigées)
Champs des données
Les données K12 incluent des champs tels que qualité, type de contenu, type de question, cycle scolaire, difficulté, niveau, matière, réponse et corrigé ; les examens supérieurs/pro professionnels contiennent réponse, corrigé et catégorie
Domaine professionnel
Les cycles scolaires K12 comprennent école primaire, collège et lycée ; les matières sont : chinois, mathématiques, anglais, histoire, géographie, sciences politiques, biologie, physique, chimie et sciences. Les examens supérieurs/pro couvrent : sécurité publique, concours administratifs, médecine, langues étrangères, diplômes, ingénierie, enseignement, droit, économie, professions, informatique, certifications, finance
Catégorie de questions
Questions à choix multiple, à réponse unique, vrai/faux, à compléter, etc.
Format de stockage
Json
Langue
Chinois
Traitement des données
Analyse des catégories, énoncés, options, réponses et corrigés ; conversion des formules en LaTeX et des tableaux ; nettoyage des données effectué