[{"@type":"PropertyValue","name":"Contenu des données","value":"Données textuelles de questions scientifiques et techniques"},{"@type":"PropertyValue","name":"Volume des données","value":"Environ 32 millions de questions"},{"@type":"PropertyValue","name":"Champs des données","value":"Contient : énoncé, réponse, explication, type de question, niveau scolaire, matière, etc."},{"@type":"PropertyValue","name":"Catégorie des données","value":"Questions de mathématiques, physique, chimie et biologie du primaire à l’université"},{"@type":"PropertyValue","name":"Format de stockage","value":"Jsonl"},{"@type":"PropertyValue","name":"Langue","value":"Chinois"},{"@type":"PropertyValue","name":"Traitement des données","value":"Les champs (énoncés, réponses et explications) ont été nettoyés, les formules converties en LaTeX, les tableaux mis en forme, le tout optimisé pour traitement automatique"}]
{"id":1735,"datatype":"1","titleimg":"https://fr.nexdata.ai/shujutang/static/image/index/datatang_tuxiang_default.webp","type1":"226","type1str":null,"type2":"227","type2str":null,"dataname":"32 millions de questions en sciences et ingénierie — structuration et traitement textuel","datazy":[{"title":"Contenu des données","desc":"Contenu des données","content":"Données textuelles de questions scientifiques et techniques"},{"title":"Volume des données","desc":"Volume des données","content":"Environ 32 millions de questions"},{"title":"Champs des données","desc":"Champs des données","content":"Contient : énoncé, réponse, explication, type de question, niveau scolaire, matière, etc."},{"title":"Catégorie des données","desc":"Catégorie des données","content":"Questions de mathématiques, physique, chimie et biologie du primaire à l’université"},{"title":"Format de stockage","desc":"Format de stockage","content":"Jsonl"},{"title":"Langue","desc":"Langue","content":"Chinois"},{"title":"Traitement des données","desc":"Traitement des données","content":"Les champs (énoncés, réponses et explications) ont été nettoyés, les formules converties en LaTeX, les tableaux mis en forme, le tout optimisé pour traitement automatique"}],"datatag":"Science Subjects Questions,LLM,Text","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"1.png","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250714165128/1.png?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=HwitiNqnx0KPlNvVZQYQ8z2l2d8%3D","intro":"","size":306218,"progress":100,"type":"jpg"},{"name":"2.png","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250714165128/2.png?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=MUg8o9HyNARMc23IFIgnHm6hU0g%3D","intro":"","size":330327,"progress":100,"type":"jpg"},{"name":"3.png","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250714165128/3.png?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=JWnDfi%2Fszq2dcEba4kbjjUzM1ng%3D","intro":"","size":71115,"progress":100,"type":"jpg"}],"officialSummary":"Ce jeu de données comprend 32 millions de questions en mathématiques, physique, chimie et biologie, du niveau primaire à universitaire. Chaque question est annotée avec : énoncé, réponse, explication, type, matière et niveau. Cette ressource offre un socle massif pour l’enrichissement des compétences STEM des grands modèles.","dataexampl":null,"datakeyword":["Questions de sciences"," LLM"," texte"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Type","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"llm","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"32 million - Science Subjects Questions Text Parsing And Processing Data","BGimg":"","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
32 millions de questions en sciences et ingénierie — structuration et traitement textuel
Questions de sciences
LLM
texte
Ce jeu de données comprend 32 millions de questions en mathématiques, physique, chimie et biologie, du niveau primaire à universitaire. Chaque question est annotée avec : énoncé, réponse, explication, type, matière et niveau. Cette ressource offre un socle massif pour l’enrichissement des compétences STEM des grands modèles.
Il s'agit d'un ensemble de données payant destiné à un usage commercial, à la recherche et plus encore. Ces Jeux de données prêts à l'emploi et sous licence contribuent au lancement de projets d'IA.
Spécifications
Contenu des données
Données textuelles de questions scientifiques et techniques
Volume des données
Environ 32 millions de questions
Champs des données
Contient : énoncé, réponse, explication, type de question, niveau scolaire, matière, etc.
Catégorie des données
Questions de mathématiques, physique, chimie et biologie du primaire à l’université
Format de stockage
Jsonl
Langue
Chinois
Traitement des données
Les champs (énoncés, réponses et explications) ont été nettoyés, les formules converties en LaTeX, les tableaux mis en forme, le tout optimisé pour traitement automatique