Jeux de données pour grands modèles de langage

Please fill in your name

Mobile phone format error

Veuillez entrer le téléphone

Veuillez entrer le nom de votre entreprise

Veuillez entrer votre e-mail professionnel

Veuillez entrer l'exigence de données

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

L'exigence de données ne peut pas faire moins de 5 mots et ne peut pas être constituée uniquement de chiffres

Accueil > Toutes Catégories > LLM

Type

Tout

Légende d’image

Ensembles de données SFT

Textes de pré-entraînement

32 millions de questions en sciences et ingénierie — structuration et traitement textuel

Ce jeu de données comprend 32 millions de questions en mathématiques, physique, chimie et biologie, du niveau primaire à universitaire. Chaque question est annotée avec : énoncé, réponse, explication, type, matière et niveau. Cette ressource offre un socle massif pour l’enrichissement des compétences STEM des grands modèles.

Questions de sciences LLM texte

1 million de textes de problèmes de programmation chinois, traités de manière structurée

Données textuelles de problèmes de programmation chinois traitées de manière structurée. Langues : C, C++, Python, Java, JavaScript. Chaque problème contient la question, la réponse, l'analyse, le champ de langue. Aide les modèles à développer des compétences en programmation.

Questions de programmation LLM texte

100 000 ensembles de données textuelles pour le réglage fin par instruction de grands modèles linguistiques en anglais

L'ensembles de données textuelles pour le réglage fin par instruction de grands modèles linguistiques en anglais, les ressources d'entraînement spécialement conçues pour l'optimisation des modèles d'IA, améliorent considérablement la compréhension et la capacité d'exécution des instructions du modèle, et sont revérifiés par des experts linguistiques et des ingénieurs en IA, répondant parfaitement aux besoins de réglage fin des modèles pré-entraînés courants.

Ensemble de données de réglage fin LLM réglage fin supervisé Ensemble de données SFT données de réglage des instructions en anglais données LLM du domaine général réglage fin du modèle d'IA données d'entraînement de suivi des instructions ensemble de données de réglage GPT

6,9 millions de textes de problèmes multidisciplinaires chinois, traités de manière structurée

6,9 millions de textes de problèmes multidisciplinaires chinois, traités de manière structurée, de l'école primaire à l'université. Chaque problème contient la question, la réponse, l'analyse, le type de question, la matière, le niveau, etc. Pour l'enrichissement des connaissances des LLM.

Questions pluridisciplinaires chinoises LLM texte

10 000 groupes de données Q/A pour diagrammes numériques

10 000 groupes de données Q/A pour diagrammes numériques : diagrammes linéaires, diagrammes à barres, diagrammes circulaires, diagrammes de dispersion, combinaisons, tableaux. Chaque image deux tours Q/A : un pour lire les valeurs, un pour le calcul.

Questions-réponses texte japonais

Données de casse-tête de devinage

Les données de casse-tête de devinage, y compris plus de 100 000 données de devinage et plus de 3 000 données de casse-tête, peuvent être utilisées dans de multiples scénarios d'application tels que l'entraînement de grands modèles et les assistants de téléphonie mobile.

Énigmes Casse-tête

Personnalisez vos données dès maintenant

Pourquoi choisir des jeux de données prêts à l'emploi

Droits d'auteur
Droits d’auteur clairs vérifiables à tout moment
Sécurité
Correctement autorisés Sécurisés à l’usage
Professionnel
Conçus et produits par des experts en données d’IA
Diversité
Collectés à partir de diverses scènes réelles
Rentabilité
Plus rentable Que les données personnalisées
Efficacité
Prêt à l'emploi, livré en quelques secondes

Abonnez-vous à notre newsletter

Soyez les premiers à recevoir les nouveautés produits, solutions de données et actualités de Nexdata

Jeux de données Prêts à l'Emploi: Toutes Catégories; LLM; Vision par ordinateur; Reconnaissance vocale; Synthèse vocale; OCR; Dictionnaire de prononciation; NLU

Service de Données: Données 3D Point Cloud; Données de Vue de Rue; Données OCR; Reconnaissance comportementale; Reconnaissance d’identité; Reconnaissance Vocale; Données Synthèse Vocale; Données multimodales

Industries: IA Incarnée; IA Générative; Véhicules Autonomes; AR/VR; IA Conversationnelle; Système Domotique; Commerce de Détail; Santé Intelligence

Entreprise: À Propos de Nous; Actualités; Partenaires; Qualité & Sécurité; Événements
Liens Utiles: OPENMPD; DataPlus; Datarade

Platforme: Platforme
Compétition: Compétition
Ressources: Jeux de données sponsorisés

Améliorez votre IA avec de meilleures données

+1(626)594-5598

[email protected]

Navigation du site Conditions générales d’utilisation

Nous utilisons des cookies pour améliorer votre navigation, diffuser des publicités ou contenus personnalisés et analyser notre trafic. En cliquant "Accepter Tout", vous consentez à notre utilisation des cookies

6a11bf57-471b-45bd-a3bb-609ccbeb6027

Jeux de données pour LLM

Type

250 000 questions de finance – banque de données

1,5 million de questions de test coréennes, traitées de manière structurée

50 000 ensembles de données d’édition d’images

32 millions de questions en sciences et ingénierie — structuration et traitement textuel