fr

Please fill in your name

Mobile phone format error

Veuillez entrer le téléphone

Veuillez entrer le nom de votre entreprise

Veuillez entrer votre e-mail professionnel

Veuillez entrer l'exigence de données

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

L'exigence de données ne peut pas faire moins de 5 mots et ne peut pas être constituée uniquement de chiffres

Jeux de données OCR

Améliorez instantanément les performances de votre modèle IA avec des Jeux de données prêts à l’emploi de haute qualité.

Type de données

Tout
29
Document
3
Scénario général
13
Écriture manuscrite
15
Image internet
3
Facture
3
Autres
5
Sujet d’examen
1
Tableau
1

Langue

Tout
29
Chinois
7
Anglais
4
Hindi
4
Japonais
7
Coréen
7
Autres
20
Vietnamien
4

500 000 images de données OCR annotées provenant de scènes naturelles, de scènes de documents photographiés et de scènes électroniques dans 21 pays

500 000 images de données OCR annotées provenant de scènes naturelles, de scènes de documents photographiés et de scènes électroniques dans 21 pays. Les données contiennent 21 langues, et le nombre de feuilles dans chaque langue est réparti entre 20 000 et 25 000. Les types de données incluent les scènes naturelles, les scènes photo de document et les scènes électroniques. La diversité des données comprend plusieurs types de données, plusieurs angles de prise de vue et plusieurs langues. En termes d'annotation, l'annotation quadrilatérale ou polygonale au niveau de la ligne (colonne) et la transcription du contenu au niveau de la ligne (colonne) sont adoptées. Les données peuvent être utilisées pour des tâches de reconnaissance OCR multilingues.
ensemble de données OCR multilingues données de reconnaissance de texte de scène ensemble de données OCR de document données OCR d'écran électronique ensemble de données OCR 21 langues données d'entraînement OCR AI ensemble de données de reconnaissance de texte

500 000 images OCR de scènes naturelles et de documents multi-pays

Ce jeu de données comprend 500 000 images issues de documents ou de scènes naturelles, couvrant 20 langues telles que le chinois traditionnel, le japonais, le coréen, l’indonésien, le malais, le thaï, le vietnamien ou encore le polonais. Grâce à sa diversité linguistique et contextuelle, ce corpus constitue une base robuste pour le développement de systèmes OCR multilingues performants.
Scènes naturelles documents OCR

30 000 images : Données OCR en langues minoritaires d'Asie du Sud-Est provenant de scènes naturelles

Données OCR pour 30 000 images en langues minoritaires d'Asie du Sud-Est : Khmer (Cambodge), Laotien, Birman. Diversité : scènes naturelles, angles de prise de vue. Utilisable pour l'OCR en langues d'Asie du Sud-Est.
OCR langues d’Asie du Sud-Est scènes naturelles

Données OCR de 222 289 scènes naturelles en chinois

Les scènes d'acquisition des données OCR de 222 289 scènes naturelles en chinois couvrent les scènes intérieures et extérieures. La diversité des données comprend une variété de scènes et plusieurs angles de prise de vue. En termes d'annotation, l'annotation au niveau de la ligne, l'annotation au niveau du mot, l'annotation au niveau du caractère et la transcription du contenu sont effectuées sur les caractères chinois de l'image. Cet ensemble de données OCR de scènes naturelles en chinois peut être utilisé pour les tâches d'OCR de scènes naturelles.
OCR Scènes naturelles Annotation au niveau de la ligne Annotation au niveau du mot Annotation au niveau du caractère Transcription des textes

9 497 images, 10 types de formulaires, Données OCR

9 497 images de 10 types de formulaires, annotées avec des boîtes de délimitation rectangulaires. Utilisable pour la reconnaissance de formulaires.
OCR formulaires

Données de copies d'examens de mathématiques du primaire de 17 561 images

Primary School Mathematics Papers, OCR, multiple types of questions (Vertical calculation, Horizontal calculation, Recursive calculation, Fraction, Solving equation, etc.), multiple types of test papers (math workbooks, test papers, competition test questions, etc.), multiple grades
Examens de mathématiques du primaire OCR types de questions multiples (calcul vertical calcul horizontal calcul récursif fractions résolution d'équations etc.) types d'examens multiples (cahiers d'exercices de mathématiques examens questions d'examens de concours etc.) niveaux scolaires multiples

Données OCR en viêtnamien avec annotation et transcription de 4 995 images

Vietnamese, OCR, document images, Internet images, natural scenes, multiple angles, different light conditions, quadrilateral bounding box annotation, line-level transcription for the texts, column-level transcription for the texts
Vietnamien OCR images de documents images Internet scènes naturelles angles multiples conditions des lumières différentes annotation de cadres rectangulaires transcription au niveau des lignes pour les textes transcription au niveau des colonnes pour les textes

104 320 images OCR de scènes naturelles – coréen et hindi

Ce corpus de 104 320 images OCR en contextes naturels coréen et hindi comprend des scènes telles que des emballages de produits, affiches, billets, panneaux d'information, menus et enseignes de bâtiments. La diversité des données repose sur la variété des environnements, angles de prise de vue et conditions lumineuses. Les langues représentées sont le coréen, l'hindi, ainsi qu'un faible pourcentage d’anglais. Les annotations sont réalisées à deux niveaux : au niveau ligne et colonne, avec des encadrements polygonaux (ou quadrilatères/rectangles), transcription textuelle et étiquetage linguistique. Ce jeu de données est parfaitement adapté aux tâches OCR sur scènes naturelles en coréen et hindi.
Coréen hindi données OCR scène naturelle données de translittération OCR

Données de scènes naturelles OCR en 12 langues de 105 941 images

Japanese, Korean, Indonesian, Malay, Vietnamese, Thai, French, German, Italian, Portuguese, Russian, Spanish, OCR, natural scenes, multiple photographic angles, line-level quadrilateral bounding box annotation and transcription for the texts
Japonais coréen indonésien malais vietnamien thaï français allemand italien portugais russe espagnol OCR scènes naturelles angles photographiques multiples annotation et transcription de la boîte englobante quadrilatérale au niveau de la ligne pour les textes

loading

Personnalisez vos données dès maintenant

Pourquoi choisir des jeux de données prêts à l'emploi

  • Droits d'auteur

    Droits d'auteur

    Droits d’auteur clairs vérifiables à tout moment
  • Sécurité

    Sécurité

    Correctement autorisés Sécurisés à l’usage
  • Professionnel

    Professionnel

    Conçus et produits par des experts en données d’IA
  • Diversité

    Diversité

    Collectés à partir de diverses scènes réelles
  • Rentabilité

    Rentabilité

    Plus rentable Que les données personnalisées
  • Efficacité

    Efficacité

    Prêt à l'emploi, livré en quelques secondes
4aea2513-8615-4203-8989-639d40c8c020