fr

Please fill in your name

Mobile phone format error

Veuillez entrer le téléphone

Veuillez entrer le nom de votre entreprise

Veuillez entrer votre e-mail professionnel

Veuillez entrer l'exigence de données

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

L'exigence de données ne peut pas faire moins de 5 mots et ne peut pas être constituée uniquement de chiffres

Jeux de données OCR

Améliorez instantanément les performances de votre modèle IA avec des Jeux de données prêts à l’emploi de haute qualité.

Type de données

Tout
28
Document
3
Scénario général
13
Écriture manuscrite
15
Image internet
1
Facture
3
Autres
4
Sujet d’examen
1
Tableau
1

Langue

Tout
28
Chinois
6
Anglais
4
Hindi
4
Japonais
7
Coréen
7
Autres
20
Vietnamien
4

Données OCR en viêtnamien avec annotation et transcription de 4 995 images

Vietnamese, OCR, document images, Internet images, natural scenes, multiple angles, different light conditions, quadrilateral bounding box annotation, line-level transcription for the texts, column-level transcription for the texts
Vietnamien OCR images de documents images Internet scènes naturelles angles multiples conditions des lumières différentes annotation de cadres rectangulaires transcription au niveau des lignes pour les textes transcription au niveau des colonnes pour les textes

Données OCR en hindi avec annotation et transcription de 3 506 images

Hindi, OCR, document images, Internet images, natural scenes, multiple angles, different light conditions, quadrilateral bounding box annotation, line-level transcription for the texts, column-level transcription for the texts
Hindi OCR images de documents images Internet scènes naturelles angles multiples conditions des lumières différentes annotation de cadres rectangulaires transcription au niveau des lignes pour les textes transcription au niveau des colonnes pour les textes

57 645 images OCR de textes verticaux dans des environnements réels

Ensemble de 57 645 images OCR de textes en disposition verticale, prises dans divers environnements tels que les rues, enseignes, panneaux publicitaires, affiches, décors artistiques ou couvertures de magazines. Les textes sont majoritairement en chinois, avec une minorité en anglais. L’annotation comprend des boîtes de type polygone ou parallélogramme au niveau des colonnes, ainsi que la transcription correspondante. Ce corpus est conçu pour le traitement OCR des textes verticaux complexes.
Données OCR de scènes à texte vertical données d’images OCR données OCR ensemble de données OCR annotation OCR acquisition OCR traitement des données OCR données OCR réécrites

Données de 14 980 images OCR PPT en 8 langues

PPT, OCR, meeting room, conference room,different photographic angles, different photographic distances, different light conditions,line-level quadrilateral bounding box annotation and transcription for the texts
PPT OCR salle de réunion salle de conférence différents angles de prise de vue différentes distances de prise de vue différentes conditions des lumières annotation et transcription des textes à l'aide d'un cadre rectangulaire de niveau ligne

Données d'écriture manuscrite japonaise et coréenne de 100 personnes

Données d'écriture manuscrite japonaise et coréenne de 100 personnes, un total de 100 personnes ont saisi les données, 50 Japonais, 49 Coréens et 1 Afghan. Le corpus d'écriture est différent pour chaque personne. Cette diversité de données comprend plusieurs appareils de téléphonie téléphone portable et différents corpus. Cet ensemble de données d'écriture manuscrite japonaise et coréenne peut être utilisé pour la reconnaissance OCR des polices d'écriture manuscrite japonaises et coréennes.
Japonais Coréen Écriture manuscrite OCR Trace d'écriture manuscrite

5 147 données OCR d'écriture manuscrite japonaise

5 147 images d'écriture manuscrite japonaise sur papier A4, papier ligné/quadrillé, etc. Capture : Smartphone, hauteur des yeux. Contenu : rédactions, poèmes, prose, informations, histoires, etc. Annotation : Boîte quadrilatère au niveau de la ligne, transcription. Utilisable pour l'OCR d'écriture manuscrite japonaise.
Japonais écriture manuscrite OCR annotation au niveau de la ligne transcription ligne par ligne

Données OCR d'écriture manuscrite japonaise de 4 538 images de 101 personnes

Japanese handwriting,OCR, character-level rectangular bounding box annotation, text transcription,calligraphy,scribble,manuscript,Japanese ocr data
Écriture manuscrite japonaise OCR annotation de cadre rectangulaire au niveau des caractères transcription de texte calligraphie gribouillage manuscrit données OCR japonaises

Données de scènes naturelles OCR en 12 langues de 105 941 images

Japanese, Korean, Indonesian, Malay, Vietnamese, Thai, French, German, Italian, Portuguese, Russian, Spanish, OCR, natural scenes, multiple photographic angles, line-level quadrilateral bounding box annotation and transcription for the texts
Japonais coréen indonésien malais vietnamien thaï français allemand italien portugais russe espagnol OCR scènes naturelles angles photographiques multiples annotation et transcription de la boîte englobante quadrilatérale au niveau de la ligne pour les textes

500 000 images OCR de scènes naturelles et de documents multi-pays

Ce jeu de données comprend 500 000 images issues de documents ou de scènes naturelles, couvrant 20 langues telles que le chinois traditionnel, le japonais, le coréen, l’indonésien, le malais, le thaï, le vietnamien ou encore le polonais. Grâce à sa diversité linguistique et contextuelle, ce corpus constitue une base robuste pour le développement de systèmes OCR multilingues performants.
Scènes naturelles documents OCR

loading

Personnalisez vos données dès maintenant

Pourquoi choisir des jeux de données prêts à l'emploi

  • Droits d'auteur

    Droits d'auteur

    Droits d’auteur clairs vérifiables à tout moment
  • Sécurité

    Sécurité

    Correctement autorisés Sécurisés à l’usage
  • Professionnel

    Professionnel

    Conçus et produits par des experts en données d’IA
  • Diversité

    Diversité

    Collectés à partir de diverses scènes réelles
  • Rentabilité

    Rentabilité

    Plus rentable Que les données personnalisées
  • Efficacité

    Efficacité

    Prêt à l'emploi, livré en quelques secondes
cd2ed663-336f-4dd6-a3b9-68ab5a65fcfb