en

Please fill in your name

Mobile phone format error

Veuillez entrer le téléphone

Veuillez entrer le nom de votre entreprise

Veuillez entrer votre e-mail professionnel

Veuillez entrer l'exigence de données

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

L'exigence de données ne peut pas faire moins de 5 mots et ne peut pas être constituée uniquement de chiffres

Jeux de données OCR

Améliorez instantanément les performances de votre modèle IA avec des Jeux de données prêts à l’emploi de haute qualité.

Type de données

Tout
29
Document
3
Scénario général
13
Écriture manuscrite
15
Image internet
3
Facture
3
Autres
5
Sujet d’examen
1
Tableau
1

Langue

Tout
29
Chinois
7
Anglais
4
Hindi
4
Japonais
7
Coréen
7
Autres
20
Vietnamien
4

2 504 images OCR d’écriture manuscrite en chinois

Ce corpus comprend 2 504 échantillons d’écriture manuscrite en chinois, destinés à l’OCR. Les supports varient : papier A4, papier quadrillé ou ligné, tableaux blancs, post-it colorés, fiches de réponse, etc. Les contenus incluent poèmes, essais, annonces promotionnelles, messages de vœux, listes de souhaits, extraits, compositions et notes. Le corpus reflète une grande diversité de supports, de styles d’écriture, de contenus et d’angles de prise de vue (vue frontale et contre-plongée). Les annotations incluent des cadres quadrilatéraux ligne/colonne et les transcriptions associées. Cette base est idéale pour les projets de reconnaissance d’écriture manuscrite en chinois.
Chinois écriture manuscrite OCR papier A4 papier quadrillé papier ligné tableau blanc note colorée poésie prose avis d’activités commerciales salutations listes de souhaits extraits poésie prose avis d’activités commerciales salutations listes de souhaits extraits angle en contre-plongée angle à hauteur des yeux

Données OCR en hindi avec annotation et transcription de 3 506 images

Hindi, OCR, document images, Internet images, natural scenes, multiple angles, different light conditions, quadrilateral bounding box annotation, line-level transcription for the texts, column-level transcription for the texts
Hindi OCR images de documents images Internet scènes naturelles angles multiples conditions des lumières différentes annotation de cadres rectangulaires transcription au niveau des lignes pour les textes transcription au niveau des colonnes pour les textes

Données OCR en anglais dans des scènes naturelles de 71 535 images

English, natural scenes, OCR, multiple scenes, multiple photographic angles, multiple light conditions, line-level & word-level & character-level bounding box, text transcription
Anglais scènes naturelles OCR scènes multiples angles photographiques multiples conditions des lumières multiples cadre de sélection au niveau de la ligne du mot et du caractère transcription de texte

30 000 images : Données OCR en langues minoritaires d'Asie du Sud-Est provenant de scènes naturelles

Données OCR pour 30 000 images en langues minoritaires d'Asie du Sud-Est : Khmer (Cambodge), Laotien, Birman. Diversité : scènes naturelles, angles de prise de vue. Utilisable pour l'OCR en langues d'Asie du Sud-Est.
OCR langues d’Asie du Sud-Est scènes naturelles

500 000 images de données OCR annotées provenant de scènes naturelles, de scènes de documents photographiés et de scènes électroniques dans 21 pays

500 000 images de données OCR annotées provenant de scènes naturelles, de scènes de documents photographiés et de scènes électroniques dans 21 pays. Les données contiennent 21 langues, et le nombre de feuilles dans chaque langue est réparti entre 20 000 et 25 000. Les types de données incluent les scènes naturelles, les scènes photo de document et les scènes électroniques. La diversité des données comprend plusieurs types de données, plusieurs angles de prise de vue et plusieurs langues. En termes d'annotation, l'annotation quadrilatérale ou polygonale au niveau de la ligne (colonne) et la transcription du contenu au niveau de la ligne (colonne) sont adoptées. Les données peuvent être utilisées pour des tâches de reconnaissance OCR multilingues.
ensemble de données OCR multilingues données de reconnaissance de texte de scène ensemble de données OCR de document données OCR d'écran électronique ensemble de données OCR 21 langues données d'entraînement OCR AI ensemble de données de reconnaissance de texte

5 000 images OCR de scènes naturelles en turc

Ce jeu de données contient 5 000 images capturées en environnement naturel, avec du texte en langue turque et une variété d’angles de prise de vue. L’annotation comprend à la fois des encadrements quadrilatéraux et polygonaux au niveau des lignes de texte, associés à leur transcription. Ce corpus est destiné aux systèmes OCR multiformats orientés vers la langue turque dans des conditions réelles.
OCR turc scènes naturelles

14 511 images OCR manuscrites en anglais

Corpus manuscrit OCR en langue anglaise contenant 14 511 images. Les supports papier incluent des feuilles A4, du papier ligné et du papier à lettres anglais. Les les images ont été saisies à l’aide de smartphones, selon un angle de vue perpendiculaire. Elles couvrent des contenus variés : essais, poèmes, récits, articles de presse et histoires. Chaque ligne de texte a été annotée avec une boîte quadrilatérale et une transcription précise ligne par ligne. Ce corpus est conçu pour l’entraînement et à l’évaluation de modèles OCR pour l’écriture manuscrite anglaise.
Écriture manuscrite anglaise OCR

5 147 données OCR d'écriture manuscrite japonaise

5 147 images d'écriture manuscrite japonaise sur papier A4, papier ligné/quadrillé, etc. Capture : Smartphone, hauteur des yeux. Contenu : rédactions, poèmes, prose, informations, histoires, etc. Annotation : Boîte quadrilatère au niveau de la ligne, transcription. Utilisable pour l'OCR d'écriture manuscrite japonaise.
Japonais écriture manuscrite OCR annotation au niveau de la ligne transcription ligne par ligne

1 000 participants – corpus OCR manuscrit – italien

Ce corpus OCR contient des écritures manuscrites collectées auprès de 1 000 Européens habitués à écrire en italien. Les documents ont été numérisés avec un angle de vue frontal. Les données comprennent des adresses, des noms d’entreprise et des noms propres. Ce corpus est destiné à des applications de reconnaissance manuscrite en langue italienne.
Italien écriture manuscrite OCR Européens scanner angle à hauteur des yeux

loading

Personnalisez vos données dès maintenant

Pourquoi choisir des jeux de données prêts à l'emploi

  • Droits d'auteur

    Droits d'auteur

    Droits d’auteur clairs vérifiables à tout moment
  • Sécurité

    Sécurité

    Correctement autorisés Sécurisés à l’usage
  • Professionnel

    Professionnel

    Conçus et produits par des experts en données d’IA
  • Diversité

    Diversité

    Collectés à partir de diverses scènes réelles
  • Rentabilité

    Rentabilité

    Plus rentable Que les données personnalisées
  • Efficacité

    Efficacité

    Prêt à l'emploi, livré en quelques secondes
a24594dc-b524-4f2d-856f-cfa34b2a8850