en

Please fill in your name

Mobile phone format error

Veuillez entrer le téléphone

Veuillez entrer le nom de votre entreprise

Veuillez entrer votre e-mail professionnel

Veuillez entrer l'exigence de données

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

L'exigence de données ne peut pas faire moins de 5 mots et ne peut pas être constituée uniquement de chiffres

57 645 images OCR de textes verticaux dans des environnements réels

Données OCR de scènes à texte vertical
données d’images OCR
données OCR
ensemble de données OCR
annotation OCR
acquisition OCR
traitement des données OCR
données OCR réécrites

Ensemble de 57 645 images OCR de textes en disposition verticale, prises dans divers environnements tels que les rues, enseignes, panneaux publicitaires, affiches, décors artistiques ou couvertures de magazines. Les textes sont majoritairement en chinois, avec une minorité en anglais. L’annotation comprend des boîtes de type polygone ou parallélogramme au niveau des colonnes, ainsi que la transcription correspondante. Ce corpus est conçu pour le traitement OCR des textes verticaux complexes.

Données payantes
Il s'agit d'un ensemble de données payant destiné à un usage commercial, à la recherche et plus encore. Ces Jeux de données prêts à l'emploi et sous licence contribuent au lancement de projets d'IA.
SpécificationsSpécifications
Volume des données
57 645 images, 528 553 cadres
Environnement de collecte
Scènes de rue, enseignes, affiches, décorations, lettrages artistiques, couvertures de magazines, etc.
Variété de captures
Multiples contextes et styles typographiques
Répartition des langues
Chinois, et un peu d’anglais
Répartition des orientations des cadres de délimitation
324 399 cadres verticaux, 204 154 non verticaux
Répartition des formes des cadres de délimitation
34 936 rectangles, 220 716 polygones, 272 901 parallélogrammes
Format des données
Format des images : .jpg ; format des annotations : .json
Contenu d'annotation
Annotation et transcription colonne par colonne pour cadres verticaux (polygones, parallélogrammes) ; annotation et transcription non verticale pour les autres
Précision
Écarts maximaux de 3 pixels aux sommets pour une détection correcte ; précision de détection ≥ 97 %, transcription ≥ 97 %
Échantillon Exemple
  • 57 645 images OCR de textes verticaux dans des environnements réels
  • 57 645 images OCR de textes verticaux dans des environnements réels
  • 57 645 images OCR de textes verticaux dans des environnements réels
Données recommandéesJeux de données recommandés
Veuillez nous indiquer vos besoins particuliers

En soumettant, j’accepte la politique de confidentialité

32c7439c-ce67-4e00-8297-8760bc2d64dc

da57811b-03c3-4b36-8cfd-da84bf06fd93