en

Please fill in your name

Mobile phone format error

Veuillez entrer le téléphone

Veuillez entrer le nom de votre entreprise

Veuillez entrer votre e-mail professionnel

Veuillez entrer l'exigence de données

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

L'exigence de données ne peut pas faire moins de 5 mots et ne peut pas être constituée uniquement de chiffres

14 511 images OCR manuscrites en anglais

Écriture manuscrite anglaise
OCR

Corpus manuscrit OCR en langue anglaise contenant 14 511 images. Les supports papier incluent des feuilles A4, du papier ligné et du papier à lettres anglais. Les les images ont été saisies à l’aide de smartphones, selon un angle de vue perpendiculaire. Elles couvrent des contenus variés : essais, poèmes, récits, articles de presse et histoires. Chaque ligne de texte a été annotée avec une boîte quadrilatérale et une transcription précise ligne par ligne. Ce corpus est conçu pour l’entraînement et à l’évaluation de modèles OCR pour l’écriture manuscrite anglaise.

Données payantes
Il s'agit d'un ensemble de données payant destiné à un usage commercial, à la recherche et plus encore. Ces Jeux de données prêts à l'emploi et sous licence contribuent au lancement de projets d'IA.
SpécificationsSpécifications
Volume des données
1 591 participants, 14 511 images
Répartition des intervenants
Répartition par sexe : 659 hommes, 932 femmes ; par âge : 30 < 18 ans, 1 479 entre 18-45 ans, 82 entre 46-60 ans
Répartition par nationalité
États-Unis, Philippines, Inde, France, Égypte, Pakistan, Zimbabwe, etc.
Environnement de collecte
Papier A4 standard, papier ligné, papier pour écriture anglaise, etc.
Appareils de collecte
Téléphone mobile
Angle de prise de vue
Vue frontale à hauteur des yeux
Format des données
Formats des images : .jpg et .jpeg ; format des fichiers d’annotation : .json
Contenu des données
Textes rédigés en anglais : dissertations, poèmes, essais, articles d’actualité, récits, etc.
Contenu d'annotation
Annotation quadrilatérale au niveau de la ligne, avec transcription ligne par ligne
Précision
Précision des données collectées ≥ 97 % ; précision de transcription ≥ 97 %
Échantillon Exemple
  • 14 511 images OCR manuscrites en anglais
  • 14 511 images OCR manuscrites en anglais
  • 14 511 images OCR manuscrites en anglais
Données recommandéesJeux de données recommandés
Veuillez nous indiquer vos besoins particuliers

En soumettant, j’accepte la politique de confidentialité

b7c40061-219e-4dc8-a10a-9c7b43b9baaf

1f0acf25-5e33-4f91-b713-7e7cea88be79