en

Please fill in your name

Mobile phone format error

Veuillez entrer le téléphone

Veuillez entrer le nom de votre entreprise

Veuillez entrer votre e-mail professionnel

Veuillez entrer l'exigence de données

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

L'exigence de données ne peut pas faire moins de 5 mots et ne peut pas être constituée uniquement de chiffres

500 000 images OCR de scènes naturelles et de documents multi-pays

Scènes naturelles
documents
OCR

Ce jeu de données comprend 500 000 images issues de documents ou de scènes naturelles, couvrant 20 langues telles que le chinois traditionnel, le japonais, le coréen, l’indonésien, le malais, le thaï, le vietnamien ou encore le polonais. Grâce à sa diversité linguistique et contextuelle, ce corpus constitue une base robuste pour le développement de systèmes OCR multilingues performants.

Données payantes
Il s'agit d'un ensemble de données payant destiné à un usage commercial, à la recherche et plus encore. Ces Jeux de données prêts à l'emploi et sous licence contribuent au lancement de projets d'IA.
SpécificationsSpécifications
Volume des données
500 000 images, avec 12 500 scènes naturelles et 12 500 documents par langue
Répartition des langues
Chinois traditionnel, japonais, coréen, indonésien, malais, thaï, vietnamien, français, allemand, italien, portugais, russe, espagnol, arabe, turc, polonais, néerlandais, grec, tchèque, philippin (tagalog)
Environnement de collecte
Scènes naturelles : slogans, tickets, affiches, panneaux d’avertissement, signalisation, emballages alimentaires, affichages publicitaires, arrêts et enseignes.Documents : fichiers électroniques, comptes rendus de réunions, rapports, modes d’emploi, manuels d’utilisation, livres, journaux et manuels scolaires
Variété de captures
Divers environnements naturels et angles de prise de vue
Appareils de collecte
Collecte via smartphones et scanners
Angle de prise de vue
Vue en contre-plongée, en plongée, et frontale
Format des données
Format image : .jpg et autres formats standard
Précision
Taux de précision de la collecte ≥ 97 %
Échantillon Exemple
  • 500 000 images OCR de scènes naturelles et de documents multi-pays
  • 500 000 images OCR de scènes naturelles et de documents multi-pays
  • 500 000 images OCR de scènes naturelles et de documents multi-pays
Données recommandéesJeux de données recommandés
Veuillez nous indiquer vos besoins particuliers

En soumettant, j’accepte la politique de confidentialité

f40f6086-697c-4ede-89bf-38d834c1d366

8385a2d5-27a2-4095-8ba4-7928962a10d7