104 320 images OCR de scènes naturelles

Coréen

hindi

données OCR

scène naturelle

données de translittération OCR

Ce corpus de 104 320 images OCR en contextes naturels coréen et hindi comprend des scènes telles que des emballages de produits, affiches, billets, panneaux d'information, menus et enseignes de bâtiments. La diversité des données repose sur la variété des environnements, angles de prise de vue et conditions lumineuses. Les langues représentées sont le coréen, l'hindi, ainsi qu'un faible pourcentage d’anglais. Les annotations sont réalisées à deux niveaux : au niveau ligne et colonne, avec des encadrements polygonaux (ou quadrilatères/rectangles), transcription textuelle et étiquetage linguistique. Ce jeu de données est parfaitement adapté aux tâches OCR sur scènes naturelles en coréen et hindi.

Il s'agit d'un ensemble de données payant destiné à un usage commercial, à la recherche et plus encore. Ces Jeux de données prêts à l'emploi et sous licence contribuent au lancement de projets d'IA.

Spécifications

Volume des données

76 861 images en coréen avec 555 913 encadrements ; 27 459 images en hindi avec 200 453 encadrements

Environnement de collecte

Incluant des emballages de produits, affiches, billets, panneaux informatifs, menus, enseignes de bâtiments, etc.

Variété de captures

Divers environnements extérieurs, multiples angles de prise de vue, et diverses conditions d’éclairage

Appareils de collecte

Téléphone mobile

Angle de prise de vue

Vue en contre-plongée, en plongée, et frontale

Répartition des langues

Coréen, hindi, et anglais (en faible proportion)

Format des données

Format image : .jpg ; format d’annotation : .json

Répartition des formes des cadres de délimitation

Coréen : 315 822 quadrilatères, 240 091 polygones ; Hindi : 780 quadrilatères, 199 671 polygones, 2 rectangles

Contenu d'annotation

Niveau ligne : Boîte polygone (ou quadrilatère, rectangle), transcription, attribut de texte (langue) ; Niveau colonne : Boîte polygone (ou quadrilatère, rectangle), transcription, attribut de texte (langue)

Précision

Écart des coins de la boîte de délimitation ≤ 5 pixels considéré comme correct, précision ≥95 % ; Précision de transcription ≥95 %

104 320 images OCR de scènes naturelles – coréen et hindi

Coréen

hindi

données OCR

scène naturelle

données de translittération OCR

Niveau de maturité du projet

104 320 images OCR de scènes naturelles – coréen et hindi

Coréen hindi données OCR scène naturelle données de translittération OCR

Niveau de maturité du projet

104 320 images OCR de scènes naturelles – coréen et hindi

Coréen

hindi

données OCR

scène naturelle

données de translittération OCR