en

Please fill in your name

Mobile phone format error

Veuillez entrer le téléphone

Veuillez entrer le nom de votre entreprise

Veuillez entrer votre e-mail professionnel

Veuillez entrer l'exigence de données

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

L'exigence de données ne peut pas faire moins de 5 mots et ne peut pas être constituée uniquement de chiffres

20 011 images OCR de scènes naturelles – description textuelle

AIGC
légende en anglais
légende OCR
données OCR multilingues
données OCR
ensemble de données OCR

Ce jeu de données contient 20 011 images issues de scènes naturelles comportant du texte dans 14 langues appartenant aux familles linguistiques asiatiques et européennes. Les images ont été prises dans des contextes réels tels que des enseignes de magasin, panneaux d’information, affiches publicitaires ou signalétiques routières, sous divers angles de prise de vue. Les descriptions en anglais précisent la disposition du texte, son contenu sémantique ainsi que les caractéristiques visuelles comme la couleur.

Données payantes
Il s'agit d'un ensemble de données payant destiné à un usage commercial, à la recherche et plus encore. Ces Jeux de données prêts à l'emploi et sous licence contribuent au lancement de projets d'IA.
SpécificationsSpécifications
Volume des données
20 011 images accompagnées de 20 011 descriptions
Répartition des langues
Langues asiatiques : coréen, indonésien, malais, vietnamien, thaï, chinois, japonais ; Langues européennes : français, allemand, italien, portugais, russe, espagnol, anglais
Environnement de collecte
Comprend diverses scènes telles que des enseignes de magasins, panneaux d'arrêt, affiches, panneaux de signalisation, inscriptions
Variété de captures
Couvre 14 langues, de nombreux environnements naturels et des angles de capture variés
Format des données
Format des images : .jpg ; format des textes : .txt
Appareils de collecte
Smartphones et appareils photo
Langue utilisée pour la description
Anglais
Longueur du texte
En général, entre 30 et 60 mots, répartis sur 3 à 5 phrases
Contenu principal de la description
Disposition du texte, contenu, couleurs et contexte visuel
Précision
Taux d’annotation correcte ≥ 97 %
Échantillon Exemple
  • 20 011 images OCR de scènes naturelles – description textuelle
  • 20 011 images OCR de scènes naturelles – description textuelle
  • 20 011 images OCR de scènes naturelles – description textuelle
Données recommandéesJeux de données recommandés
200 000 ensembles de données image-texte de bâtiments emblématiques de plusieurs pays

200 000 ensembles de données image-texte de bâtiments emblématiques de plusieurs pays. Chaque ensemble de données contient une image et un document de description en chinois et en anglais. Les points de repère nationaux comprennent 80 000 groupes et les autres points de repère nationaux 120 000 groupes. Il n'y a pas moins de 20 pays, dont les États-Unis, le Royaume-Uni, la France, la Russie, l'Allemagne et d'autres pays. Le nombre d'images correspondant à chaque point de repère est réparti de 1 à 10, y compris des informations sur les points de repère sous différents angles, à différentes distances et à différentes périodes. Les types de points de repère comprennent de nombreux types de bâtiments emblématiques, tels que des bâtiments commerciaux, des bâtiments anciens, des monuments, des bibliothèques, des attractions, etc. En termes de contenu d'étiquetage, le pays de repère, la ville de repère, l'emplacement spécifique du point de repère, la classification et la description du point de repère sont marqués. Les données peuvent être utilisées pour l'identification et l'analyse des bâtiments emblématiques.

ensemble de données d'images de point de repère ensemble de données de reconnaissance de bâtiment ensemble de légende d'image de point de repère mondial données de légende d'image bilingue ensemble de légende chinois-anglais ensemble de données de classification de point de repère ensemble de données image-texte ensemble de données de point de repère touristique ensemble de données d'image du patrimoine culturel sous-titrage d'image pour l'entraînement de l'IA
Veuillez nous indiquer vos besoins particuliers

En soumettant, j’accepte la politique de confidentialité

947a2457-4673-4a86-9c66-ce8450bbe3a3

983dbbd4-f147-47f1-b8c7-a65d844046cc