[{"@type":"PropertyValue","name":"Volume des données","value":"20 011 images accompagnées de 20 011 descriptions"},{"@type":"PropertyValue","name":"Répartition des langues","value":"Langues asiatiques : coréen, indonésien, malais, vietnamien, thaï, chinois, japonais ; Langues européennes : français, allemand, italien, portugais, russe, espagnol, anglais"},{"@type":"PropertyValue","name":"Environnement de collecte","value":"Comprend diverses scènes telles que des enseignes de magasins, panneaux d'arrêt, affiches, panneaux de signalisation, inscriptions"},{"@type":"PropertyValue","name":"Variété de captures","value":"Couvre 14 langues, de nombreux environnements naturels et des angles de capture variés"},{"@type":"PropertyValue","name":"Format des données","value":"Format des images : .jpg ; format des textes : .txt"},{"@type":"PropertyValue","name":"Appareils de collecte","value":"Smartphones et appareils photo"},{"@type":"PropertyValue","name":"Langue utilisée pour la description","value":"Anglais"},{"@type":"PropertyValue","name":"Longueur du texte","value":"En général, entre 30 et 60 mots, répartis sur 3 à 5 phrases"},{"@type":"PropertyValue","name":"Contenu principal de la description","value":"Disposition du texte, contenu, couleurs et contexte visuel"},{"@type":"PropertyValue","name":"Précision","value":"Taux d’annotation correcte ≥ 97 %"}]
{"id":1288,"datatype":"1","titleimg":"https://fr.nexdata.ai/shujutang/static/image/index/datatang_tuxiang_default.webp","type1":"226","type1str":null,"type2":"254","type2str":null,"dataname":"20 011 images OCR de scènes naturelles – description textuelle","datazy":[{"title":"Volume des données","desc":"Volume des données","content":"20 011 images accompagnées de 20 011 descriptions"},{"title":"Répartition des langues","desc":"Répartition des langues","content":"Langues asiatiques : coréen, indonésien, malais, vietnamien, thaï, chinois, japonais ; Langues européennes : français, allemand, italien, portugais, russe, espagnol, anglais"},{"title":"Environnement de collecte","desc":"Environnement de collecte","content":"Comprend diverses scènes telles que des enseignes de magasins, panneaux d'arrêt, affiches, panneaux de signalisation, inscriptions"},{"title":"Variété de captures","desc":"Variété de captures","content":"Couvre 14 langues, de nombreux environnements naturels et des angles de capture variés"},{"title":"Format des données","desc":"Format des données","content":"Format des images : .jpg ; format des textes : .txt"},{"title":"Appareils de collecte","desc":"Appareils de collecte","content":"Smartphones et appareils photo"},{"title":"Langue utilisée pour la description","desc":"Langue utilisée pour la description","content":"Anglais"},{"title":"Longueur du texte","desc":"Longueur du texte","content":"En général, entre 30 et 60 mots, répartis sur 3 à 5 phrases"},{"title":"Contenu principal de la description","desc":"Contenu principal de la description","content":"Disposition du texte, contenu, couleurs et contexte visuel"},{"title":"Précision","desc":"Précision","content":"Taux d’annotation correcte ≥ 97 %"}],"datatag":"AIGC,English caption,OCR caption,Multiple shooting angles,Multinational scenes","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"/data/apps/damp/temp/ziptemp/APY231231006_demo1727085603555/??10.png","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY231231006_demo1727085603555/%3F%3F10.png?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=MCVrBqb27YBjyCDI0Jnyl3bJBGA%3D","intro":"","size":0,"progress":100,"type":"jpg"},{"name":"/data/apps/damp/temp/ziptemp/APY231231006_demo1727085603555/??6.png","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY231231006_demo1727085603555/%3F%3F6.png?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=YloKf4W4lvZRZqUksIOndlMhK5E%3D","intro":"","size":0,"progress":100,"type":"jpg"},{"name":"/data/apps/damp/temp/ziptemp/APY231231006_demo1727085603555/??7.png","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY231231006_demo1727085603555/%3F%3F7.png?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=MaMzeRl2B1sFE7KT28iUKO33omo%3D","intro":"","size":0,"progress":100,"type":"jpg"}],"officialSummary":"Ce jeu de données contient 20 011 images issues de scènes naturelles comportant du texte dans 14 langues appartenant aux familles linguistiques asiatiques et européennes. Les images ont été prises dans des contextes réels tels que des enseignes de magasin, panneaux d’information, affiches publicitaires ou signalétiques routières, sous divers angles de prise de vue. Les descriptions en anglais précisent la disposition du texte, son contenu sémantique ainsi que les caractéristiques visuelles comme la couleur.","dataexampl":null,"datakeyword":["AIGC"," légende en anglais"," légende OCR"," données OCR multilingues"," données OCR"," ensemble de données OCR"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Type","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"llm","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"20,011 Image Caption Data of OCR in Natural Scenes","BGimg":"","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"],"firstList":[{"name":"/data/apps/damp/temp/ziptemp/APY231231006_demo1727085603555/??9.png","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY231231006_demo1727085603555/%3F%3F9.png?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=VEHblArfRzk5e3PLr2jzicBVmRY%3D","intro":"","size":0,"progress":100,"type":"jpg"}]}
20 011 images OCR de scènes naturelles – description textuelle
AIGC
légende en anglais
légende OCR
données OCR multilingues
données OCR
ensemble de données OCR
Ce jeu de données contient 20 011 images issues de scènes naturelles comportant du texte dans 14 langues appartenant aux familles linguistiques asiatiques et européennes. Les images ont été prises dans des contextes réels tels que des enseignes de magasin, panneaux d’information, affiches publicitaires ou signalétiques routières, sous divers angles de prise de vue. Les descriptions en anglais précisent la disposition du texte, son contenu sémantique ainsi que les caractéristiques visuelles comme la couleur.
Il s'agit d'un ensemble de données payant destiné à un usage commercial, à la recherche et plus encore. Ces Jeux de données prêts à l'emploi et sous licence contribuent au lancement de projets d'IA.