[{"@type":"PropertyValue","name":"Volume des données","value":"57 645 images, 528 553 cadres"},{"@type":"PropertyValue","name":"Environnement de collecte","value":"Scènes de rue, enseignes, affiches, décorations, lettrages artistiques, couvertures de magazines, etc."},{"@type":"PropertyValue","name":"Variété de captures","value":"Multiples contextes et styles typographiques"},{"@type":"PropertyValue","name":"Répartition des langues","value":"Chinois, et un peu d’anglais"},{"@type":"PropertyValue","name":"Répartition des orientations des cadres de délimitation","value":"324 399 cadres verticaux, 204 154 non verticaux"},{"@type":"PropertyValue","name":"Répartition des formes des cadres de délimitation","value":"34 936 rectangles, 220 716 polygones, 272 901 parallélogrammes"},{"@type":"PropertyValue","name":"Format des données","value":"Format des images : .jpg ; format des annotations : .json"},{"@type":"PropertyValue","name":"Contenu d'annotation","value":"Annotation et transcription colonne par colonne pour cadres verticaux (polygones, parallélogrammes) ; annotation et transcription non verticale pour les autres"},{"@type":"PropertyValue","name":"Précision","value":"Écarts maximaux de 3 pixels aux sommets pour une détection correcte ; précision de détection ≥ 97 %, transcription ≥ 97 %"}]
{"id":1226,"datatype":"1","titleimg":"https://fr.nexdata.ai/shujutang/static/image/index/datatang_tuxiang_default.webp","type1":"147","type1str":null,"type2":"150","type2str":null,"dataname":"57 645 images OCR de textes verticaux dans des environnements réels","datazy":[{"title":"Volume des données","desc":"Volume des données","content":"57 645 images, 528 553 cadres"},{"title":"Environnement de collecte","desc":"Environnement de collecte","content":"Scènes de rue, enseignes, affiches, décorations, lettrages artistiques, couvertures de magazines, etc."},{"title":"Variété de captures","desc":"Variété de captures","content":"Multiples contextes et styles typographiques"},{"title":"Répartition des langues","desc":"Répartition des langues","content":"Chinois, et un peu d’anglais"},{"title":"Répartition des orientations des cadres de délimitation","desc":"Répartition des orientations des cadres de délimitation","content":"324 399 cadres verticaux, 204 154 non verticaux"},{"title":"Répartition des formes des cadres de délimitation","desc":"Répartition des formes des cadres de délimitation","content":"34 936 rectangles, 220 716 polygones, 272 901 parallélogrammes"},{"title":"Format des données","desc":"Format des données","content":"Format des images : .jpg ; format des annotations : .json"},{"title":"Contenu d'annotation","desc":"Contenu d'annotation","content":"Annotation et transcription colonne par colonne pour cadres verticaux (polygones, parallélogrammes) ; annotation et transcription non verticale pour les autres"},{"title":"Précision","desc":"Précision","content":"Écarts maximaux de 3 pixels aux sommets pour une détection correcte ; précision de détection ≥ 97 %, transcription ≥ 97 %"}],"datatag":"OCR,Multiple scenes,Multiple fonts","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"/data/apps/damp/temp/ziptemp/APY230117001_demo1695809214287/APY230117001_demo/054889_demo.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230117001_demo1695809214287/APY230117001_demo/054889_demo.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=tDNg2Jmp1JEEZiTMQB2hIFr17SI%3D","intro":"","size":0,"progress":100,"type":"jpg"},{"name":"/data/apps/damp/temp/ziptemp/APY230117001_demo1695809214287/APY230117001_demo/056472_demo.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230117001_demo1695809214287/APY230117001_demo/056472_demo.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=sGLSMlt8%2BocGKzLN0YYIgRrTg78%3D","intro":"","size":0,"progress":100,"type":"jpg"},{"name":"/data/apps/damp/temp/ziptemp/APY230117001_demo1695809214287/APY230117001_demo/054886_demo.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230117001_demo1695809214287/APY230117001_demo/054886_demo.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=2t3vBygA4k0HDuTQq9h%2ByOBmO8E%3D","intro":"","size":0,"progress":100,"type":"jpg"}],"officialSummary":"Ensemble de 57 645 images OCR de textes en disposition verticale, prises dans divers environnements tels que les rues, enseignes, panneaux publicitaires, affiches, décors artistiques ou couvertures de magazines. Les textes sont majoritairement en chinois, avec une minorité en anglais. L’annotation comprend des boîtes de type polygone ou parallélogramme au niveau des colonnes, ainsi que la transcription correspondante. Ce corpus est conçu pour le traitement OCR des textes verticaux complexes.","dataexampl":null,"datakeyword":["Données OCR de scènes à texte vertical"," données d’images OCR"," données OCR"," ensemble de données OCR"," annotation OCR"," acquisition OCR"," traitement des données OCR"," données OCR réécrites"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"ocr","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"57,645 Images - Vertical OCR Data in Text Scenes","BGimg":"","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"],"firstList":[{"name":"/data/apps/damp/temp/ziptemp/APY230117001_demo1695809214287/APY230117001_demo/056480_demo.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230117001_demo1695809214287/APY230117001_demo/056480_demo.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=2d2r3%2FYQASEMnhCBsTgJBTu2y74%3D","intro":"","size":0,"progress":100,"type":"jpg"}]}
57 645 images OCR de textes verticaux dans des environnements réels
Données OCR de scènes à texte vertical
données d’images OCR
données OCR
ensemble de données OCR
annotation OCR
acquisition OCR
traitement des données OCR
données OCR réécrites
Ensemble de 57 645 images OCR de textes en disposition verticale, prises dans divers environnements tels que les rues, enseignes, panneaux publicitaires, affiches, décors artistiques ou couvertures de magazines. Les textes sont majoritairement en chinois, avec une minorité en anglais. L’annotation comprend des boîtes de type polygone ou parallélogramme au niveau des colonnes, ainsi que la transcription correspondante. Ce corpus est conçu pour le traitement OCR des textes verticaux complexes.
Il s'agit d'un ensemble de données payant destiné à un usage commercial, à la recherche et plus encore. Ces Jeux de données prêts à l'emploi et sous licence contribuent au lancement de projets d'IA.
Spécifications
Volume des données
57 645 images, 528 553 cadres
Environnement de collecte
Scènes de rue, enseignes, affiches, décorations, lettrages artistiques, couvertures de magazines, etc.
Variété de captures
Multiples contextes et styles typographiques
Répartition des langues
Chinois, et un peu d’anglais
Répartition des orientations des cadres de délimitation
Format des images : .jpg ; format des annotations : .json
Contenu d'annotation
Annotation et transcription colonne par colonne pour cadres verticaux (polygones, parallélogrammes) ; annotation et transcription non verticale pour les autres
Précision
Écarts maximaux de 3 pixels aux sommets pour une détection correcte ; précision de détection ≥ 97 %, transcription ≥ 97 %