[{"@type":"PropertyValue","name":"Volume des données","value":"8 604 images, 65 231 encadrements quadrilatéraux en arabe, 909 polygones en arabe"},{"@type":"PropertyValue","name":"Environnement de collecte","value":"Inclut enseignes de magasins, panneaux d'arrêt, affiches, billets, panneaux de signalisation, bandes dessinées, dessins de bouches d’égout, instructions, avertissements, notices d'emballage, menus, enseignes de bâtiments, couvertures de livres ou de magazines, etc."},{"@type":"PropertyValue","name":"Variété de captures","value":"Divers environnements naturels, angles de prise de vue variés"},{"@type":"PropertyValue","name":"Appareils de collecte","value":"Smartphones et appareils photo"},{"@type":"PropertyValue","name":"Angle de prise de vue","value":"Vue en contre-plongée, en plongée, et frontale"},{"@type":"PropertyValue","name":"Format des données","value":"Format image : .jpg ; format d’annotation : .json"},{"@type":"PropertyValue","name":"Contenu d'annotation","value":"Annotation et transcription ligne par ligne avec cadres quadrilatéraux ou polygones"},{"@type":"PropertyValue","name":"Précision","value":"Une déviation des sommets ≤ 5 pixels est considérée comme correcte ; précision des cadres ≥ 95 % ; précision de la transcription ≥ 95 %"}]
{"id":1306,"datatype":"1","titleimg":"https://fr.nexdata.ai/shujutang/static/image/index/datatang_tuxiang_default.webp","type1":"147","type1str":null,"type2":"150","type2str":null,"dataname":"8 604 images OCR de scènes naturelles en arabe","datazy":[{"title":"Volume des données","desc":"Volume des données","content":"8 604 images, 65 231 encadrements quadrilatéraux en arabe, 909 polygones en arabe"},{"title":"Environnement de collecte","desc":"Environnement de collecte","content":"Inclut enseignes de magasins, panneaux d'arrêt, affiches, billets, panneaux de signalisation, bandes dessinées, dessins de bouches d’égout, instructions, avertissements, notices d'emballage, menus, enseignes de bâtiments, couvertures de livres ou de magazines, etc."},{"title":"Variété de captures","desc":"Variété de captures","content":"Divers environnements naturels, angles de prise de vue variés"},{"title":"Appareils de collecte","desc":"Appareils de collecte","content":"Smartphones et appareils photo"},{"title":"Angle de prise de vue","desc":"Angle de prise de vue","content":"Vue en contre-plongée, en plongée, et frontale"},{"title":"Format des données","desc":"Format des données","content":"Format image : .jpg ; format d’annotation : .json"},{"title":"Contenu d'annotation","desc":"Contenu d'annotation","content":"Annotation et transcription ligne par ligne avec cadres quadrilatéraux ou polygones"},{"title":"Précision","desc":"Précision","content":"Une déviation des sommets ≤ 5 pixels est considérée comme correcte ; précision des cadres ≥ 95 % ; précision de la transcription ≥ 95 %"}],"datatag":"Arabic,Multiple natural scenes,Multiple shooting angles","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"/data/apps/damp/temp/ziptemp/APY230915001_demo1731492000822/APY230915001_demo/2.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230915001_demo1731492000822/APY230915001_demo/2.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=%2BkP5UGtaq1KSflecVlSQ54y9S9k%3D","intro":"","size":0,"progress":100,"type":"jpg"},{"name":"/data/apps/damp/temp/ziptemp/APY230915001_demo1731492000822/APY230915001_demo/1.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230915001_demo1731492000822/APY230915001_demo/1.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=G%2FeaNB9m2xqHUDe3b0BqjE54XS4%3D","intro":"","size":0,"progress":100,"type":"jpg"},{"name":"/data/apps/damp/temp/ziptemp/APY230915001_demo1731492000822/APY230915001_demo/5.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230915001_demo1731492000822/APY230915001_demo/5.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=LFksYHQpRL5Fqw585OinmffTVEI%3D","intro":"","size":0,"progress":100,"type":"jpg"}],"officialSummary":"Ce corpus OCR en langue arabe se compose de 8 604 images capturées dans une grande variété de scènes naturelles, sous différents angles de prise de vue. L’annotation inclut des encadrements quadrilatéraux et polygonaux au niveau des lignes de texte, accompagnés de transcriptions précises. Cette base de données est spécifiquement conçue pour les tâches de reconnaissance optique de caractères (OCR) en arabe.","dataexampl":null,"datakeyword":["Données OCR en arabe"," conversion de contenu OCR"," données OCR"," ensemble de données OCR"," étiquetage OCR"," collecte de données OCR"," traitement des données OCR"," données de conversion OCR"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"ocr","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"8,604 Images of Arabic Natural Scene OCR Data","BGimg":"","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"],"firstList":[{"name":"/data/apps/damp/temp/ziptemp/APY230915001_demo1731492000822/APY230915001_demo/3.png","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230915001_demo1731492000822/APY230915001_demo/3.png?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=1qzf8HofR8nzGvDOxFQsH04NSgE%3D","intro":"","size":0,"progress":100,"type":"jpg"}]}
Ce corpus OCR en langue arabe se compose de 8 604 images capturées dans une grande variété de scènes naturelles, sous différents angles de prise de vue. L’annotation inclut des encadrements quadrilatéraux et polygonaux au niveau des lignes de texte, accompagnés de transcriptions précises. Cette base de données est spécifiquement conçue pour les tâches de reconnaissance optique de caractères (OCR) en arabe.
Il s'agit d'un ensemble de données payant destiné à un usage commercial, à la recherche et plus encore. Ces Jeux de données prêts à l'emploi et sous licence contribuent au lancement de projets d'IA.
Spécifications
Volume des données
8 604 images, 65 231 encadrements quadrilatéraux en arabe, 909 polygones en arabe
Environnement de collecte
Inclut enseignes de magasins, panneaux d'arrêt, affiches, billets, panneaux de signalisation, bandes dessinées, dessins de bouches d’égout, instructions, avertissements, notices d'emballage, menus, enseignes de bâtiments, couvertures de livres ou de magazines, etc.
Variété de captures
Divers environnements naturels, angles de prise de vue variés
Appareils de collecte
Smartphones et appareils photo
Angle de prise de vue
Vue en contre-plongée, en plongée, et frontale
Format des données
Format image : .jpg ; format d’annotation : .json
Contenu d'annotation
Annotation et transcription ligne par ligne avec cadres quadrilatéraux ou polygones
Précision
Une déviation des sommets ≤ 5 pixels est considérée comme correcte ; précision des cadres ≥ 95 % ; précision de la transcription ≥ 95 %