[{"@type":"PropertyValue","name":"Volume des données","value":"76 861 images en coréen avec 555 913 encadrements ; 27 459 images en hindi avec 200 453 encadrements"},{"@type":"PropertyValue","name":"Environnement de collecte","value":"Incluant des emballages de produits, affiches, billets, panneaux informatifs, menus, enseignes de bâtiments, etc."},{"@type":"PropertyValue","name":"Variété de captures","value":"Divers environnements extérieurs, multiples angles de prise de vue, et diverses conditions d’éclairage"},{"@type":"PropertyValue","name":"Appareils de collecte","value":"Téléphone mobile"},{"@type":"PropertyValue","name":"Angle de prise de vue","value":"Vue en contre-plongée, en plongée, et frontale"},{"@type":"PropertyValue","name":"Répartition des langues","value":"Coréen, hindi, et anglais (en faible proportion)"},{"@type":"PropertyValue","name":"Format des données","value":"Format image : .jpg ; format d’annotation : .json"},{"@type":"PropertyValue","name":"Répartition des formes des cadres de délimitation","value":"Coréen : 315 822 quadrilatères, 240 091 polygones ; Hindi : 780 quadrilatères, 199 671 polygones, 2 rectangles"},{"@type":"PropertyValue","name":"Contenu d'annotation","value":"Niveau ligne : Boîte polygone (ou quadrilatère, rectangle), transcription, attribut de texte (langue) ; Niveau colonne : Boîte polygone (ou quadrilatère, rectangle), transcription, attribut de texte (langue)"},{"@type":"PropertyValue","name":"Précision","value":"Écart des coins de la boîte de délimitation ≤ 5 pixels considéré comme correct, précision ≥95 % ; Précision de transcription ≥95 %"}]
{"id":1254,"datatype":"1","titleimg":"https://fr.nexdata.ai/shujutang/static/image/index/datatang_tuxiang_default.webp","type1":"147","type1str":null,"type2":"150","type2str":null,"dataname":"104 320 images OCR de scènes naturelles – coréen et hindi","datazy":[{"title":"Volume des données","desc":"Volume des données","content":"76 861 images en coréen avec 555 913 encadrements ; 27 459 images en hindi avec 200 453 encadrements"},{"title":"Environnement de collecte","desc":"Environnement de collecte","content":"Incluant des emballages de produits, affiches, billets, panneaux informatifs, menus, enseignes de bâtiments, etc."},{"title":"Variété de captures","desc":"Variété de captures","content":"Divers environnements extérieurs, multiples angles de prise de vue, et diverses conditions d’éclairage"},{"title":"Appareils de collecte","desc":"Appareils de collecte","content":"Téléphone mobile"},{"title":"Angle de prise de vue","desc":"Angle de prise de vue","content":"Vue en contre-plongée, en plongée, et frontale"},{"title":"Répartition des langues","desc":"Répartition des langues","content":"Coréen, hindi, et anglais (en faible proportion)"},{"title":"Format des données","desc":"Format des données","content":"Format image : .jpg ; format d’annotation : .json"},{"title":"Répartition des formes des cadres de délimitation","desc":"Répartition des formes des cadres de délimitation","content":"Coréen : 315 822 quadrilatères, 240 091 polygones ; Hindi : 780 quadrilatères, 199 671 polygones, 2 rectangles"},{"title":"Contenu d'annotation","desc":"Contenu d'annotation","content":"Niveau ligne : Boîte polygone (ou quadrilatère, rectangle), transcription, attribut de texte (langue) ; Niveau colonne : Boîte polygone (ou quadrilatère, rectangle), transcription, attribut de texte (langue)"},{"title":"Précision","desc":"Précision","content":"Écart des coins de la boîte de délimitation ≤ 5 pixels considéré comme correct, précision ≥95 % ; Précision de transcription ≥95 %"}],"datatag":"Multiple natural scenes,Multiple shooting angles,Multiple light conditions","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"/data/apps/damp/temp/ziptemp/APY230328002_demo1711533626489/APY230328002_demo/2.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230328002_demo1711533626489/APY230328002_demo/2.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=1xXx3CKukYZpXUoWeGQa3UM5%2F5A%3D","intro":"","size":0,"progress":100,"type":"jpg"},{"name":"/data/apps/damp/temp/ziptemp/APY230328002_demo1711533626489/APY230328002_demo/3.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230328002_demo1711533626489/APY230328002_demo/3.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=k36XqpwImWbppq62S04QPeMPSEA%3D","intro":"","size":0,"progress":100,"type":"jpg"},{"name":"/data/apps/damp/temp/ziptemp/APY230328002_demo1711533626489/APY230328002_demo/1.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230328002_demo1711533626489/APY230328002_demo/1.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=zyhyQSDYy6jTbpF3nc4f%2F09ufT4%3D","intro":"","size":0,"progress":100,"type":"jpg"}],"officialSummary":"Ce corpus de 104 320 images OCR en contextes naturels coréen et hindi comprend des scènes telles que des emballages de produits, affiches, billets, panneaux d'information, menus et enseignes de bâtiments. La diversité des données repose sur la variété des environnements, angles de prise de vue et conditions lumineuses. Les langues représentées sont le coréen, l'hindi, ainsi qu'un faible pourcentage d’anglais. Les annotations sont réalisées à deux niveaux : au niveau ligne et colonne, avec des encadrements polygonaux (ou quadrilatères/rectangles), transcription textuelle et étiquetage linguistique. Ce jeu de données est parfaitement adapté aux tâches OCR sur scènes naturelles en coréen et hindi.","dataexampl":null,"datakeyword":["Coréen"," hindi"," données OCR"," scène naturelle"," données de translittération OCR"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"ocr","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"104,320 Images - Korean and Hindi OCR Data in Natural Scenes","BGimg":"","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"],"firstList":[{"name":"/data/apps/damp/temp/ziptemp/APY230328002_demo1711533626489/APY230328002_demo/5.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230328002_demo1711533626489/APY230328002_demo/5.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=59499xW%2FRbwxe18fQPgO5cjSQFE%3D","intro":"","size":0,"progress":100,"type":"jpg"}]}
104 320 images OCR de scènes naturelles – coréen et hindi
Coréen
hindi
données OCR
scène naturelle
données de translittération OCR
Ce corpus de 104 320 images OCR en contextes naturels coréen et hindi comprend des scènes telles que des emballages de produits, affiches, billets, panneaux d'information, menus et enseignes de bâtiments. La diversité des données repose sur la variété des environnements, angles de prise de vue et conditions lumineuses. Les langues représentées sont le coréen, l'hindi, ainsi qu'un faible pourcentage d’anglais. Les annotations sont réalisées à deux niveaux : au niveau ligne et colonne, avec des encadrements polygonaux (ou quadrilatères/rectangles), transcription textuelle et étiquetage linguistique. Ce jeu de données est parfaitement adapté aux tâches OCR sur scènes naturelles en coréen et hindi.
Il s'agit d'un ensemble de données payant destiné à un usage commercial, à la recherche et plus encore. Ces Jeux de données prêts à l'emploi et sous licence contribuent au lancement de projets d'IA.
Spécifications
Volume des données
76 861 images en coréen avec 555 913 encadrements ; 27 459 images en hindi avec 200 453 encadrements
Environnement de collecte
Incluant des emballages de produits, affiches, billets, panneaux informatifs, menus, enseignes de bâtiments, etc.
Variété de captures
Divers environnements extérieurs, multiples angles de prise de vue, et diverses conditions d’éclairage