[{"@type":"PropertyValue","name":"Volume des données","value":"30 000 images, dont 10 000 en khmer, 10 000 en lao et 10 000 en birman"},{"@type":"PropertyValue","name":"Environnement de collecte","value":"Slogans, tickets, affiches, panneaux d’avertissement, panneaux de signalisation, emballages alimentaires, panneaux publicitaires, arrêts et enseignes"},{"@type":"PropertyValue","name":"Variété de captures","value":"Divers environnements naturels et angles de prise de vue"},{"@type":"PropertyValue","name":"Appareils de collecte","value":"Téléphone mobile"},{"@type":"PropertyValue","name":"Angle de prise de vue","value":"Vue en contre-plongée, en plongée, et frontale"},{"@type":"PropertyValue","name":"Format des données","value":"Images au format courant (.jpg, etc.) ; annotations au format .json"},{"@type":"PropertyValue","name":"Contenu annoté","value":"Annotation par quadrilatère au niveau des lignes (ou colonnes) avec transcription associée ; annotation polygonale avec transcription du contenu"},{"@type":"PropertyValue","name":"Précision","value":"Une déviation des sommets ≤ 5 pixels est considérée comme correcte ; précision des cadres ≥ 95 % ; précision de la transcription ≥ 95 %"}]
{"id":1758,"datatype":"1","titleimg":"https://fr.nexdata.ai/shujutang/static/image/index/datatang_tuxiang_default.webp","type1":"147","type1str":null,"type2":"150","type2str":null,"dataname":"30 000 images : Données OCR en langues minoritaires d'Asie du Sud-Est provenant de scènes naturelles","datazy":[{"title":"Volume des données","desc":"Volume des données","content":"30 000 images, dont 10 000 en khmer, 10 000 en lao et 10 000 en birman"},{"title":"Environnement de collecte","desc":"Environnement de collecte","content":"Slogans, tickets, affiches, panneaux d’avertissement, panneaux de signalisation, emballages alimentaires, panneaux publicitaires, arrêts et enseignes"},{"title":"Variété de captures","desc":"Variété de captures","content":"Divers environnements naturels et angles de prise de vue"},{"title":"Appareils de collecte","desc":"Appareils de collecte","content":"Téléphone mobile"},{"title":"Angle de prise de vue","desc":"Angle de prise de vue","content":"Vue en contre-plongée, en plongée, et frontale"},{"title":"Format des données","desc":"Format des données","content":"Images au format courant (.jpg, etc.) ; annotations au format .json"},{"title":"Contenu annoté","desc":"Contenu annoté","content":"Annotation par quadrilatère au niveau des lignes (ou colonnes) avec transcription associée ; annotation polygonale avec transcription du contenu"},{"title":"Précision","desc":"Précision","content":"Une déviation des sommets ≤ 5 pixels est considérée comme correcte ; précision des cadres ≥ 95 % ; précision de la transcription ≥ 95 %"}],"datatag":"OCR,Southeast Asian Languages,Natural Scenes,Document Photograph,Electronic Scenes","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"000403_Khmer.png","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20251203171931/000403_Khmer.png?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=L2J7muvDBy0QPwH2rM1u6k6w5JM%3D","intro":"","size":227016,"progress":100,"type":"jpg"},{"name":"002617_Khmer.png","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20251203171931/002617_Khmer.png?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=ROYTGM4k6aYF0orFqlmCCSxQMx8%3D","intro":"","size":9170388,"progress":100,"type":"jpg"},{"name":"016759_Burmese.png","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20251203171931/016759_Burmese.png?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=XBOxiiJt6plkUNjHNn3x3FcjZ1k%3D","intro":"","size":1105131,"progress":100,"type":"jpg"}],"officialSummary":"Données OCR pour 30 000 images en langues minoritaires d'Asie du Sud-Est : Khmer (Cambodge), Laotien, Birman. Diversité : scènes naturelles, angles de prise de vue. Utilisable pour l'OCR en langues d'Asie du Sud-Est.","dataexampl":null,"datakeyword":["OCR"," langues d’Asie du Sud-Est"," scènes naturelles"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"ocr","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"29,954 Images - OCR Collection Data in Southeast Asian Languages","BGimg":"","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"],"firstList":[{"name":"030294_Laos.png","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20251203171931/030294_Laos.png?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=eJt2N7fokJRVZfF9OWTx3%2BOWy0A%3D","intro":"","size":8952795,"progress":100,"type":"jpg"}]}
30 000 images : Données OCR en langues minoritaires d'Asie du Sud-Est provenant de scènes naturelles
OCR
langues d’Asie du Sud-Est
scènes naturelles
Données OCR pour 30 000 images en langues minoritaires d'Asie du Sud-Est : Khmer (Cambodge), Laotien, Birman. Diversité : scènes naturelles, angles de prise de vue. Utilisable pour l'OCR en langues d'Asie du Sud-Est.
Il s'agit d'un ensemble de données payant destiné à un usage commercial, à la recherche et plus encore. Ces Jeux de données prêts à l'emploi et sous licence contribuent au lancement de projets d'IA.
Spécifications
Volume des données
30 000 images, dont 10 000 en khmer, 10 000 en lao et 10 000 en birman
Environnement de collecte
Slogans, tickets, affiches, panneaux d’avertissement, panneaux de signalisation, emballages alimentaires, panneaux publicitaires, arrêts et enseignes
Variété de captures
Divers environnements naturels et angles de prise de vue
Appareils de collecte
Téléphone mobile
Angle de prise de vue
Vue en contre-plongée, en plongée, et frontale
Format des données
Images au format courant (.jpg, etc.) ; annotations au format .json
Contenu annoté
Annotation par quadrilatère au niveau des lignes (ou colonnes) avec transcription associée ; annotation polygonale avec transcription du contenu
Précision
Une déviation des sommets ≤ 5 pixels est considérée comme correcte ; précision des cadres ≥ 95 % ; précision de la transcription ≥ 95 %