Lọc theo danh mục
  • Năm xuất bản
    Xem thêm
  • Lĩnh vực
liên kết website
Lượt truy cập
 Lượt truy cập :  22,566,133
  • Công bố khoa học và công nghệ Việt Nam

Toán học ứng dụng

Lê Đình Nghiệp, Phạm Việt Bình, Đỗ Năng Toàn(1), Phạm Thu Hà, Trần Văn Huy

Cải tiến kiến trúc mạng Yolo cho bài toán nhận dạng Logo

Custumized yolo architecture for logo recognition

Khoa học và Công nghệ - Đại học Thái Nguyên

2019

7

199-205

1859-2171

Ngày nay, logo không những được xem là thương hiệu gắn liền với doanh nghiệp mà còn có nhiều ý nghĩa khác. Vì vậy, nhận dạng logo là bài toán rất được quan tâm. Bài báo này trình bày một phương pháp nhận dạng logo dựa trên kiến trúc mạng học sâu. Thay vì sử dụng tiếp cận kiểu RCNN hoặc biến thể FRCNN, chúng tôi đã cải tiến mạng học sâu Yolo để dò tìm vùng logo đồng thời với nhận dạng logo trong ảnh mầu đầu vào. Kết quả thực nghiệm với mẫu tập flickrlogo47 cho thấy phương pháp đề xuất đạt được độ chính xác cao. Hơn nữa, phương pháp đề xuất đơn giản, hiệu quả và có thời gian thực hiện nhanh, phù hợp với các hệ thống nhận dạng logo yêu cầu tính thời gian thực.

Today, logos not only are considered trademarks associated with businesses, but also have others meaningfull. Therefore, logo identification is a very important problem in image processing. This article presents a method of identifying logos in real time with a deep learning network architecture. Instead of using an RCNN type approach or FRCNN variant, we custumized Yolo algorithm to detect the logo area simultaneously with the logo identification in the input color image. Experimental results with popular logo dataset flickrlogos-47, show that the proposed method achieves high accuracy. Furthermore, the proposed method is simple, effective and has a fast execution time, in accordance with the logo recognition system that requires real-time computing.

TTKHCNQG, CTv 178

  • [1] (), FlickrLogo-47 Dataset,http://www.multimediacomputing.de/flickrlogos/
  • [2] R. B. Girshick. (2015), Fast R-CNN,CoRR, abs/1504.08083
  • [3] J. Redmon; S. Divvala; R. Girshick; A. Farhadi (2016), You only look once: Unified, real-time object detection,in Proceedings of the IEEE conference on computer vision and pattern recognition, pp. 779– 788
  • [4] J. R. Uijlings; K. E. van de Sande; T. Gevers; A. W. Smeulders (2013), Se-lective search for object recognition,International Journal of Computer Vision (IJCV)
  • [5] J. Redmon; A. Farhadi. (2018), Yolov3: An incremental improvement,CoRR, abs/1804.02767
  • [6] W. Liu; D. Anguelov; D. Erhan; C. Szegedy; S. Reed; C.-Y. Fu; A. C. Berg (2016), Ssd: Single shot multibox detector,In European conference on computer vision, pp. 21–37.Springer
  • [7] S. Ren; K. He R. Girshick; J. Sun (2017), Faster R-CNN: Towards real-time object detection with region proposal networks,IEEE Trans. Pattern Anal. Mach. Intell., 39(6), pp.1137–1149, June 2017
  • [8] S. Romberg; L. G. Pueyo; R. Lienhart; R. van Zwol (2011), Scalable logo recognition in realworld images,In Proceedings of the 1st ACM International Conference on Multimedia Retrieval, ICMR ’11, pp. 25:1–25:8, New York, NY, USA, 2011. ACM
  • [9] S. Bianco; M. Buzzelli; D. Mazzini; R. Schettini (2017), Deep learning for logo recognition,in: Neurocomputing, 245, pp. 23-30
  • [10] R. Girshick; J. Donahue; T. Darrell; J. Malik (2016), Region-based convolutional networks for accurate object detection and segmentation,Pattern Analysis and Machine Intelligence, IEEE Transactions on 38 (1), pp. 142-158
  • [11] G. Oliveira; X. Fraz~ao; A. Pimentel; B. Ribeiro (2016), Automatic graphic logo detection via fast region-based convolutional networks,in: Neural Networks (IJCNN), 2016 International JointConference on, IEEE, pp. 985-991
  • [12] F. N. Iandola; A. Shen; P. Gao; K. Keutzer (), Deeplogo: Hitting logo recognition with the deep neural network hammer,arXiv preprint arXiv:1510.02131
  • [13] C. Eggert; A. Winschel; R. Lienhart (2015), On the benefit of synthetic data for company logo detection,in: Proceedings of the 23rd Annual ACM Conference on Multimedia Conference, ACM, pp. 1283-1286
  • [14] S. Bianco; M. Buzzelli; D. Mazzini; R. Schettini (2015), Logo recognition using cnn features,in: Image Analysis and Processing ICIAP 2015, Springer, pp. 438-448
  • [15] J. Meng; J. Yuan; Y. Jiang; N. Narasimhan; V. Vasudevan; Y. Wu (2010), Interactive visual object search through mutual information maximization,in: Proceedings of the 18th ACM international conference on Multimedia, ACM, pp. 1147-1150
  • [16] A. Joly; O. Buisson (2009), Logo retrieval with a contrario visual query expansion,in: Proceedings of the 17th ACM international conference on Multimedia, ACM, pp. 581-584
  • [17] J. Kleban; X. Xie; W.-Y. Ma. (2008), Spatial pyramid mining for logo detection in natural scenes,in: Multimedia and Expo, 2008 IEEE International Conference on, IEEE, pp. 1077- 1080
  • [18] A. D. Bagdanov; L. Ballan; M. Bertini; A. Del Bimbo (2007), Trademark matching and retrieval in sports video databases,in: Proceedings of the international workshop on Workshop on multimedia information retrieval, ACM, pp. 79-86
  • [19] Souvik Ghosh; Ranjan Parekh (2015), Automated Color Logo Recognition System based on shape and Color Features,International Journal of Computer Applications, 118(12), pp. 14-20
  • [20] R. Boia;C. Florea (2015), Homographic class template for logo localization and recognition,In Iberian Conference on Pattern Recognition and Image Analysis, pp. 487-495, Springer
  • [21] S. Bianco; M. Buzzelli; D. Mazzini; R. Schettini (2015), Logo recognition using cnn features,In International Conference on Image Analysis and Processing, pp. 438–448. Springer