Tổng quan: Phát hiện và phân đoạn đối tượng ngụy trang là một chủ đề nghiên cứu mới và đầy thách thức trong thị giác máy tính. Hiện đang có một vấn đề nghiêm trọng là thiếu dữ liệu về các đối tượng ngụy trang như các loài động vật ngụy trang trong các cảnh tự nhiên. Trong bài báo này, chúng tôi giải quyết vấn đề học ít mẫu cho việc phát hiện và phân đoạn đối tượng ngụy trang. Để đạt được điều này, trước tiên chúng tôi thu thập một bộ dữ liệu mới, CAMO-FS, để làm dữ liệu chuẩn đánh giá. Sau đó, chúng tôi đề xuất một phương pháp mới để phát hiện và phân đoạn hiệu quả các đối tượng ngụy trang trong ảnh. Cụ thể, chúng tôi giới thiệu hàm mất mát ba thành phần ở cấp độ thực thể và bộ nhớ lưu trữ thực thể. Các thí nghiệm mở rộng đã chứng minh rằng phương pháp đề xuất của chúng tôi đạt được hiệu suất tốt nhất trên bộ dữ liệu mới thu thập.
Bài báo: Nguyen, Thanh-Danh ; Nguyen Vu, Anh-Khoa ; Nguyen, Nhat-Duy ; Nguyen, Vinh-Tiep ; Ngo, Thanh Duc ; Do, Thanh-Toan ; Tran, Minh-Triet ; Nguyen, Tam V. The Art of Camouflage: Few-shot Learning for Animal Detection and Segmentation
Đường dẫn bộ dữ liệu tại đây.
Mã nguồn để tiền xử lý và trực quan hóa dữ liệu có thể truy cập tại đây.
Mã nguồn để thực thi toàn bộ mô hình được cập nhật tại đây.
Chú thích: CAMO-FS là tập dữ liệu phục vụ các bài toán nghiên cứu trên đối tượng ngụy trang, gồm có phân loại, phát hiện đối tượng, và phân đoạn thực thể. Tập dữ liệu kế thừa và phát triển từ tập dữ liệu CAMO++ (2022) và được tạo lập cấu trúc phục vụ hướng tiếp cận học với ít dữ liệu huấn luyện. Tập dữ liệu được xây dựng gồm có các ảnh chứa thực thể ngụy trang và gán nhãn cho các bài toán theo chuẩn COCO JSON. CAMO-FS chứa 2,852 ảnh với hơn 3,342 thực thể ngụy trang, được phân bố vào 10 lớp tổng quát và 47 lớp ngữ nghĩa chi tiết.