Tổng quan: Hoạt hình hóa chân dung nhằm mục đích chuyển đổi một hình ảnh chân dung sang phiên bản hoạt hình của nó, đảm bảo hai điều kiện, cụ thể là giảm chi tiết kết cấu và tổng hợp các đặc điểm khuôn mặt hoạt hình (ví dụ: mắt to hoặc mũi vẽ bằng đường kẻ). Để giải quyết vấn đề này, chúng tôi đề xuất một phương pháp huấn luyện hai giai đoạn dựa trên GAN, rất mạnh mẽ cho các bài toán phong cách hóa. Giai đoạn tổng quát với hàm mất mát tổng quát mới được sử dụng để giảm chi tiết kết cấu. Trong khi đó, giai đoạn nhận diện được áp dụng để tổng hợp các đặc điểm khuôn mặt hoạt hình. Để đánh giá toàn diện phương pháp đề xuất và các phương pháp hiện đại khác cho hoạt hình hóa chân dung, chúng tôi đóng góp một bộ dữ liệu quy mô lớn mới đầy thách thức có tên là CartoonFace10K. Ngoài ra, chúng tôi nhận thấy rằng chỉ số phổ biến FID tập trung vào phong cách mục tiêu nhưng bỏ qua việc bảo toàn nội dung hình ảnh đầu vào. Do đó, chúng tôi giới thiệu một chỉ số mới FISI, kết hợp FID và SSIM để tập trung cả vào các đặc điểm mục tiêu và giữ lại nội dung đầu vào. Kết quả định lượng và định tính cho thấy phương pháp đề xuất của chúng tôi vượt trội hơn các phương pháp hiện đại khác.
Bài báo: Sy-Tuyen Ho, Manh-Khanh Ngo Huu, Thanh-Danh Nguyen, Nguyen Phan, Vinh-Tiep Nguyen, Thanh Duc Ngo, Duy-Dinh Le, Tam V. Nguyen Abstraction-perception preserving cartoon face synthesis
Đường dẫn bộ dữ liệu tại đây.
Chú thích: Bộ dữ liệu phục vụ cho bài toán image generation với phong cách hoạt hình Anime Nhật Bản. Chủ thể chính là ảnh gương mặt. Bao gồm 10.000 hình ảnh.