Thuật toán cắt ảnh của Twitter thích những khuôn mặt trẻ, đẹp và có làn da sáng

Tháng Tám 10, 2021

9 Views

LưuĐã lưuĐã xoá 0

Twitter có công bố kết quả của một cuộc thi mở nhằm tìm ra sai lệch về thuật toán trong hệ thống cắt ảnh của nó. Công ty đã tắt tính năng cắt ảnh tự động Tháng Ba sau khi các thử nghiệm của người dùng Twitter vào năm ngoái đã đề xuất nó ưa thích mặt trắng hơn mặt đen. Sau đó, nó tung ra một phần thưởng lỗi thuật toán để thử và phân tích vấn đề kỹ hơn.

Cuộc thi đã xác nhận những phát hiện trước đó. Các mục nhập hàng đầu cho thấy rằng thuật toán cắt xén của Twitter ủng hộ những khuôn mặt “thon gọn, trẻ trung, có màu da sáng hoặc ấm, kết cấu da mịn màng và có các đặc điểm khuôn mặt nữ tính theo khuôn mẫu”. Các mục nhập ở vị trí thứ hai và thứ ba cho thấy rằng hệ thống đã thành kiến với những người có mái tóc trắng hoặc bạc, gợi ý phân biệt tuổi tác và ủng hộ tiếng Anh hơn chữ viết Ả Rập trong hình ảnh.

Trong một trình bày những kết quả này tại hội nghị DEF CON 29, Rumman Chowdhury, giám đốc nhóm META của Twitter (nghiên cứu về Đạo đức học máy, Tính minh bạch và Trách nhiệm giải trình), đã ca ngợi những người tham gia vì đã cho thấy những tác động thực tế của sự thiên vị thuật toán.

“Khi chúng tôi nghĩ về thành kiến trong các mô hình của mình, nó không chỉ là về học thuật hoặc thử nghiệm […] nhưng điều đó cũng hoạt động như thế nào với cách chúng ta suy nghĩ trong xã hội, ”Chowdhury nói. “Tôi sử dụng cụm từ ‘cuộc sống bắt chước nghệ thuật bắt chước cuộc sống.’ Chúng tôi tạo ra những bộ lọc này bởi vì chúng tôi nghĩ rằng đó là những gì đẹp đẽ và điều đó dẫn đến việc đào tạo người mẫu của chúng tôi và thúc đẩy những quan niệm phi thực tế này về ý nghĩa của việc hấp dẫn. “

Bài dự thi chiến thắng sử dụng GAN để tạo ra các khuôn mặt khác nhau theo tông màu da, chiều rộng và các đặc điểm nam tính so với nữ tính.

Hình ảnh: Bogdan Kulynych

Vị trí đầu tiên của cuộc thi và người chiến thắng giải thưởng 3.500 đô la cao nhất, là Bogdan Kulynych, một sinh viên tốt nghiệp tại EPFL, một trường đại học nghiên cứu ở Thụy Sĩ. Kulynych đã sử dụng một chương trình AI có tên StyleGAN2 để tạo ra một số lượng lớn các khuôn mặt thực tế mà anh ấy thay đổi theo màu da, các đặc điểm trên khuôn mặt nữ tính so với nam tính và độ mảnh mai. Sau đó, anh ấy đưa các biến thể này vào thuật toán cắt ảnh của Twitter để tìm ra nó ưa thích.

Như Kulynych lưu ý trong bản tóm tắt của mình, những thành kiến thuật toán này làm khuếch đại thành kiến trong xã hội, theo nghĩa đen là cắt bỏ “những người không đáp ứng sở thích của thuật toán về trọng lượng cơ thể, tuổi tác, màu da”.

Những thành kiến như vậy cũng lan rộng hơn bạn nghĩ. Một người khác tham gia cuộc thi, Vincenzo di Cicco, người đã giành được đề cập đặc biệt cho cách tiếp cận sáng tạo của mình, cho thấy rằng thuật toán cắt xén hình ảnh cũng biểu tượng cảm xúc được ưa chuộng với tông màu da sáng hơn trên biểu tượng cảm xúc với tông màu da tối hơn. Mục nhập vị trí thứ ba, bởi Roya Pakzad, người sáng lập tổ chức ủng hộ công nghệ Taraaz, tiết lộ rằng những thành kiến này cũng mở rộng đến các tính năng bằng văn bản. Công trình của Pakzad đã so sánh các meme sử dụng chữ viết tiếng Anh và tiếng Ả Rập, cho thấy rằng thuật toán thường xuyên cắt hình ảnh để làm nổi bật văn bản tiếng Anh.

*Các meme mẫu được Roya Pakzad sử dụng để kiểm tra sự thiên vị đối với ngôn ngữ tiếng Anh trong thuật toán của Twitter*.

Mặc dù kết quả của cuộc cạnh tranh thiên vị của Twitter có vẻ không khả quan, khẳng định bản chất phổ biến của thiên vị xã hội trong các hệ thống thuật toán, nó cũng cho thấy cách các công ty công nghệ có thể chống lại những vấn đề này bằng cách mở hệ thống của họ trước sự giám sát từ bên ngoài. Chowdhury cho biết: “Khả năng những người tham gia một cuộc thi như thế này tìm hiểu sâu về một loại tác hại hoặc thành kiến cụ thể là điều mà các đội trong các tập đoàn không có đủ điều kiện để làm.

Cách tiếp cận cởi mở của Twitter trái ngược với phản ứng từ các công ty công nghệ khác khi đối mặt với các vấn đề tương tự. Khi các nhà nghiên cứu dẫn đầu bởi Joy Buolamwini của MIT tìm thấy thành kiến về chủng tộc và giới tính trong các thuật toán nhận dạng khuôn mặt của Amazon, ví dụ: công ty đã thực hiện một chiến dịch đáng kể để làm mất uy tín của những người liên quan, gọi công việc của họ “Gây hiểu lầm” và “sai”. Sau khi chiến đấu với những phát hiện trong nhiều tháng, Amazon cuối cùng đã từ bỏ, đặt một lệnh cấm tạm thời về việc sử dụng các thuật toán tương tự này của cơ quan thực thi pháp luật.

Patrick Hall, một giám khảo trong cuộc thi của Twitter và một nhà nghiên cứu AI làm việc trong lĩnh vực phân biệt thuật toán, nhấn mạnh rằng những thành kiến như vậy tồn tại trong tất cả các hệ thống AI và các công ty cần phải làm việc chủ động để tìm ra chúng. Hall nói: “AI và máy học chỉ là miền Tây hoang dã, cho dù bạn nghĩ nhóm khoa học dữ liệu của mình có kỹ năng đến đâu. “Nếu bạn không tìm thấy lỗi của mình hoặc tiền thưởng lỗi không tìm thấy lỗi của bạn, thì ai là người tìm ra lỗi của bạn? Vì bạn chắc chắn có lỗi ”.