Dự án Gucciberg cung cấp sách nói cổ điển được đọc bởi AI chuyên sâu của Gucci Mane

Từng muốn có của Leo Tolstoy Anna Karenina hoặc Franz Kafka’s Sự biến hình đọc cho bạn nghe bởi thần bẫy Gucci Mane, tác giả của những bản hit như “Lemonade” và “Wasted”? Chà, a) đó là một mong muốn vô cùng cụ thể, và b) đó là ngày may mắn của bạn.

Dự án Gucciberg là lần giảm mới nhất từ ​​nhà máy virus MSCHF, và nó thực hiện chính xác điều đó. Sử dụng công nghệ máy học, MSCHF đã tạo ra một đoạn âm thanh sâu sắc về Gucci Mane đang đọc tuyển tập các văn bản cổ điển từ Phụ nữ nhỏ đến Beowulf. Tất cả đều có thể nghe miễn phí và đi kèm với bìa sách kết hợp hoàn hảo với tác phẩm nghệ thuật về thể loại đĩa hát sung mãn của Gucci Mane.

Các của Dự án Gucciberg thì khá đơn giản, nhưng tại sao khó trả lời hơn. Nếu bạn không quen với MSCHF, tôi giới thiệu hồ sơ của chúng tôi về trang phục từ năm ngoái. Về cơ bản, họ là một nhóm những người sáng tạo do VC tài trợ, những người tạo ra những thứ kỳ lạ được thiết kế để lan truyền trực tuyến, như bong bóng gà kêu và giày thể thao Air Max 97 chứa đầy nước từ sông Jordan, một số được bán với một khoản phí nhỏ. Và rồi họ ??? và lợi nhuận (có lẽ là bằng cách bán dịch vụ của họ cho các công ty muốn những thứ họ được thực hiện để lan truyền trực tuyến).

Đang nói chuyện với The Verge, Dan Greenberg của MSCHF không đi sâu vào động lực đằng sau Dự án Gucciberg nhưng rất vui khi nói về cơ khí. Âm thanh sâu sắc hiện nay khá phổ biến (hãy nghe bản sao này của Joe Rogan để biết ví dụ tốt), đến mức họ đã từng dùng để lừa đảo. Để tạo một câu nói, bạn chỉ cần nhiều dữ liệu mẫu về cách nói mục tiêu của mình và mạng nơ-ron phù hợp để tìm hiểu và sao chép cách cư xử của chúng.

Greenberg cho biết MSCHF đã thu thập khoảng sáu giờ âm thanh của Gucci Mane nói chuyện từ các podcast, các cuộc phỏng vấn và những thứ tương tự. Sau đó, họ tạo bản chép lời của các clip để trợ giúp quá trình chuyển văn bản thành giọng nói (TTS). Điều này đòi hỏi phải tạo ra một “từ điển / khóa phát âm Gucci để nắm bắt tốt hơn các đặc điểm riêng của ví dụ cụ thể của Gucci Mane.”

Các bìa sách được thiết kế lại của Dự án Gucciberg là một điều thú vị khi nhìn thấy.

Greenberg nói: “Cách phát âm của Gucci tuân theo một nhịp rất cụ thể – ví dụ, anh ấy sử dụng nhiều loại nguyên âm hơn nhiều so với người đọc TTS trung bình của bạn. “Từ điển chia nhỏ các từ thành các âm vị (cử chỉ giọng nói rời rạc) mà mô hình của chúng tôi sau đó sử dụng như các khối xây dựng … Vì vậy, đối với một ví dụ đơn giản, chúng tôi cần mô hình của mình biết những âm tiết cần giải thích hoặc chuyển vào nhau qua các từ: cần biết để nói “talm” bout “chứ không phải” nói về “và từ điển Gucci {T AH1 LMB AW1 T} đưa chúng ta đến đó nơi các từ được viết” nói về “không có.”

Kết quả rất ấn tượng: deepfake chắc chắn nghe giống như chính người đàn ông, mặc dù kết quả không phải lúc nào cũng hoàn toàn mạch lạc hoặc có chất lượng tốt nhất. Greenberg nói: “Gucci Mane giả của chúng tôi thường nghe như thể anh ta đang nói qua một chiếc mic kém hoặc qua một luồng internet chất lượng thấp, và một phần của điều này là do trong dữ liệu đào tạo, anh ta thường làm chính xác như vậy.

Greenberg nói chính xác lý do tại sao Gucci được chọn cho dự án này là do hai yếu tố: một, rapper có chất giọng đặc biệt, và hai, cách chơi chữ của Project Gucciberg là quá ngon bỏ qua.

Greenberg nói thêm rằng MSCHF đã không tiếp cận Gucci để xin phép sử dụng giọng nói của anh ấy. Như một tuyên bố từ chối trách nhiệm trên trang web đã chỉ ra một cách ranh mãnh, toàn bộ dự án đặt ra những câu hỏi thú vị về bản quyền trong thời đại AI làm giả. “Chúng tôi không viết sách, và chúng tôi đào sâu giọng nói,” nó nói. “Đây có phải là vi phạm bản quyền không? Đó có phải là hành vi trộm cắp danh tính? Tất cả dữ liệu đào tạo (bản ghi âm) được sử dụng để thực hiện Dự án Gucciberg đã được công bố công khai trên web. Gucciberg sống trong khu vực màu xám đáng yêu đó, nơi mọi thứ đều mới và mọi thứ đều diễn ra ”. Nó chắc chắn là như vậy! The Verge đã cố gắng liên hệ với Gucci Mane thông qua hãng thu âm của anh ấy để có phản hồi và chúng tôi sẽ cập nhật câu chuyện này nếu có phản hồi.

Dự án Gucciberg có gì khác hơn là một cú nhấp chuột nhanh chóng và lol? Chà, không hẳn vậy. Nhưng đó là công việc kinh doanh của MSCHF, và họ rất giỏi. Mặc dù nghe hơn một vài phút âm thanh thu được có đôi chút mất phương hướng, Greenberg cho thấy có thể có những lợi ích độc đáo đối với thế giới sắp tới của sách nói về người nổi tiếng deepfake theo yêu cầu.

“Thỉnh thoảng … sự bình dị đến tột độ trong lời tường thuật của Gucci Mane thực sự đã đưa văn bản vào một ánh sáng mới,” anh nói, nói về lợi ích của việc nghe phiên bản deepfake của Kafka Sự biến hình. “Gregor Samsa thực sự giống một chàng trai khác không muốn rời khỏi giường, bạn biết không?”

Content Protection by DMCA.com
GenVerge | Trang thông tin dành cho tín đồ công nghệ Việt Nam
Logo
Đăng ký
Liên hệ Admin để kích hoạt tài khoản Cộng Tác Viên
Quên mật khẩu