Nghiên cứu mới cho thấy có bao nhiêu liên kết quan trọng trên web bị mất theo thời gian

Một phần tư liên kết sâu trong Thời báo New York ‘ các bài báo hiện đã bị mục, dẫn đến các trang hoàn toàn không thể truy cập được, theo một nhóm các nhà nghiên cứu từ Trường Luật Harvard, người đã làm việc với Times‘đội kỹ thuật số. Họ nhận thấy rằng sự cố này ảnh hưởng đến hơn một nửa số bài báo có chứa các liên kết trong NYTdanh mục của nó có từ năm 1996, minh họa vấn đề thối rữa liên kết và khó khăn như thế nào để ngữ cảnh tồn tại trên web.

Nghiên cứu đã xem xét hơn 550.000 bài báo, trong đó có hơn 2,2 triệu liên kết đến các trang web bên ngoài. Nó phát hiện ra rằng 72 phần trăm các liên kết đó là “sâu” hoặc trỏ đến một trang cụ thể hơn là một trang web chung chung. Có thể dự đoán, nó phát hiện ra rằng, theo thời gian, các liên kết có nhiều khả năng bị chết: 6% các liên kết trong các bài báo năm 2018 không thể truy cập được, trong khi một con số khổng lồ 72% các liên kết từ năm 1998 đã chết. Đối với một ví dụ phổ biến gần đây về việc thay đổi liên kết trong thực tế, chỉ cần xem những gì đã xảy ra khi Twitter cấm Donald Trump: tất cả các bài báo được nhúng trong các tweet của anh ấy đều được đặt rải rác bằng các hộp màu xám.

Một cái nhìn ngược lại về sự mục nát của liên kết theo thời gian.
Hình ảnh: Tạp chí Báo chí Columbia

Nhóm đã chọn Các Thời báo New York một phần vì bài báo được biết đến với các phương pháp lưu trữ, nhưng nó không đề xuất Times là tất cả những gì bất thường trong vấn đề thối rữa liên kết của nó. Thay vào đó, nó sử dụng tờ giấy ghi lại như một ví dụ về một hiện tượng xảy ra trên toàn mạng internet. Theo thời gian, các trang web đã từng cung cấp thông tin chi tiết có giá trị, ngữ cảnh quan trọng hoặc bằng chứng về các tuyên bố gây tranh cãi thông qua các liên kết sẽ được mua và bán hoặc chỉ đơn giản là ngừng tồn tại, để lại liên kết dẫn đến một trang trống – hoặc tệ hơn.

Tin tức về BuzzFeed báo cáo vào năm 2019 trong ngành công nghiệp ngầm tồn tại nơi khách hàng có thể trả tiền cho các nhà tiếp thị để tìm ra các liên kết chết trong các cửa hàng lớn như Times hoặc là BBC và mua miền cho chính họ. Sau đó, họ có thể làm bất cứ điều gì họ muốn với liên kết, chẳng hạn như sử dụng nó để quảng cáo sản phẩm hoặc để tổ chức một tin nhắn tạo niềm vui chủ đề của bài báo.

Sự thối rữa liên kết không chỉ ảnh hưởng đến báo chí. Hãy tưởng tượng nếu Rick Astley’s Video “Never Gonna Give You Up” đã bị xóa và tải lại. Sẽ có vô số chủ đề Reddit và phản hồi tweet sẽ không còn có ý nghĩa đối với độc giả trong tương lai. Hoặc tưởng tượng nếu bạn cố gắng hiển thị NFT của bạnvà bạn phát hiện ra rằng liên kết nguồn bây giờ trỏ đến hư không. Thật là một cơn ác mộng!

Đã có một số công việc được thực hiện trong việc cố gắng duy trì các liên kết. Wikipedia, chẳng hạn, yêu cầu những người đóng góp viết trích dẫn cung cấp liên kết đến kho lưu trữ của một trang trên các trang web như Wayback Machine nếu họ cho rằng một bài viết có thể thay đổi. Ngoài ra còn có Dự án Perma.cc, cố gắng khắc phục vấn đề liên kết thối trong các trích dẫn pháp lý và tạp chí học thuật bằng cách cung cấp phiên bản lưu trữ của trang, cùng với liên kết đến nguồn gốc.

Tuy nhiên, khó có khả năng rằng sự xuất hiện tràn lan của các dự án tương tự ngoài kia sẽ có thể giải quyết vấn đề cho toàn bộ internet, bao gồm cả mạng xã hội, hoặc thậm chí chỉ cho các nhà báo. Cho đến khi chúng tôi tìm ra giải pháp, các bài báo sẽ tiếp tục mất ngữ cảnh ngày càng nhiều hơn theo thời gian. Như một ví dụ hoàn hảo: bài báo của chúng tôi về mục liên kết từ năm 2012 có liên kết nguồn đến Nhóm bảo quản kỹ thuật số Chesapeake, hiện dẫn đến trang 404.

.

Content Protection by DMCA.com
GenVerge | Trang thông tin dành cho tín đồ công nghệ Việt Nam
Logo
Đăng ký
Liên hệ Admin để kích hoạt tài khoản Cộng Tác Viên
Quên mật khẩu