Trích xuất dữ liệu cá nhân là ngành công nghiệp phát triển nhanh nhất nước Mỹ. Nếu dữ liệu là một loại dầu khí mới, nước Mỹ sẽ trở thành Saudi Arabia của kỷ nguyên kỹ thuật số, và các công ty nền tảng hàng đầu sẽ trở thành những Aramco hay ExxonMobil của thời đại mới.
Đừng Trở Nên Xấu Xa
(1 lượt)
Mua sách giảm giá 30% >>
Tuy nhiên, các công ty nền tảng không phải là những tay chơi duy nhất hoạt động trong lĩnh vực giám sát kỹ thuật số. Các trung gian dữ liệu như văn phòng tín dụng công ty chăm sóc sức khỏe hay công ty thẻ tín dụng cũng thu thập và bán mọi loại dữ liệu nhạy cảm của người dùng cho các doanh nghiệp và tổ chức không có quy mô đủ lớn để tự thu thập. Các tổ chức này bao gồm các nhà bán lẻ, ngân hàng tổ chức cho vay thế chấp, trường cao đẳng, đại học, tổ chức từ thiện, và tất nhiên là các chiến dịch chính trị.
Đây là lý do vì sao chúng ta không thấy nhiều công ty bên ngoài Thung lũng Silicon kêu gọi các hành động chống độc quyền chống lại các công ty công nghệ lớn, vì họ chính là những người mua dữ liệu do Thung lũng Silicon bán ra. Sự ra đời của Internet vạn vật, với các cảm biến có khả năng kết nối Internet được cài vào vô số thiết bị xung quanh chúng ta, sẽ mở rộng việc khai thác tài nguyên kỹ thuật số theo cấp số nhân. Mọi công ty đều đang nhảy vào lĩnh vực này. Hệ quả là có lẽ chúng ta sẽ không thể kiểm soát mọi vấn đề xuất phát từ chủ nghĩa tư bản giám sát.
Đó là lý do vì sao chúng ta cần cân nhắc xem liệu các công ty đang khai thác loại “dầu khí” kỹ thuật số này có nên trả tiền cho chúng hay không. Bang California từng đề xuất rằng những công ty thu thập dữ liệu phải trả “cổ tức kỹ thuật số” cho chủ sở hữu của loại tài nguyên này – tức là tất cả chúng ta. Tương tự, bang Alaska và nhiều quốc gia khác như Na Uy cũng đã tạo ra các quỹ đầu tư, sử dụng phần trăm doanh thu từ hàng hóa để đầu tư cho lợi ích của thế hệ tương lai. Các công ty khai thác dữ liệu hoàn toàn có thể làm được điều đó. Google và Facebook có tỷ suất lợi nhuận cao ở mức hai con số vì họ không trả tiền cho các nguyên liệu thô đầu vào – dữ liệu của chúng ta. Nhưng chúng ta cần có quyền sở hữu đối với thông tin cá nhân của mình. Và nếu những công ty thu thập dữ liệu đang sử dụng dữ liệu của chúng ta, thì chúng ta nên được đền bù vì việc đó.
Có bốn loại doanh nghiệp thu thập dữ liệu chính – nền tảng, nhà môi giới dữ liệu, nhà cung cấp thẻ tín dụng và công ty chăm sóc sức khỏe – và họ có thể trả cho mọi người Mỹ đang sử dụng Internet một khoản phí cố định trích từ một phần doanh thu của chính họ. Hoặc chúng ta cũng có thể khiến những công ty này phải bỏ một phần số tiền lợi nhuận vào công quỹ để đầu tư cho giáo dục và cơ sở hạ tầng. Sẽ rất tuyệt vời nếu các quỹ này có thể được đầu tư cho giáo dục, vì tất cả những thay đổi mà tôi đã nêu trong quyển sách này đều đòi hỏi việc đào tạo lại lực lượng lao động của thế kỷ 21. Việc sử dụng tiền của Big Tech để đầu tư cho giáo dục âu cũng là chuyện công bằng, bởi những công ty này vẫn thường phàn nàn về hệ thống giáo dục ở Mỹ. Cùng lúc đó, khoản thuế 50% đối với doanh thu kỹ thuật số cũng có thể bù đắp một phần lớn cho khoản chi tiêu cơ sở hạ tầng của nước Mỹ, ước tính khoảng 135 tỷ đô-la vào năm 2022. Đó là một sự trao đổi công bằng để cho phép những người thu thập dữ liệu truy cập miễn phí vào nguồn tài nguyên quý giá nhất của quốc gia. Nếu dữ liệu là một tài nguyên thì có lẽ chúng ta cần một quỹ đầu tư quốc gia cho nó.
Mặc dù vậy, việc đánh thuế các nhà khai thác dữ liệu không thể là một “kim bài miễn tử” cho phép họ phớt lờ quyền riêng tư của cá nhân hoặc quyền tự do dân sự. Đối với người dùng của công nghệ nền tảng tính minh bạch có thể được tăng cường với các điều khoản “chấp nhận chia sẻ”, cho phép họ kiểm soát nhiều hơn về cách dữ liệu của họ được sử dụng (như Quy định Bảo vệ Dữ liệu Chung của EU hay các đề xuất thậm chí còn khắt khe hơn của California). Từ ngữ được dùng để mô tả các điều khoản này phải rõ ràng và đơn giản, và các công ty chính là bên có nghĩa vụ đưa ra các bằng chứng vi phạm chứ không phải các cá nhân. Big Tech cũng cần lưu giữ nhật ký về những dữ liệu họ đã đưa vào các thuật toán và phải sẵn sàng giải thích các thuật toán của họ với công chúng.
Frank Pasquale tại Đại học Maryland cho biết: “Có một khuôn mẫu không ngừng lặp lại, theo đó một số tổ chức phàn nàn về cách hoạt động của một công ty Internet lớn, và công ty này tuyên bố những người chỉ trích không hiểu cách thức các thuật toán của họ sắp xếp và xếp hạng nội dung, còn giới quan sát ngớ ngẩn thì bị thu hút bởi các bài viết từ đối thủ của họ”. Theo đề xuất của nhà toán học kiêm nhà phê bình công nghệ Cathy O’Neil, các công ty nên chuẩn bị sẵn sàng để đối mặt với các cuộc “thanh tra” về thuật toán, trong trường hợp có khiếu nại hoặc ý kiến lo ngại rằng sự thiên vị trong thuật toán có thể dẫn tới phân biệt đối xử tại nơi làm việc, chăm sóc sức khỏe, giáo dục…
Các quyền về kỹ thuật số của cá nhân cũng nên được hợp pháp hóa. Cựu biên tập viên John Battelle của tạp chí Wired đã đề xuất một dự luật về quyền kỹ thuật số, trong đó xác định quyền sở hữu dữ liệu thuộc về chủ sở hữu thực sự của nó, và đó tất nhiên là người dùng và người tạo ra dữ liệu, chứ không phải công ty thu thập dữ liệu đó. Ông tin rằng khái niệm này cần được quan tâm đặc biệt, thậm chí là cần được bổ sung vào Hiến pháp. Như ủy ban chống độc quyền của EU từng nói, mọi người đều có “quyền được lãng quên”, và các công ty phải xóa bất kỳ dữ liệu nào có liên quan đến những cá nhân “muốn được lãng quên”. Hai triệu người châu Âu đã chọn xóa bỏ dữ liệu của họ như vậy. Cuối cùng tôi hy vọng nước Mỹ sẽ có một cơ quan bảo vệ người tiêu dùng kỹ thuật số với các quy định cứng rắn để đối phó với việc phân biệt đối xử bằng các thuật toán, cũng như có một hệ thống có thể đảm bảo các cá nhân sẽ truy cập được và hiểu được cách mà dữ liệu cá nhân của họ đang được sử dụng tương tự những gì chúng ta có thể làm với điểm tín dụng ngày nay.
Tất cả những điều này đều có liên quan đến yêu cầu về sự minh bạch và mức độ đơn giản cao hơn trong cuộc thảo luận về Big Tech. Sự phức tạp (hoặc ảo tưởng phức tạp) rất thường được sử dụng để né tránh những câu hỏi chính đáng về lợi ích công chúng chẳng hạn như các nhà vận động đang truyền tải thông điệp của họ như thế nào hoặc người dùng đang bị theo dõi và đánh giá ra sao. Các công ty cần giúp chúng ta hiểu được những điều đó bằng cách mở chiếc “hộp đen” chứa đựng thuật toán của họ. Đây không nhất thiết là một bất lợi trong cạnh tranh; nghiên cứu cho thấy lượng dữ liệu đưa vào thuật toán mới là tài sản, chứ không phải tính hữu dụng của chính thuật toán đó. Thậm chí, tính minh bạch cao hơn cũng có thể là một yếu tố tạo ra doanh thu, vì nếu người dùng càng tin tưởng vào những gì các công ty đang làm thì họ càng sẵn sàng chia sẻ những dữ liệu giá trị hơn. Và các nhà đầu tư vốn đã mất rất nhiều niềm tin cũng có thể tin tưởng và rót nhiều tiền hơn vào các nền tảng Big Tech. Như trợ lý cấp cao của một nhà hoạch định chính sách đã chia sẻ với tôi khi tôi bắt đầu nghiên cứu cho quyển sách này, dữ liệu là hàng hóa có giá trị nhất trên hành tinh, nhưng các công ty đang truyền tải các dữ liệu đó lại không phải khai báo giá trị rõ ràng trên báo cáo tài chính của họ. Hiện tại, giá trị tiền tệ vẫn được xem là chỉ số cho thấy “lợi thế thương mại” trên báo cáo tài chính, hoặc thậm chí thường không được nêu ra.
Điều này nhất định phải được thay đổi, và lý do chính là vì các nhà đầu tư không thể có được bức tranh chính xác về giá trị của một công ty công nghệ nếu không hiểu được giá trị của loại hàng hóa mà công ty đó đang kinh doanh. (Hãy tưởng tượng nếu bạn không nhìn thấy giá trị của các tài sản do GM hay Ford nắm giữ trên bảng cân đối kế toán của họ.) Nhưng quan trọng hơn, khi chúng ta là sản phẩm, khi dữ liệu của chúng ta được thu thập, chúng ta có quyền biết giá trị của nó là bao nhiêu. Và sau đó, với tư cách là một xã hội, chúng ta có thể quyết định xem có nên nhận lại một phần giá trị đó hay không.
Chúng ta cũng nên xem xét liệu nên hay không nên biến khu vực công thành nơi lưu trữ dữ liệu thay vì khu vực tư nhân, qua đó đảm bảo những người ở khu vực tư nhân vẫn có quyền truy cập dữ liệu bình đẳng và các công dân có quyền kiểm soát nhiều hơn trong việc dữ liệu của họ đang được dùng để kinh doanh. Mọi người thường cho rằng trong thế giới mới của big data và Al – yếu tố sẽ thúc đẩy sự tăng trưởng toàn cầu trong vài thập niên tới – chỉ có thể có hai mô hình: nhà nước giám sát của chính phủ biết và chỉ đạo tất cả; hoặc một nước Mỹ với các quy định nhẹ nhàng hơn vốn đã tạo ra một nhóm sức mạnh độc quyền, có thể gây khó khăn cho việc tạo ra việc làm và thúc đẩy tăng trưởng trong một nền kinh tế lớn hơn.
Nhưng chúng ta vẫn còn một cách thứ ba, cách mà Pháp và các quốc gia khác đang theo đuổi nhằm hướng tới một điểm trung hòa. Ở châu Âu, khu vực công đã nắm giữ một lượng lớn dữ liệu về y tế, giao thông quốc phòng, an ninh và môi trường… những dữ liệu cần thiết để phát triển AI và các ứng dụng big data khác. Các công ty có thể truy cập vào kho big data do các tổ chức nhà nước quản lý dưới sự giám sát của công chúng. Công dân sẽ có tiếng nói – thông qua các quan chức họ bầu cử – trong việc nghiên cứu phát triển các ứng dụng big data cần đến kho dữ liệu này. Các công ty cả lớn lẫn nhỏ đều sẽ có quyền truy cập bình đẳng vào mỏ vàng này và góp phần giải quyết một trong những lời phàn nàn tôi thường nghe nhất từ các công ty khởi nghiệp dựa trên dữ liệu ở Mỹ (rằng các tay chơi lớn đã ngăn cản họ truy cập vào những dữ liệu quan trọng).