Ảnh: Times of India

Cuộc chiến dữ liệu cá nhân - “dầu mỏ” thế kỉ 21 đã khai hỏa

VietTimes – Khi dữ liệu trở thành dầu mỏ của kỷ nguyên mới, khi quyền sở hữu dữ liệu chưa rõ ràng, cuộc chiến bí mật trong giới công nghệ đã bắt đầu.

Tại "Thung lũng Silicon Mới" của San Francisco - South of Market Street (SoMa), bên cạnh đường cao tốc dẫn đến cây cầu nổi tiếng Bay Bridge, một bảng quảng cáo xuất hiện với nội dung: "Google đang theo dõi bạn. Chúng tôi thì không".

Đây là lời thách thức đến từ DuckDuckGo, một công ty công cụ tìm kiếm tập trung vào bảo vệ quyền riêng tư.

Cuộc chiến dữ liệu cá nhân - “dầu mỏ” thế kỉ 21 đã khai hỏa ảnh 1

Bảng quảng cáo của DuckDuckGo tại San Francisco. Ảnh: WIRED

Năm ngoái, lượt tải xuống ứng dụng của DuckDuckGo đã vượt quá 50 triệu lượt, nhiều hơn tổng số lượt tải xuống của tất cả các năm trước và doanh thu hàng năm vượt quá 100 triệu USD. Công ty này được thành lập vào năm 2008 với mức định giá 74,8 triệu USD sau vòng tài trợ cuối cùng. Có vẻ như các giá trị riêng tư chính của công ty đã phát huy tác dụng.

Với thị phần 2,42%, DuckDuckGo đã vượt qua Bing và Yahoo trở thành công cụ tìm kiếm di động thứ hai tại Mỹ. Trong khi đó, Google chiếm 94,36%, gấp 39 lần DuckDuckGo.

Cuộc chiến dữ liệu cá nhân - “dầu mỏ” thế kỉ 21 đã khai hỏa ảnh 2

Đây là câu chuyện về David thách thức Goliath, nhưng trong câu chuyện này, "David" đã vẫy biểu ngữ "Quyền riêng tư" thay vì hòn đá. (David & Goliath là một câu chuyện vào khoảng 3.000 năm trước tại Palestine kể về cậu bé chăn cừu David nhỏ bé chỉ với một cục đá và một chiếc nỏ cao su đã đánh bại gã khổng lồ Goliath).

Có thể thấy rằng, với sự thống trị của các tập đoàn khổng lồ và thiếu chỗ cho sự phát triển của các công ty khởi nghiệp tân binh, cuộc cạnh tranh dữ liệu thế hệ mới nhân danh quyền riêng tư đã bắt đầu.

Cuộc chiến dữ liệu của Apple

Vào tháng 6/2020, giám đốc kỹ thuật quyền riêng tư của Apple Katie Skinner đã giới thiệu một " bản cập nhật nhỏ " của iOS14 trong 20 giây tại WWDC (Hội nghị các nhà phát triển thế giới): các ứng dụng cần có sự đồng ý của người dùng trước khi thu thập dữ liệu. Nếu người dùng không đồng ý, nó sẽ tắt mã IDFA (mã định danh cho nhà quảng cáo, công nghệ có khả năng theo dõi người dùng).

Đây là một phần trong Tính minh bạch theo dõi ứng dụng (App Tracking Transparency hay viết tắt là ATT) của Apple.

Vào tháng 5/2021, một cuộc khảo sát với 300 người dùng iPhone tại Mỹ chỉ ra rằng 73% người được hỏi đồng ý với chính sách bảo mật này. Sau khi ra mắt ATT, Apple đã nhận được những phản hồi khá tích cực.

Cuộc chiến dữ liệu cá nhân - “dầu mỏ” thế kỉ 21 đã khai hỏa ảnh 3
Ảnh: Apple

Nhưng đối với tất cả các công ty sử dụng quảng cáo trực tuyến làm mô hình kinh doanh, đây có thể là một cú sốc nguy hiểm đến sự tồn vong. Phản ứng dữ dội nhất là Facebook. Vào tháng 12/2020, Facebook đã mua toàn bộ một trang của New York Times và công khai phản đối Apple.

Ở tầm cỡ của Facebook, cách tiếp cận của Apple đã hạn chế nghiêm trọng sự tồn tại của các doanh nghiệp vừa và nhỏ. Doanh nghiệp lớn có đủ tiềm lực tài chính để thực hiện quảng cáo quy mô lớn, nhưng nếu doanh nghiệp vừa và nhỏ không có công nghệ quảng cáo nhắm mục tiêu thì khó tìm được nhóm người dùng tiềm năng, hiệu quả quảng cáo giảm đi rất nhiều. Theo Facebook, điều này sẽ làm giảm trung bình 60% thu nhập của các doanh nghiệp vừa và nhỏ.

Cuộc chiến dữ liệu cá nhân - “dầu mỏ” thế kỉ 21 đã khai hỏa ảnh 4
Facebook tin rằng cách tiếp cận của Apple sẽ giết chết các doanh nghiệp vừa và nhỏ.

Mặc dù những nhận xét của Facebook có vẻ đứng trên lập trường suy nghĩ cho các công ty khác, nhưng khác với ấn tượng của công chúng, Facebook, bề ngoài là một công ty công nghệ, thực chất là một công ty quảng cáo. Báo cáo tài chính quý 4/2020 cho thấy trong tổng doanh thu 28,07 tỉ USD của Facebook tương đương 96,8% đến từ quảng cáo. Facebook đã thử nghiệm quy mô nhỏ trên iOS 14 và kết quả là doanh thu quảng cáo đã giảm 50%.

CEO Facebook, Mark Zuckerberg thẳng thắn chỉ trích: "Apple nói rằng họ đang giúp đỡ người dùng, nhưng thực tế vấn đề này rõ ràng là do lợi ích thúc đẩy".

Sự mâu thuẫn cốt yếu giữa Facebook và Apple nằm ở mô hình kinh doanh khác nhau của hai công ty. Quảng cáo là hoạt động kinh doanh cốt lõi của Facebook và các nhà quảng cáo là khách hàng chính của Facebook. Nhưng Apple là một công ty điện tử tiêu dùng nhắm đến người dùng, và doanh số bán phần cứng bao gồm iPhone, iPad, Mac và các thiết bị đeo khác là thu nhập chính của họ. .

Việc Zuckerberg "tấn công" không phải không có lý do và Apple cũng không phải là "thiên thần" bảo vệ quyền riêng tư. Trong khi phá vỡ hoạt động kinh doanh quảng cáo của các đối thủ cạnh tranh, Apple cũng đang mở rộng phạm vi quảng cáo của mình.

Apple có hai loại hình kinh doanh quảng cáo chính: quảng cáo tìm kiếm trong App Store và quảng cáo hiển thị trong các ứng dụng. Hiện tại, mảng kinh doanh quảng cáo tìm kiếm của Apple (Apple Search Ads) đã được ra mắt tại Trung Quốc. Dịch vụ này ra mắt vào năm 2016 cho phép các nhà phát triển đặt quảng cáo thông qua đấu thầu.

Cuộc chiến dữ liệu cá nhân - “dầu mỏ” thế kỉ 21 đã khai hỏa ảnh 5

Ảnh: Apple

Trên thực tế, Apple đã và đang cố gắng tham gia vào lĩnh vực kinh doanh quảng cáo. Ngay từ năm 2010, Apple đã tung ra iAd, một nền tảng quảng cáo di động. Theo quan điểm của Steve Jobs, quảng cáo trên điện thoại di động vào thời điểm đó "quá tệ". Ông không muốn biến iAd trở thành một nền tảng quảng cáo thô tục, nhưng hy vọng nó có thể trình bày những quảng cáo tinh tế và không khiến người dùng phản cảm.

Vì lý do này, iAd đã đặt ra ngưỡng giá cao 500.000 USD, nhưng mức giá này đã trực tiếp loại bỏ các nhà công ty vừa và nhỏ. Cuối cùng, iAd bị đóng cửa vào tháng 6/2016.

Mặc dù mảng kinh doanh quảng cáo hiện chỉ chiếm một phần rất nhỏ trong doanh thu của Apple, nhưng đối với Apple, công ty vừa là "trọng tài" vừa là "thủ môn", hãng đã hoàn tất trách nhiệm "hòa giải" với bộ quy tắc mới về quyền riêng tư.

Theo Toni Sacconaghi, một nhà phân tích tại công ty quản lý đầu tư Alliance Bernstein, doanh thu quảng cáo của Apple trong năm tài chính 2021 sẽ tăng từ 300 triệu USD trong năm tài chính 2017 lên khoảng 3 tỉ USD. Đến năm tài chính 2023 hoặc 2024, doanh thu quảng cáo hàng năm của Apple có thể tăng lên từ 7 tỉ đến 10 tỉ USD, điều này sẽ thúc đẩy tăng trưởng mảng kinh doanh dịch vụ của Apple lên đến 3%.

Mười năm đã trôi qua kể từ khi iPhone4 ra mắt vào năm 2011. Lợi thế phần cứng dẫn đầu ngành của Apple dần bị các nhà sản xuất điện thoại Android lớn cân bằng, thậm chí là vượt mặt. Khi người dùng cần một lý do "tại sao phải là Apple thay vì Android", bảo vệ quyền riêng tư là một phần rất quan trọng.

Khi Steve Jobs chọn một hệ sinh thái đóng, ông đã gieo mầm quyền riêng tư cho iOS. Chính sách bảo mật của Apple không phải tự dưng mà có, mà đang dần được thắt chặt. Sự hỗn loạn của IDFA đã đặt ra một câu hỏi mà chúng ta phải trả lời trong thời đại ngày nay: Công nghệ có đang xâm phạm quyền riêng tư của người dùng không?

Dữ liệu cá nhân, dầu mỏ của thế kỷ 21?

Cuộc chiến dữ liệu cá nhân - “dầu mỏ” thế kỉ 21 đã khai hỏa ảnh 6

Năm 2006, nhà toán học người Anh Clive Humby lần đầu tiên so sánh "dữ liệu" với "dầu mỏ mới". Kể từ đó, câu nói này thường xuyên xuất hiện trong phân tích của các nhà kinh tế, học giả và CEO.

Sự quý giá của dầu mỏ là nguồn năng lượng không thể tái tạo nhưng dữ liệu có thể được tạo ra và tái sử dụng vô thời hạn. Internet ngày nay đang tạo ra một lượng lớn dữ liệu mỗi ngày.

Logic đằng sau phép ẩn dụ này là trong suốt thế kỷ 20, Standard Oil, Royal Dutch Shell và British Petroleum, những công ty kiểm soát dầu mỏ, cũng đồng thời kiểm soát mạch máu của nền kinh tế. Ngày nay, đó là những gã khổng lồ công nghệ như Google và Facebook.

Vào đầu thế kỷ này, những gã khổng lồ công nghệ với lượng dữ liệu khổng lồ đã phát triển một loại hình quảng cáo nhắm mục tiêu trực tuyến kinh doanh mới. Đến năm 2019, thị trường quảng cáo trực tuyến toàn cầu đã vượt quá 300 tỉ USD.

Trong ngành quảng cáo luôn có một câu nói: "Tôi biết rằng một nửa đầu tư vào quảng cáo là vô ích, nhưng vấn đề là tôi không biết nửa nào". Đó là John Wanamaker, cha đẻ của chuỗi cửa hàng bách hóa trong thời kỳ hoàng kim của quảng cáo truyền thống cách đây hơn 100 năm.

Tình hình đã thay đổi trong thời đại Internet, những tiến bộ trong công nghệ đã làm cho quảng cáo trở thành một biện pháp rất hiệu quả. Ở một mức độ nhất định, huyền thoại của Wanamaker không còn đúng nữa.

Các công ty công nghệ lớn có thể dễ dàng theo dõi hành vi của người dùng, ghi lại số lượt tải xuống hoặc chuyển đổi mua hàng do quảng cáo thu được và nhà quảng cáo có thể sử dụng điều này để xác định chiến lược quảng cáo phù hợp.

Có thể bạn đã và đang trải nghiệm điều này. Sau khi tìm kiếm cà phê trên mạng, bạn sẽ tìm thấy các sản phẩm liên quan đến cà phê được đề xuất trên nền tảng thương mại điện tử. Ứng dụng dành cho thiết bị di động dường như luôn theo dõi cuộc sống trực tuyến của bạn. Nhiều người thậm chí còn nghi ngờ ứng dụng này đang nghe lén người dùng, về mặt lý thuyết thì điều này có thể xảy ra nhưng thực tế lại không đúng.

Theo dõi thời gian thực các cuộc trò chuyện có chi phí băng thông cao và lưu lượng truy cập lớn rất dễ bị người dùng chú ý, điều này cũng sẽ mang lại áp lực lưu trữ và nhân sự cao cho công ty, một công việc kinh doanh không kinh tế.

Điều quan trọng nhất là bản thân việc nghe lén người dùng là bất hợp pháp, và các công ty càng lớn thì càng phải thận trọng hơn trong việc tuân thủ dữ liệu.

Các công ty công nghệ thường thu thập ba loại dữ liệu bao gồm dữ liệu hành vi: chẳng hạn như lịch sử duyệt web, thời gian sử dụng, dịch vụ trực tuyến; hồ sơ tiêu dùng: chẳng hạn như sản phẩm bạn đã mua, hồ sơ trả lại và trao đổi; thông tin cá nhân: chẳng hạn như tuổi, học vấn, giới tính, vị trí,...

Thông qua thuật toán, các thẻ thông tin trên tạo thành chân dung người dùng. Trong các công ty lớn, những dữ liệu này được lưu hành nội bộ. Đây là lý do tại sao các sản phẩm bạn tìm kiếm trên Google sẽ xuất hiện trong quảng cáo chèn sẵn của YouTube. Ngay từ năm 2006, Google đã mua lại Youtube với giá 1,65 tỉ USD.

Ngoài ra, các công ty lớn này cũng sẽ cung cấp các dịch vụ phân tích người dùng tương tự cho các ứng dụng và trang web vừa và nhỏ, đồng thời liên hệ với các nhà quảng cáo thông qua nền tảng đặt quảng cáo để tạo thành một liên minh quảng cáo.

Cách làm này do Amazon phát minh đầu tiên, ngày nay hầu như các công ty công nghệ lớn đều tạo ra những liên minh quảng cáo tương tự như Facebook Audience Network, Google Adsence và Tencent Social Ads.

Nhưng thông tin này được thu thập như thế nào và lưu thông trong và ngoài công ty như thế nào vẫn là một hộp đen không thể phá vỡ đối với người dùng bình thường. Hiện tại vẫn chưa có hãng công nghệ nào tiết lộ rõ ​​ràng quy trình này cho người dùng.

Khi các hãng công nghệ thường xuyên nổ ra các vụ bê bối rò rỉ dữ liệu, thì sự "mờ mịt" này trở thành nguồn cơn khiến người dùng lo sợ. Năm 2018, công ty tư vấn chính trị Cambridge Analytica của Anh bị phanh phui việc sử dụng 50 triệu dữ liệu người dùng để giúp chiến dịch tranh cử của cựu Tổng thống Mỹ Donald Trump mà không được sự đồng ý của người dùng Facebook.

Sau đó, cư dân mạng đã phát động chiến dịch #DeleteFacebook trên Twitter và đạo diễn Russell Brothers của Hollywood thậm chí còn quay một bộ phim với chủ đề này.

"Tại sao dữ liệu của tôi lại trở thành công cụ kiếm lợi nhuận của bạn?" Đây có thể là tiếng nói của hầu hết người dùng Facebook. Đặc biệt là khi các giao dịch dữ liệu đã trở thành một hoạt động kinh doanh trên thực tế, quyền sở hữu dữ liệu trở thành một vấn đề không thể tránh khỏi.

Vấn đề không thể kết luận về quyền dữ liệu

Cuộc chiến dữ liệu cá nhân - “dầu mỏ” thế kỉ 21 đã khai hỏa ảnh 7

Ảnh: The Statesman

Trao đổi ngang giá là một tiêu chuẩn giao dịch đã phổ biến hàng ngàn năm. Người mua và người bán, một bên giao hàng một bên giao tiền để hoàn thành việc trao đổi giá trị.

Đối với quảng cáo nhắm mục tiêu, hai bên tham gia giao dịch là giữa công ty và nhà quảng cáo và người dùng không thu được lợi nhuận. Do đó, việc người dùng không thích bị thu thu thập thông tin là điều dễ hiểu: tưởng chừng như mình đã đánh mất thứ gì đó nhưng lại không nhận được lợi nhuận tương xứng, trong khi những công ty công nghệ dễ dàng kiếm được hàng trăm triệu tiền lợi nhuận.

Về quyền sở hữu dữ liệu, các bình luận chính thống nhìn chung có hai quan điểm.

Một bên cho rằng quyền sở hữu dữ liệu nên thuộc về nền tảng, vì người dùng được hưởng các dịch vụ miễn phí do các công ty công nghệ cung cấp.

Công ty nghiên cứu thị trường Edelman Berland đã thực hiện một cuộc khảo sát với 15.000 người dùng ở 15 quốc gia trên thế giới: "Bạn có sẵn sàng hy sinh một chút quyền riêng tư để có được sự thuận tiện và thoải mái hơn không?" 51% cho biết họ không muốn, 27% đồng ý, phần còn lại phân vân.

Điều này cho thấy một nghịch lý về quyền riêng tư: công chúng ngày càng nhận thức được rủi ro của việc chia sẻ dữ liệu trực tuyến, nhưng vì thuận tiện, mọi người vẫn tiết lộ dữ liệu của họ.

Vì người dùng có xu hướng ít tiếng nói nhất nên cũng việc giám sát hiệu quả sử dụng dữ liệu không đơn giản. Khi sản phẩm của các công ty công nghệ đã trở thành cơ sở hạ tầng, người dùng không còn lựa chọn nào khác. Ví dụ: ngay cả khi bạn không đồng ý với chính sách bảo mật của Facebook, thì việc không sử dụng Facebook là không thực tế, vì hầu như tất cả các mối quan hệ xã hội của bạn đều có trên Facebook.

Bên còn lại cho rằng dữ liệu tất nhiên phải thuộc về người dùng. Quy định chung về bảo vệ dữ liệu của Liên minh Châu Âu (GDPR) có hiệu lực vào ngày 25/5/2018, được gọi là "luật bảo vệ quyền riêng tư nghiêm ngặt nhất trong lịch sử". Lần đầu tiên con người làm rõ ở cấp độ pháp lý rằng quyền sở hữu dữ liệu người dùng thuộc về người dùng và nền tảng chỉ có thể quản lý và sử dụng hợp lý dữ liệu này.

Các vấn đề do công nghệ gây ra cuối cùng phải được giải quyết bằng công nghệ

Vào những năm 1930, dưới sự tiến bộ của công nghệ nhiếp ảnh, báo chí bắt đầu sử dụng ảnh trên báo một cách rộng rãi. Nhưng những bức ảnh này thường không có sự đồng ý của cá nhân.

Vào năm 1980, các luật sư Samuel D. Warren và Louis Brandeis đã xuất bản một bài báo "Quyền riêng tư" về vấn đề này trên Tạp chí Luật Harvard. Đây là lần đầu tiên giới luật đưa ra khái niệm về quyền riêng tư.

Cuộc chiến dữ liệu cá nhân - “dầu mỏ” thế kỉ 21 đã khai hỏa ảnh 8
Bài báo của Warren và Brandeis trên Tạp chí Luật Harvard: "Quyền riêng tư" . Ảnh: Brandeis

Sự mở rộng của công nghệ đã vi phạm ranh giới của các cá nhân. Ngay từ thuở sơ khai, công nghệ đã đi kèm với quyền riêng tư.

Trong tình hình hiện nay, việc lưu thông dữ liệu ngày càng trở nên nghiêm ngặt hơn. Nhiều công ty, bao gồm Google, Intel và WeBank, đang phát triển một công nghệ được gọi là học liên kết (Federated learning).

Do quy định về dữ liệu hoặc cạnh tranh thương mại, nhiều dữ liệu không thể được luân chuyển trong ngành hoặc thậm chí trong công ty, đây là bài toán "đảo dữ liệu" khiến các công ty đau đầu.

Học liên kết là một kỹ thuật máy học(machine learning), đào tạo một thuật toán trên nhiều thiết bị hoặc máy chủ phi tập trung (decentralized) đang giữ các mẫu dữ liệu cục bộ, mà không trao đổi các dữ liệu đó.

Yang Qiang, Giám đốc AI của WeBank, đã từng so sánh mô hình này với một "con cừu", và dữ liệu là "thức ăn cỏ".

Trước đây, cách làm của các mô hình đào tạo là vận chuyển cỏ từ nhiều đồng cỏ khác nhau để cho cừu ăn. Nhưng quá trình vận chuyển có nguy cơ làm rơi mất cỏ, đó là rò rỉ dữ liệu.

Cách mà học liên kết làm được là để "chú cừu" này đi dạo đến nhiều đồng cỏ khác nhau và tự gặm cỏ. Bằng cách này, cỏ sẽ ở lại một vùng đất mãi mãi và không có nguy cơ bị mất.

Cuộc chiến dữ liệu cá nhân - “dầu mỏ” thế kỉ 21 đã khai hỏa ảnh 9
Người chủ không biết cừu đã ăn cỏ ở mảnh nào nhưng cừu vẫn lớn lên. Ảnh: WeBank

Rõ ràng, chỉ thông qua sự tiến bộ của các mô hình công nghệ mới thể tránh được việc rò rỉ dữ liệu và sử dụng sai dữ liệu. Đối với sự cạnh tranh dữ liệu ngày càng khốc liệt, sự thay đổi cơ bản này có thể giúp cho việc chia sẻ dữ liệu giữa các công ty trở nên khả thi. Chỉ bằng cách thiết lập một hệ thống bảo vệ dữ liệu trong công nghệ, các nền tảng công nghệ mới có thể giành được sự tin tưởng của người dùng.

Rốt cuộc, không có công ty nào chỉ có thể dựa vào các giá trị cốt lõi để trở thành vị cứu tinh cho các vấn đề về dữ liệu cá nhân. Những vấn đề do công nghệ mang lại cuối cùng cần phải được giải quyết bằng công nghệ.

Theo Geek Park