Cạnh tranh bằng dữ liệu không có gì mới. Các công ty khởi nghiệp và những người trong ngành từ lâu đã biết rằng việc khai thác sức mạnh của các tập dữ liệu độc quyền có thể là một lợi thế cạnh tranh bền vững. Tuy nhiên, khi nhiều nguồn dữ liệu trở thành hàng hóa và các công cụ để thao túng dữ liệu trên quy mô lớn ngày càng rẻ hơn và dễ tiếp cận hơn, điều này khiến các quy tắc cạnh tranh đang thay đổi. Các công ty sẽ cần trở nên sáng tạo hơn trong cách sử dụng dữ liệu. Dark data mang lại cơ hội thú vị cho những người tiếp cận sớm để đảm bảo lợi thế cạnh tranh so với các đối thủ chậm hơn.
Dark Data là gì?
Dark data là gì (Ảnh: CIO) |
Dark Data là thông tin kỹ thuật số không được sử dụng. Theo Gartner Inc, Dark Data được mô tả là “tài sản thông tin mà một tổ chức thu thập, xử lý và lưu trữ trong quá trình hoạt động kinh doanh thông thường, nhưng không được sử dụng cho các mục đích khác.”
Trong nhiều trường hợp, một tổ chức có thể để dữ liệu trở thành Dark Data vì một số lý do thực tế. Dữ liệu có thể đã bị biến đổi và đến một thời điểm nó có thể bị xóa, thông tin có thể đã quá cũ và không còn có ích. Trong những trường hợp như vậy, các bản ghi có thể chứa dữ liệu không đầy đủ hoặc lỗi thời, các phân tích cú pháp không chính xác, được lưu trữ ở định dạng tệp hoặc trên các thiết bị đã lỗi thời.
Càng ngày, thuật ngữ Dark Data càng được liên kết nhiều hơn với Big Data và dữ liệu vận hành. Ví dụ có thể kể đến như: các tệp nhật ký server có thể dùng để khai thác hành vi của khách truy cập website, hồ sơ chi tiết cuộc gọi của khách hàng bao gồm dữ liệu nhạy cảm không có cấu trúc của người tiêu dùng cũng như các dữ liệu định vị địa lý di động có thể dùng để phân tích các mẫu lưu lượng truy cập trong khi lập kế hoạch kinh doanh.
Trong nhiều trường hợp, Dark Data có thể được sử dụng để thúc đẩy các nguồn doanh thu mới, loại bỏ lãng phí và giảm chi phí. Do đó, nhiều tổ chức lưu trữ Dark Data nhằm tuân thủ các quy định khi sử dụng Hadoop, qua đó xác định các bit hữu ích và ánh xạ chúng tới các mục tiêu kinh doanh tiềm năng.
Một cơn sóng thần dữ liệu
Một lượng dữ liệu lớn bị bỏ qua (Ảnh: EPRI) |
Nghiên cứu do Seagate và IDC thực hiện cho thấy dữ liệu doanh nghiệp sẽ tăng trưởng với tốc độ 42% hàng năm trong vòng 2 năm tới. Tuy nhiên, chỉ có 32% dữ liệu này được sử dụng hiệu quả, với hơn hai phần ba dữ liệu bị bỏ phí trong các doanh nghiệp. Gartner định nghĩa Dark Data là tài sản thông tin được thu thập như một sản phẩm phụ của các hoạt động kinh doanh thông thường nhưng các công ty không sử dụng cho các hoạt động khác, Dark Data hoàn toàn có khả năng tạo ra thu nhập. Phần lớn dữ liệu này được lưu trữ cho các mục đích tuân thủ với chi phí lưu trữ đắt đỏ và không hiệu quả.
Một phần lớn thách thức dữ liệu mới nổi này sẽ đến từ sự gia tăng của các sáng kiến IoT của doanh nghiệp. IDC dự đoán đến năm 2025 sẽ có 55,7 tỷ thiết bị được kết nối trên toàn thế giới. 70% trong số này sẽ được kết nối với nền tảng IoT, tạo ra 73,1 ZB dữ liệu hàng năm. Thường được thu thập cho các ứng dụng cụ thể trong công ty, dữ liệu IoT cũng có thể được tận dụng cho các mục đích khác.
Nâng cao hiệu quả với Dark Data
Không thiếu dữ liệu để làm việc, thách thức đối với các doanh nghiệp am hiểu dữ liệu là tìm cách sử dụng nó một cách hiệu quả. Ban đầu, điều này có thể là bằng cách cải thiện các sản phẩm và dịch vụ hiện có cũng như hợp lý hóa các quy trình kinh doanh. Ví dụ: thông qua phân tích dữ liệu nhân viên liên quan đến nhân khẩu học, tiền lương và lựa chọn phương tiện đi lại, nhà cung cấp suất ăn hàng không, Gate Gourmet nhận ra rằng khoảng cách từ nhà của nhân viên đến sân bay và phương tiện di chuyển của họ là những yếu tố chính trong việc luân chuyển nhân viên. Tập trung chặt chẽ hơn vào những yếu tố này trong quá trình tuyển dụng đã cải thiện tỷ lệ nghỉ việc của nhân viên lên tới 27%.
Trong một ví dụ khác về việc tận dụng dark data, một chuỗi 27 khách sạn lớn ở châu Âu bao gồm 13.000 phòng đã phân tích dữ liệu sử dụng từ mạng Wi-Fi của khách để cải thiện dịch vụ khách hàng. Dữ liệu đã được thu thập trong vài năm nhưng không được xem xét về giá trị kinh doanh tiềm năng. Bằng cách theo dõi dữ liệu theo thời gian cho các biến như tổng số thiết bị được kết nối trong mỗi khách sạn, tổng số thiết bị trên mỗi khu vực như nhà hàng hoặc hồ bơi và thời gian trung bình dành cho mỗi khu vực, những cải tiến đáng kể đã được thực hiện. Một vấn đề với việc chờ đợi quá nhiều tại các khu vực nhận phòng và trả phòng đã được phát hiện và khắc phục cũng như phân bổ nhân viên tốt hơn cho các bộ phận của khách sạn vào những thời điểm quan trọng.
Tận dụng Dark Data với trao đổi dữ liệu
Tận dụng tối đa dark data (Ảnh: BOA) |
Mặc dù việc mở các kho chứa Dark Data trong một tổ chức có thể tạo ra các tài sản có giá trị, nhưng việc đưa dữ liệu bên ngoài vào để tối đa hóa lợi nhuận là một việc làm cần thiết. Ngoài ra, trong khi tổ chức liên quan có thể thấy không sử dụng được Dark Data mà tổ chức đó nắm giữ, thì những tổ chức khác lại có thể. Để nhận ra những lợi ích này, trao đổi dữ liệu có một vai trò quan trọng. Accenture tin rằng việc trao đổi dữ liệu trong không gian IoT sẽ mang lại giá trị 3,6 nghìn tỉ USD vào năm 2030.
Điều này có thể bao gồm dữ liệu từ các cảm biến trong các giàn khoan dầu ngoài khơi mà các cơ quan khí tượng có thể mua để cải thiện các mô hình dự báo thời tiết. Dữ liệu từ các thiết bị điều hòa không khí trong các tòa nhà lớn có thể được bán cho các nhà phát triển bất động sản đang cố gắng đảm bảo lợi thế cạnh tranh cho các dự án phát triển mới của họ. Các video giám sát độ nét cao ở các trung tâm thị trấn đông đúc có thể được phân tích ở tốc độ và quy mô thông qua AI để giúp các nhà thiết kế phát hiện các xu hướng thời trang mới nổi trước khi chúng trở thành xu hướng chủ đạo.
Trao đổi dữ liệu có thể cung cấp tính thanh khoản cho các doanh nghiệp và công ty khởi nghiệp để kết hợp các luồng dữ liệu khác nhau và được định giá thấp trước đây để tạo ra các sản phẩm và dịch vụ mới sáng tạo. Người chiến thắng sẽ là những công ty có tư duy cởi mở và sẵn sàng thử nghiệm. Trước khi Google tung ra dịch vụ AdWords của mình vào năm 2000, việc cạn kiệt dữ liệu từ các tìm kiếm trên web có rất ít giá trị. Bằng cách đặt các quảng cáo có liên quan theo ngữ cảnh xung quanh kết quả tìm kiếm, một doanh nghiệp trị giá 135 tỉ USD đã ra đời và lĩnh vực quảng cáo đã thay đổi mãi mãi.
Các bước đầu tiên trong việc khai thác Dark Data
Mặc dù nói dễ hơn làm, nhưng việc tạo ra văn hóa dữ liệu trong doanh nghiệp là bước quan trọng nhất để thu lợi nhuận từ Dark Data. Theo Harvard Business Review, điều này phải bắt đầu từ đầu với việc các nhà quản lý thiết lập nguyên tắc rằng các quyết định phải được dựa trên các dữ liệu. Các công ty có nhóm khoa học dữ liệu cần đảm bảo rằng họ không bị tách biệt khỏi các hoạt động cốt lõi của doanh nghiệp, mà cần được tích hợp giữa các bộ phận. Điều này sẽ giúp các nhóm hiểu về một số nguyên tắc cơ bản của quản lý dữ liệu nhưng cũng sẽ cung cấp cho các nhà khoa học dữ liệu một cái nhìn tốt hơn về nơi có thể ẩn các silo dữ liệu.
Cuối cùng, các công ty cần phải suy nghĩ xa hơn các quy trình kinh doanh và văn phòng truyền thống của họ nếu họ muốn khai thác các tài sản dữ liệu chưa được sử dụng. Những doanh nghiệp áp dụng tư duy cởi mở và sáng tạo để tìm kiếm cách ứng dụng Dark Data cho doanh nghiệp có khả năng tìm thấy lợi nhuận từ nó.
Theo CIO