Tầm quan trọng của Internet và dữ liệu kỹ thuật số đối với các nền kinh tế và xã hội ngày càng rõ nét. Nhiều ước tính khác nhau đều cho thấy rằng lưu lượng truy cập Internet và dữ liệu toàn cầu đã bùng nổ trong những thập kỷ gần đây và sự tăng trưởng mạnh này dự kiến sẽ tiếp tục với sự tiến bộ nhanh chóng của công nghệ kỹ thuật số.
Về lưu lượng IP toàn cầu, dữ liệu cập nhật nhất dự kiến sẽ tăng hơn gấp ba lần từ năm 2017 đến năm 2022. Hầu hết lưu lượng truy cập Internet diễn ra ở Châu Á và Khu vực Thái Bình Dương và Bắc Mỹ, với rất ít thị phần của Mỹ Latinh, Trung Đông, Bắc Phi. Số lượng thiết bị được kết nối với mạng IP sẽ gấp hơn ba lần dân số toàn cầu vào năm 2023 (theo Cisco, 2020).
Đại dịch COVID-19 đã có tác động mạnh đến lưu lượng truy cập Internet, vì hầu hết các hoạt động đều diễn ra trực tuyến. Việc sử dụng băng thông Internet toàn cầu đã tăng 35% vào năm 2020, mức tăng đáng kể so với 26% của năm trước (mức tăng lớn nhất trong một năm kể từ năm 2013). Mặc dù từ tháng 3 năm 2020, những mô hình lưu lượng như vậy đã thay đổi và khối lượng tăng mạnh, Internet đã chứng tỏ khả năng chống chọi với những thay đổi đột ngột liên quan đến đại dịch.
Theo Ericsson (2020), lưu lượng dữ liệu mạng di động tăng 50% giữa quý 3 năm 2019 và quý 3 năm 2020. Lưu lượng dữ liệu toàn cầu lần lượt đạt 180 và 230 exabyte (1018 byte: 1 tỷ tỷ) mỗi tháng vào năm 2019 và 2020. Đến năm 2026, khối lượng này được dự báo sẽ tăng hơn gấp ba lần, đạt 780 exabyte mỗi tháng. Lưu lượng dữ liệu cố định chiếm gần 3/4 tổng lưu lượng dữ liệu vào năm 2019. Tuy nhiên, với số lượng thiết bị di động và IoT ngày càng tăng, lưu lượng dữ liệu bằng băng rộng di động dự kiến sẽ tăng nhanh hơn và đạt gần 1/3 tổng lượng dữ liệu vào năm 2026.
Năm 2020, 64,2 zettabyte (nghìn tỷ tỷ: 1021) dữ liệu đã được tạo hoặc sao chép, bất chấp áp lực giảm hệ thống do đại dịch gây ra đối với nhiều ngành công nghiệp và tác động của nó sẽ được thấy trong vài năm. Người ta ước tính rằng lượng dữ liệu kỹ thuật số được tạo ra trong 5 năm tới sẽ nhiều hơn gấp đôi lượng được tạo ra kể từ khi lưu trữ kỹ thuật số ra đời. Việc tạo và nhân rộng dữ liệu toàn cầu sẽ có mức tăng trưởng kép hàng năm là 23% trong dự báo 2020 -2025 (IDC, 2021a).
Đo giá trị của dữ liệu vẫn là một thách thức lớn. Khái niệm "chuỗi giá trị dữ liệu" là chìa khóa để ước tính giá trị của dữ liệu. Giá trị xuất hiện trong quá trình chuyển đổi dữ liệu thô; từ thu thập dữ liệu; thông qua xử lý và phân tích; thành trí thông minh kỹ thuật số; có thể được tiền tệ hóa cho các mục đích thương mại hoặc sử dụng cho nhiều mục tiêu xã hội. Trong quá trình này, dữ liệu riêng lẻ không có giá trị trừ khi chúng được tổng hợp và xử lý. Và không thể có trí thông minh kỹ thuật số nếu không có dữ liệu thô. Để tạo ra và nắm bắt giá trị, cần có cả dữ liệu thô và năng lực để xử lý chúng thành trí tuệ kỹ thuật số.
Nếu không biết dữ liệu sẽ được sử dụng như thế nào, thì giá trị của dữ liệu thô không thể được ước tính. Nhưng dữ liệu thô có thể được hiểu là có giá trị tiềm năng. Hơn nữa, trái với hàng hóa, dữ liệu có thể được sử dụng nhiều lần mà không bị cạn kiệt. Ngoài ra, không có thị trường dữ liệu thô được phát triển và chính thức hóa một cách thích hợp; dữ liệu không thể được xem xét về quyền sở hữu, mà chủ yếu điều kiện và quyền truy cập. Không có thị trường nào có cung và cầu về dữ liệu thô, về cơ bản chúng hiện đang được trích xuất từ người dùng. Thông thường, khi đề cập đến thị trường dữ liệu, nó liên quan đến thị trường cho trí tuệ kỹ thuật số (hoặc các sản phẩm dữ liệu).
Hầu hết các ước tính về giá trị của dữ liệu thực sự đề cập đến giá trị của thị trường đối với một số sản phẩm dữ liệu. Những ước tính này cung cấp dấu hiệu về giá trị của dữ liệu thô được sử dụng trong quá trình sản xuất sản phẩm dữ liệu; nếu giá trị của sản phẩm dữ liệu tăng lên thì giá trị của dữ liệu thô cũng phải tăng theo. Nhưng chúng cung cấp ít thông tin về cách phân biệt giá trị của dữ liệu thô với giá trị gia tăng trong quá trình xử lý và tiền tệ hóa từ dữ liệu. Trong điều kiện phát triển, điều quan trọng là giá trị gia tăng nội địa trong quá trình sản xuất ở các nước đang phát triển.
Công cụ giám sát thị trường dữ liệu châu Âu định nghĩa thị trường dữ liệu là “thị trường nơi dữ liệu kỹ thuật số được trao đổi dưới dạng ‘sản phẩm’hoặc‘dịch vụ’do kết quả của việc xây dựng dữ liệu thô” (Ủy ban châu Âu, 2020a). Công cụ này bao gồm so sánh quốc tế về giá trị của thị trường dữ liệu Liên minh Châu Âu (bao gồm Vương quốc Anh) với Hoa Kỳ, Nhật Bản và Brazil. Giá trị của thị trường dữ liệu đã tăng đáng kể trong 5 năm qua, ở tất cả các nền kinh tế được phân tích; ở Brazil, giá trị của thị trường dữ liệu vẫn tương đối thấp trong thời kỳ này. Vị trí thống trị của Hoa Kỳ được thể hiện rõ ràng từ phân tích này.
Việc đo lường các luồng dữ liệu xuyên biên giới thậm chí còn khó hơn. Hiện tại không có cách thực tế nào để đo chúng. Chúng được đánh giá chủ yếu thông qua proxy, nhưng ít thành công, vì chúng không cung cấp những chỉ dẫn và bằng chứng hữu ích cho những mục đích hoạch định chính sách và phát triển.
Về khối lượng, thước đo chính được sử dụng là băng thông quốc tế. Theo Liên minh Viễn thông Quốc tế (ITU), “băng thông Internet quốc tế là tổng dung lượng được sử dụng của băng thông Internet quốc tế, tính bằng megabit/giây (Mbit/s). Băng thông Internet quốc tế đã sử dụng là lưu lượng truy cập trung bình của cáp quang quốc tế và các liên kết vô tuyến để thực hiện lưu lượng Internet. Mức trung bình được tính trong khoảng thời gian 12 tháng tham chiếu và có tính đến lưu lượng truy cập của tất cả liên kết Internet quốc tế… Lưu lượng truy cập trung bình kết hợp của những liên kết Internet quốc tế khác nhau có thể được báo cáo là tổng lưu lượng truy cập trung bình của các liên kết riêng lẻ”.
Dữ liệu về băng thông quốc tế được cung cấp bởi ITU và TeleGeography. ITU cung cấp số liệu thống kê về dung lượng băng thông quốc tế và việc sử dụng theo quốc gia. Tổng mức sử dụng băng thông quốc tế trên thế giới đã tăng tốc vào năm 2020. Phần lớn băng thông quốc tế tập trung ở các khu vực Châu Á-Thái Bình Dương; Châu Âu và Châu Mỹ, trong khi tỷ trọng của Châu Phi vẫn rất nhỏ.
Phần lớn băng thông liên vùng là giữa Bắc Mỹ và Châu Âu, giữa Bắc Mỹ và Châu Á. Trong số các nước đang phát triển, kết nối Bắc-Nam giữa Bắc Mỹ và Mỹ Latinh có băng thông liên vùng cao nhất. Tuy nhiên, thông tin này chỉ đề cập đến lượng dữ liệu lưu chuyển theo byte mà không cho biết chúng chảy theo hướng nào. Nó không phân biệt luồng dữ liệu vào và luồng ra từ bất kỳ vùng/quốc gia cụ thể nào. Hơn nữa, những byte này đề cập đến cả dữ liệu thô và sản phẩm dữ liệu.
Một cuộc khảo sát của Nikkei sử dụng số liệu thống kê của ITU và TeleGeography cho thấy, vào năm 2019, luồng dữ liệu xuyên biên giới của Trung Quốc, bao gồm Hồng Kông; Trung Quốc đã bỏ xa bất kỳ quốc gia/vùng lãnh thổ và khu vực nào khác được kiểm tra, kể cả Hoa Kỳ. Trung Quốc chiếm 23% luồng dữ liệu xuyên biên giới toàn cầu, trong khi Hoa Kỳ đứng thứ hai với 12%. Điểm bắt đầu chỉ dẫn của Trung Quốc nằm ở mối quan hệ của nước này với phần còn lại của châu Á. Trong khi Hoa Kỳ chiếm 45% luồng dữ liệu ra và vào Trung Quốc vào năm 2001, con số đó đã giảm xuống chỉ còn 25% vào năm 2019. Các nước châu Á hiện chiếm hơn một nửa tổng số, đặc biệt Việt Nam là 17%, Singapo là 15%.