Dữ liệu là gì trong máy tính?
Để máy tính luôn vận hành ổn định, cung cấp đến người dùng những thông tin hữu ích, thì dữ liệu chính là một trong những yếu tố vô cùng quan trọng cần có.
Dữ liệu là gì trong máy tính?
Dữ liệu hay Data là chuỗi ký hiệu có trình tự, thể hiện cho một ý nghĩa nhất định hay giải nghĩa cho một hành động cụ thể nào đó.
Các dữ liệu trước khi được ứng dụng vào hệ thống máy tính, chúng cần trải qua quá trình xử lý để trở thành một thông tin thực thụ.
Quá trình xử lý này mất khá nhiều thời gian, đồng thời phụ thuộc vào các yếu tố như người thậm chí là vật tạo ra dữ liệu và thông tin cần được lấy từ nguồn data đó.
Dữ liệu thường được dùng để diễn tả số lượng, tính chất hay ký hiệu hoạt động được máy tính lưu trữ trên ổ cứng từ, đĩa quang và được truyền tải dưới dạng tín hiệu điện.
Để nghiên cứu các dữ liệu có trong máy tính, người ta thường sử dụng chủ yếu hai phương pháp chính, đó là phương pháp nghiên cứu định tính và phương pháp nghiên cứu định lượng.
Trong máy tính bao gồm các loại dữ liệu phổ biến như:
- Dữ liệu số.
- Dữ liệu hình ảnh.
- Dữ liệu âm thanh.
- Siêu dữ liệu hay còn gọi là Big Data.
- Chương trình cũng được xem như một dạng dữ liệu.
Phân loại dữ liệu
Dữ liệu được chia thành hai loại chính, đó là:
Dữ liệu có cấu trúc (Structured data)
Dữ liệu có cấu trúc hay còn gọi là dữ liệu định lượng, hoạt động đảm nhận vai trò lưu trữ và truyền đạt thông tin theo một cấu trúc xác định.
Chúng có các đặc điểm như:
- Hiển thị dưới dạng số hoặc chữ.
- Tạo ra các dữ liệu và số liệu khách quan.
- Dễ dàng trích xuất thông tin khi cần.
- Thường được lưu trữ trong Google Sheet, Excel hay SQL.
- Phục vụ chủ yếu trong việc thu thập, truy xuất, lưu trữ và sắp xếp thông tin.
Dữ liệu phi cấu trúc (Unstructured data)
Khác với dữ liệu có cấu trúc, loại dữ liệu phi cấu trúc này là một tập hợp các dữ liệu phức tạp, khó nhận biết và chưa được sắp xếp, tổ chức đúng trình tự sẵn có.
Đặc điểm nhận dạng của loại dữ liệu này là:
- Thuộc kiểu dữ liệu đính tính.
- Hiển thị dưới dạng văn bản.
- Mục đích hoạt động là thể hiện ý kiến, quan điểm hoặc đánh giá thương hiệu.
- Được lưu trữ chủ yếu trong Word, Elasticsearch hoặc Solr.
- Quá trình thu thập, truy xuất, lưu trữ và sắp xếp thông tin rất khó thực hiện đối với loại dữ liệu này.
- Loại dữ liệu này thường không thể dùng các công cụ phân tích dữ liệu để tìm kiếm.
Đơn vị đo lường của dữ liệu trong máy tính
Dữ liệu trong máy tính cũng thuộc loại thông tin, nên chúng cũng thường được đo lường bằng các đơn vị cơ bản sau:
- Bit: Đơn vị đo lường nhỏ nhất trong bộ nhớ máy tính, chỉ có khả năng lưu trữ 1 hoặc 0.
- Byte: 1 byte tương đương với 8 bit.
- Kilobyte.
- Megabyte.
- Gigabyte.
- Terabyte.
- Petabyte.
- Exabyte.
- Zettabyte.
- Yottabyte.