Dữ liệu trong máy tính được lưu dưới dạng nào

Dữ liệu cũng là một khái niệm rất trừu tượng, là thông tin đã được đưa vào máy tính.

1. Khái niệm thông tin và dữ liệu

- Thông tin là một khái niệm rất trừu tượng. Thông tin được hiểu như là sự thông báo, trao đổi, giải thích về một đối tượng nào đó và thường được thể hiện dưới dạng các tín hiệu như chữ số, chữ viết, âm thanh, dòng điện... Chẳng hạn thông tin về kết quả học tập của học sinh được giáo viên chủ nhiệm ghi trong sổ liên lạc giúp cho các bậc phụ huynh biết về tình hình học tập của con em mình.

Nói một cách tổng quát, thông tin là sự hiểu biết của con người về một thực thể nào đó, có thể thu thập, lưu trữ, xử lí được. 

- Dữ liệu cũng là một khái niệm rất trừu tượng, là thông tin đã được đưa vào máy tính. Dữ liệu sau khi tập hợp lại và xử lí sẽ cho ta thông tin. Hay nói cách khác, dữ liệu là thông tin đã được mã hoá trong máy tính. Chẳng hạn, con số điểm thi là một dữ liệu hoặc con số về nhiệt độ trong ngày là một dữ liệu, hình ảnh về con người, phong cảnh cũng là những dữ liệu,...

2. Đơn vị đo thông tin

Đơn vị cơ bản đo thông tin là bit (Binary digit). Bit là dung lượng nhỏ nhất tại mỗi thời điểm có thể ghi được hoặc là kí hiệu 0 hoặc là kí hiệu 1. Hai kí hiệu này dùng để biểu diễn thông tin trong máy tính.

Ngoài đơn vị bit nói trên, đơn vị đo thông tin thường dùng là byte và 1 byte bằng 8 bit. Ta có các đơn vị đo thông tin như sau: 

1 byte

= 8 bit.

1 kilôbai (kB)

= 1024 byte

= 210 byte.

1 mêgabai (MB)

= 1024 kB

= 210kB.

1 gigabai (GB)

= 1024 MB

= 210MB.

1 têrabai (TB)

= 1024 GB

= 210GB.

1 pêtabai (PB)

= 1024 TB

= 210TB.

3. Các dạng thông tin

Chúng ta, có thể phân loại thông tin thành hai loại: số (số nguyên, số thực...) và phi số (văn bản, âm thanh, hình ảnh...)

4. Mã hoá thông tin trong máy tính

Muốn máy tính xử lí được, thông tin phải được biến đổi thành một dãy bit. Cách biến đổi như vậy được gọi là mã hoá thông tin.

Để mã hoá thông tin dạng văn bản người ta dùng bộ mã ASCII sử dụng tám bit để mã hoá kí tự. Trong bộ mã ASCII, các kí tự được đánh số từ 0 đến 255 và các kí hiệu này được gọi là mã ASCII thập phân của kí tự.

Người ta đã xây dựng bộ mã Unicode sử dụng 16 bit để mã hoá vì bộ mã ASCII chỉ mã hoá được 256 kí tự, chưa đủ để mã hoá đồng thời các bảng chữ cái của các ngôn ngữ trên thế giới. Bộ mã Unicode có thể mã hoá được 65536 kí tự khác nhau. Nó cho phép thể hiện trong máy tính văn bản của hầu hết các ngôn ngữ trên thế giới bằng một bộ mã. Đây là bộ mã chung để thể hiện các văn bản hành chính.

Thông tin tuy có nhiều dạng khác nhau nhưng đều được lưu trữ và xử lí trong máy tính chỉ ở một dạng chung đó là mã nhị phân.

5. Biểu diễn thông tin trong máy tính

a) Biểu diễn thông tin loại số

• Hệ đếm: Hệ đếm được hiểu như tập các kí hiệu và qui tắc sử dụng tập kí hiệu đó để biểu diễn và xác định giá trị các số. Có hệ đếm phụ thuộc vị trí và hệ đếm không phụ thuộc vị trí.

Hệ đếm La Mã là hệ đếm không phụ thuộc vị trí, đó là các chữ cái: I=1; V=5; X=10; L=50; C=100; D=500; M=1000; Hệ này thường ít dùng, chỉ dùng để đánh số chương, mục, đánh số thứ tự...

Các hệ đếm thường dùng là các hệ đếm phụ thuộc vị trí. Bất kì một số tự nhiên b nào lớn hơn 1 đều có thể chọn làm cơ số cho một hệ đếm. Trong các hệ đếm này, số lượng các kí hiệu được sử dụng bằng cơ số của hệ đếm đó. Các kí hiệu được dùng cho hệ đếm đó có các giá trị tương ứng: 0, 1,..., b-1.

i) Hệ thập phân (hệ cơ số 10) sử dụng tập kí hiệu gồm 10 chữ số: 0, 1, 2, 3, 4, 5, 6, 7, 8, 9. Giá trị của mỗi chữ số phụ thuộc vào vị trí của nó trong biểu diễn.

ii) Các hệ đếm thường dùng trong Tin học

-  Hệ nhị phân (hệ cợ số 2) chỉ dùng 2 kí hiệu là chữ số 0 và chữ số 1.

Ví dụ: 1012 = Ix22 + 0x21 + 1x2°= 510.

-  Hệ cơ số mười sáu (Hệ Hexa), sử dụng các kí hiệu: 0, 1,2, 3, 4, 5, 6, 7, 8, 9, A, B, C, D, E, F, trong đó A, B, C, D, E, F có giá trị tương ứng là 10, 11, 12, 13, 14, 15 trong hệ thập phân.

iii) Biểu diễn số nguyên

Một byte biểu diễn được số nguyên trong phạm vi -127 đến 127.

iv) Biểu diễn số thực

Dùng dấu chấm(.) để ngăn cách giữa phần nguyên và phần thập phân. Mọi số thực đều có thể biểu diễn dưới dạng ±M X 10+K (dạng dấu phẩy động).

b) Biểu diễn thông tin loại phi số

• Biểu diễn văn bản: Dùng một dãy bit để biểu diễn một kí tự (mã ASCII của kí tự đó)

• Các dạng khác: xử lí âm thanh, hình ảnh... thành dãy các bit

• Nguyên lí mã hoá nhị phân

 Thông tin có nhiều dạng khác nhau như số, văn bản, hình ảnh, âm thanh... Khi dựa vào máy tính, chúng đều biến đổi thành dạng chung - dãy bit. Dãy bit là mã nhị phân của thông tin mà nó biểu diễn.

Loigiaihay.com

Dữ liệu là chuỗi bất kỳ của một hoặc nhiều ký hiệu có ý nghĩa thông qua việc giải thích một hành động cụ thể nào đó.

Dữ liệu trong máy tính được lưu dưới dạng nào

Các loại dữ liệu có thể được hình dung thông qua một thiết bị máy tính

Dữ liệu cần phải được thông dịch để trở thành thông tin. Để dữ liệu thành thông tin, cần xem xét một số nhân tố bao gồm người (hoặc vật)tạo ra dữ liệu và thông tin được mong muốn từ dữ liệu đó. Thuật ngữ siêu dữ liệu chỉ các dữ liệu được dùng làm dữ liệu tham khảo về một dữ liệu khác. Siêu dữ liệu có thể được ngầm hiểu, được chỉ định hoặc cho trước. Dữ liệu liên quan đến sự kiện hoặc quy trình vật lý thường có nhân tố thời gian. Trong hầu hết các trường hợp, nhân tố thời gian được ngầm hiểu. Ví dụ như máy ghi nhiệt độ nhận được dữ liệu từ cảm biến nhiệt độ. Khi nhận được nhiệt độ, dữ liệu được ngầm định có tham chiếu thời gian là lúc "bấy giờ". Vì vậy, thiết bị ghi lại cả ngày tháng, thời gian và nhiệt độ. Khi máy ghi dữ liệu báo cáo nhiệt độ, nó cũng phải xuất ra ngày và giờ (chính là siêu dữ liệu) cho từng mốc nhiệt độ.

Dữ liệu số là dữ liệu được biểu diễn bằng hệ số nhị phân dựa trên các số 1 và 0, ngược với dữ liệu tương tự. Trong các hệ thống máy tính hiện đại (sau năm 1960), tất cả dữ liệu đều là dạng số. Trong đa số trường hợp, dữ liệu di chuyển bên trong máy tính dưới dạng dữ liệu song song. Trong khi dữ liệu di chuyển giữa máy tính dưới dạng dữ liệu nối tiếp. Dữ liệu có nguồn gốc từ một thiết bị tương tự, chẳng hạn như cảm biến nhiệt độ, phải đi qua bộ chuyển đổi tín hiệu tương tự thành tín hiệu số (ADC).

Dữ liệu biễu diễn số lượng, tính chất hoặc ký hiệu hoạt động được máy tính lưu trữ trên ổ cứng từ, đĩa quang và truyền đi dưới dạng tín hiệu điện.[1]

Chương trình là tập dữ liệu gồm một chuỗi mã lệnh phần mềm dùng để điều khiển hoạt động của máy tính hoặc các dạng máy móc khác.[2] Các phần tử của bộ nhớ máy tính vật lý bao gồm một địa chỉ và một byte/từ (word: đơn vị lưu trữ) của bộ nhớ dữ liệu. Dữ liệu số thường được lưu vào các cơ sở dữ liệu quan hệ dạng các bảng hoặc cơ sở dữ liệu SQL và được biễu diễn tổng quát thành các cặp khóa/giá trị trừu tượng.

Dữ liệu có thể được tổ chức trong nhiều loại cấu trúc dữ liệu khác nhau, bao gồm mảng, đồ thị và đối tượng. Cấu trúc dữ liệu lưu nhiều loại dữ liệu khác nhau, bao gồm số, chuỗi và thậm chí các cấu trúc dữ liệu khác. Dữ liệu ra vào máy tính thông qua các thiết bị ngoại vi.

Một cách sử dụng khác, các tệp tin nhị phân (mà con người không thể đọc được) đôi khi được gọi là "dữ liệu", phân biệt với văn bản thô mà "con người có thể đọc được".[3] Ước tính tổng dữ liệu số trong năm 2007 là 281 tỉ gigabytes (= 281 exabytes).[4][5] Dữ liệu số có ba trạng thái: dữ liệu được lưu trữ, dữ liệu đang vận chuyển và dữ liệu đang sử dụng.

  1. ^ “data”. Oxford Dictionaries. Truy cập ngày 11 tháng 10 năm 2012.
  2. ^ “computer program”. The Oxford Pocket Dictionary of Current English. Truy cập ngày 11 tháng 10 năm 2012.
  3. ^ “file(1)”. OpenBSD Manual Pages. ngày 4 tháng 12 năm 2004. Truy cập ngày 19 tháng 3 năm 2007.
  4. ^ “Study: amount of digital info > global storage capacity”.
  5. ^ Gantz, John F.; và đồng nghiệp (2008). “The Diverse and Exploding Digital Universe”. International Data Corporation via EMC. Bản gốc lưu trữ ngày 11 tháng 3 năm 2008. Truy cập ngày 12 tháng 3 năm 2008. Đã định rõ hơn một tham số trong |author= và |last= (trợ giúp)Đã định rõ hơn một tham số trong |author= và |last= (trợ giúp); Đã định rõ hơn một tham số trong |author= và |last= (trợ giúp)

Lấy từ “https://vi.wikipedia.org/w/index.php?title=Dữ_liệu_(máy_tính)&oldid=67495689”