Thông tin trong tin học là gì

§2. THÔNG TIN VÀ Dữ LIỆU Khái niệm thông tin và dữ liệu Thực ra ko mang sự khác biệt nhiều giữa khái niệm thông tin được hiểu trong đời sống xã hội và khái niệm thông tin trong tin học. Trước mỗi thực thể [sự vật, sự kiện] tồn tại khách quan, con người luôn muốn biết rõ về nó càng nhiều càng tốt. Sự hiểu biết đó càng ít thì con người càng khó xác định thực thể đó. Những hiểu biết mang thể mang được về một thực thể nào đó được gọi là thông tin về thực thể đó. Ví dụ, lúc đọc lời nhận xét của cô giáo chủ nhiệm: “Em Ngọc Hà ngoan, siêng năng và học giỏi” ghi trong “Sổ liên lạc”, bố mẹ của Ngọc Hà mang thêm thông tin về con mình. Muốn đưa thông tin vào máy tính, con người phải tìm cách trình diễn thông tin sao cho máy tính mang thể nhận diện và xử lí được. Trong tin học, dữ liệu là thông tin đã được đưa vào máy tính. Đon vị đo lượng thông tin Ta ko chỉ ngừng lại ở một quan niệm định tính về thông tin như trên mà còn cho thông tin một quan niệm định lượng. Mỗi sự vật hay sự kiện đều hàm chứa một lượng thông tin. Muốn nhận diện một đối tượng nào đó, ta phải biết đủ lượng thông tin về nó. Tương tự, để máy nhận diện một đối tượng nào đó, ta cũng phải cung ứng cho máy đủ lượng thông tin về đối tượng này. Đơn vị cơ bản đo lượng thông tin là bít. Đó là lượng thông tin vừa ưu để xác định kiên cố một trạng thái của một sự kiện mang hai trạng thái với khả năng xuất hiện như nhau. Ví dụ, xét việc tung ngẫu nhiên đồng xu mang hai mặt hoàn toàn tương hợp với khả năng xuất hiện của mỗi mặt là như nhau. Nếu kí hiệu một mặt của đồng xu là 1 và mặt kia là 0 thì sự xuất hiện kí hiệu 1 hay 0 sau lúc tung đồng xu cho ta một lượng thông tin là 1 bít. Trong tin học, thuật ngữ bít thường sử dụng để chỉ phần nhỏ nhất của bộ nhớ máy tính để lưu trữ một trong hai kí hiệu, được sử dụng để trình diễn thông tin trong máy tính, là 0 và 1. Ví dụ, giả sử mang dãy tám bóng đèn được đánh số từ 1 tới 8, trong đó một số bóng đèn sáng và một số khác tắt, chẳng hạn những bóng đèn thứ hai, ba, năm và tám sáng, những bóng còn lại tắt [h. 2]. Nếu ta sử dụng kí hiệu 0 và 1 để trình diễn tương ứng trạng thái tắt và sáng của mỗi bóng đèn thì thông tin về dãy tám bóng đèn trên được trình diễn bằng dãy tám bít 01101001. Hình 2 Để lưu trữ dãy bit đó, ta cần sử dụng ít nhất tám bit của bộ nhớ máy tính. Ngoài đơn vị bít nói trên, đơn vị đo thông tin thường sử dụng là byte [đọc là bai] và 1 byte bằng 8 bit. Người ta còn sử dụng những đơn vị bội của byte như bảng dưới đây: Kí hiệu Đọc là Độ to KB Ki-lô-bai 1024 byte MB Mê-ga-bai 1024 KB GB Gi-ga-bai 1024 MB TB Tê-ra-bai 1024 GB PB Pê-ta-bai 1024 TB Những dạng thông tin Toàn cầu quanh ta rất rộng rãi nên mang nhiều dạng thông tin khác nhau và mỗi dạng mang một số cách thể hiện khác nhau. Sở hữu thể phân loại thông tin thành loại sớ'[số nguyên, số thực,…] và loại phi sô’ [văn bản, hình ảnh, âm thanh,…]. Dưới đây là một số dạng thông tin loại phi số thường gặp trong cuộc sống. Dạng văn bản: Là dạng thân thuộc nhất và thường gặp trên những phương tiện mang thông tin như: Tờ báo, cuốn sách, vở ghi bài, tấm bia,… [h. 3]. Hình 3. Chữ khắc trên đá ở Mỹ Sơn – thông tin dạng văn bản Hình dạng ảnh: Bức tranh vẽ, bức ảnh chụp, bản đồ, băng hình,… là những phương tiện mang thông tin hình dạng ảnh [h. 4]. Hình 4. Biển báo – thông tin hình dạng ảnh Dạng âm thanh: Tiếng nói con người, tiếng sóng biển, tiếng đàn, tiếng chim hót,… là thông tin dạng âm thanh [h. 5]. Băng từ, đĩa từ,… mang thể sử dụng làm vật chứa thông tin dạng âm thanh. Hình 5. Tiếng đàn Trưng – thông tin dạng âm thanh Với sự phát triển của khoa học – kĩ thuật, trong tương lai con người sẽ mang khả năng thu thập, lưu trữ và xử lí những dạng thông tin mới khác. Mã hoá thông tin trong máy tính Muốn máy tính xử lí được, thông tin phải được biến đổi thành một dãy bít. Cách biến đổi tương tự được gọi là một cách mã hoá thông tin. Chẳng hạn, thông tin về trạng thái tám bóng đèn trong ví dụ trước được trình diễn thành dãy tám bít là mã hoá của thông tin đó trong máy tính. Thông tin gốc Thông tin mã hoá Hình 6. Mã hoá thông tin trong máy tính Ví dụ, xét việc mã hoá thông tin dạng văn bản. Mỗi văn bản là một dãy những kí tự viết liên tục theo những quy tắc nào đó. Những kí tự bao gồm những chữ mẫu thường và hoa như a, b, c,…, z, A, B, c,…, Z; những chữ số thập phân 0, 1, 2,…, 9 và một số kí hiệu khác như những dấu phép toán, những dấu ngắt câu,… Để mã hoá thông tin dạng văn bản, ta chỉ cần mã hoá những kí tự. Bộ mã ASCII [đọc là A-ski, viết tắt của American Standard Code for Information Interchange – Mã chuẩn của Mĩ sử dụng trong trao đổi thông tin] sử dụng tám bit để mã hoá kí tự [xem Phụ lục 1. Bộ mã ASCII cơ sâ]. Trong bộ mã này, những kí tự được đánh số từ 0 tới 255 và những số hiệu này được gọi là mã ASCII thập phân của kí tự. Ví dụ, kí tự “A” mang mã ASCII thập phân là 65 và kí tự “a” mang mã ASCII thập phân là 97. Mỗi số nguyên trong phạm vi từ 0 tới 255 đều mang thể viết trong hệ nhị phân với 8 chữ số [8 bit]. Nếu kí tự mang mã ASCII thập phân là N, dãy 8 bít trình diễn N chính là mã hoá của kí tự đó trong máy tính. Ví dụ, mã ASCII của kí tự “A” là 01000001. Bộ mã ASCII chỉ mã hoá được 256 [= 28] kí tự, chưa đủ để mã hoá tất cả những bảng chữ mẫu của những tiếng nói trên toàn cầu. Do đó với mã ASCII, việc trao đổi thông tin trên toàn cầu còn khó khăn. Bởi vậy, người ta đã xây dựng bộ mã Unicode sử dụng 16 bit để mã hoá. Với bộ mã Unicode ta mang thể mã hoá được 65536 [= 216] kí tự khác nhau, cho phép thể hiện trong máy tính văn bản của tất cả những tiếng nói trên toàn cầu bằng một bộ mã. Hiện nay, nước ta đã chính thức sử dụng bộ mã Unicode như một bộ mã chung để thể hiện những văn bản hành chính. Để con người mang thể biết thông tin được lưu trữ trong máy, máy tính phải biến đổi thông tin đã mã hoá thành dạng thân thuộc như văn bản, âm thanh hoặc hình ảnh. Trình diễn thông tin trong máy tính Dữ liệu trong máy tính là thông tin đã được mã hoá thành dãy bít. Trong mục này, ta tìm hiểu cách trình diễn thông tin loại số và phi số trong máy tính. Thông tin loại số Hệ đếm Hệ đếm được hiểu như tập những kí hiệu và quy tắc sử dụng tập kí hiệu đó để trình diễn và xác định trị giá những số. Sở hữu hệ đếm phụ thuộc vị trí và hệ đếm ko phụ thuộc vị trí. Hệ đếm La Mã là hệ đếm ko phụ thuộc vị trí. Tập những kí hiệu trong hệ này gồm những chữ mẫu:. I, V, X, L, c, D, M. Mỗi kí hiệu mang một trị giá, cụ thể: 1= 1; v = 5; x= 10; L = 50; c = 100; D = 500; M = 1000. Trong hệ đếm này, trị giá của kí hiệu ko phụ thuộc vị trí của nó trong trình diễn. Ví dụ, X trong những trình diễn XI [11] và IX [9] đều mang cùng trị giá là 10. Những hệ đếm thường sử dụng là những hệ đếm phụ thuộc vị trí. Bất kì một số tự nhiên b nào to hơn 1 đều mang thể chọn làm cơ số cho một hệ đếm. Trong những hệ đếm này, số lượng những kí hiệu được sử dụng bằng cơ số của hệ đếm đó. Những kí hiệu được sử dụng cho hệ-đếm đó mang những trị giá tương ứng: 0, 1,…, b – ỉ. Hệ thập phân [hệ cơ số 10] sử dụng tập kí hiệu gồm 10 chữ số: 0, 1,2, 3, 4, 5, 6, 7, 8, 9. Trị giá của mỗi chữ số phụ thuộc vào vị trí của nó trong trình diễn. Ví dụ, trong số 545, chữ số 5 ở hàng đơn vị chỉ 5 đơn vị, trong lúc đó chữ số 5 ở hàng trăm chỉ 500 đơn vị. Trị giá số trong hệ thập phân được xác định theo quy tắc: mỗi đơn vị ở một hàng bất kì mang trị giá bằng 10 đơn vị của hàng kế cận bên phải. Ví dụ: 536,4 = 5 X 102 + 3 X 101 + 6 X 10° + 4 X 10″1. Trong hệ đếm cơ số b, giả sử số N mang trình diễn: dndn_xdn_2…dxdQ, d_xd _2.~d_m trong đó n + 1 là số những chữ số bên trái, m là số những chữ số bên phải dấu phân chia phần nguyên và phần phân của số N và những dị thoả mãn điều kiện 0. Lúc đó trị giá của số N được tính theo công thức: N = dnbn + dn_xbn~x + … + dữbữ + d_ỵb~x + … + d_mbm. Ghi chú : Lúc cần phân biệt số được trình diễn ở hệ đếm nào người ta viết cơ số làm chỉ số dưới của số đó. Ví dụ: 1012 [hệ cơ sô’ 2], 516 [hệ cơ sô’ 16]. Những hệ đếm thường sử dụng trong tin học Ngoài hệ thập phân, trong tin học thường sử dụng hai hệ đếm sau: Hệ nhị phân [hệ cơ số 2] chỉ sử dụng hai kí hiệu là chữ số 0 và chữ số 1. Ví dụ: 1012 = 1 X 22 + 0 X 21 + 1 X 2° = 510. Hệ cơ số mười sáu, còn gọi là hệ hexa, sử dụng những kí hiệu: 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, A, B, c, D, E, F, trong đó A, B, c, D, E, F mang những trị giá tương ứng là 10, 11, 12, 13, 14, 15 trong hệ thập phân. Ví dụ: 1BE16 = 1 X 162 + 11 X 161 + 14 X 16° = 44610. Trình diễn số nguyên Số nguyên mang thể mang dấu hoặc ko dấu. Ta mang thể chọn 1 byte, 2 byte, 4 byte,… để trình diễn số nguyên. Mỗi cách chọn tương ứng với một phạm vi trị giá mang thể trình diễn được. Xét việc trình diễn số nguyên bằng một byte. Một byte mang 8 bit, mỗi bít là 0 hoặc 1. Những bit của một byte được đánh số từ phải sang trái khởi đầu từ 0. Ta gọi bốn bít số hiệu nhỏ là những bit thấp, bốn bit số hiệu to là những bit cao [h. 7]. bit 7 bít 6 bít 5 bít 4 bít 3 bít 2 bít 1 bito những bit cao những bit thấp Hình 7. Trình diễn số nguyên Một cách trình diễn số nguyên mang dấu: sử dụng bit cao nhất thể hiện dấu với quy ước 1 là dấu âm, 0 là dấu dương và bảy bit còn lại trình diễn trị giá tuyệt đối của số viết dưới dạng nhị phân. Theo cách đó, một byte trình diễn được số nguyên trong phạm vi từ -127 tới 127. Đối với số nguyên ko âm, toàn bộ tám bít được sử dụng để trình diễn trị giá số, một byte trình diễn được những sô’ nguyên ko âm trong phạm vi từ 0 tới 255. Trình diễn số thực Cách viết số thực thông thường trong tin học khác với cách viết ta thường sử dụng trong toán học: dấu phẩy [,] ngăn cách giữa phần nguyên và phần phân được thay bằng dấu chấm [.] và ko sử dụng dấu nào để phân cách nhóm ba chữ số liền nhau. Ví dụ, trong toán ta thường viết 13 456,25 nhưng lúc làm việc với máy tính, ta phải viết 13456.25.

Mọi số thực đều mang thế trình diễn được dưới dạng ±MxlO [được gọi là dạng dấu phẩy động’], trong đó 0,1 < M < 1, M được gọi là phần định tri và K là một số nguyên ko âm được gọi là phần bậc. Ví dụ: Số 13 456,25 được trình diễn dưới dạng 0.1345625xl0' Máy tính sẽ lưu những thông tin gồm dấu của số, phần định trị, dấu của phần bậc và phần bậc. Thông tin loại phi số Văn bản Như đã nói ở phần trên, máy tính mang thể sử dụng một dãy bit để trình diễn một kí tự, chẳng hạn mã ASCII của kí tự đó. Để trình diễn một xâu kí tự [dãy những kí tự], máy tính mang thể sử dụng một dãy byte, mỗi byte trình diễn một kí tự theo thứ tự từ trái sang phải. Ví dụ, dãy ba byte 01010100 01001001 01001110 trình diễn xâu kí tự "TIN". Những dạng khác Hiện nay, việc tìm cách trình diễn hiệu quả những dạng thông tin loại phi số như âm thanh, hình ảnh,... rất được quan tâm vì những thông tin loại này ngày càng phổ biến. Để xử lí âm thanh, hình ảnh, ta cũng phải mã hoá chúng thành những dãy bít. Những thành tựu trong ngành nghề này đã và đang tăng chất lượng cuộc sống. Chẳng hạn, hai người ở xa nhau vẫn mang thể trò chuyện, thậm chí mang thể nhìn thấy hình ảnh của nhau. Nguyên lí mã hoá nhị phân Thông tin mang nhiều dạng khác nhau như số, ván bản, hình ảnh, âm thanh,... Lúc đưa vào máy tính, chúng đều được biến đổi thành dạng chung - dãy bit. Dãy bit đó là mã nhị phân của thông tin mà nó trình diễn.

Video liên quan

Xem thêm: FWB, ONS, GWTF là gì? Là viết tắt của từ gì?

Xem thêm: Giãn cách xã hội theo chỉ thị 15 là gì? Khác biệt với chỉ thị 16?

Video liên quan

Chủ Đề