Dữ liệu rời rạc và liên tục
Dữ liệu là thực thể nổi bật nhất trong thống kê vì nó nhất thiết phải là “nghiên cứu về thu thập, tổ chức, phân tích và giải thích dữ liệu”. Dữ liệu số được sử dụng trong thống kê thuộc hai loại chính. Chúng là dữ liệu rời rạc và dữ liệu liên tục.
Dữ liệu rời rạc là gì?
Nếu dữ liệu số chỉ có thể nhận nhiều nhất một số giá trị có thể đếm được, thì dữ liệu đó được gọi là dữ liệu rời rạc. Một số có thể đếm được nhiều nhất là số hữu hạn hoặc có thể đếm được. Một ví dụ sẽ minh họa thêm điều này.
Một bài kiểm tra năm câu hỏi được đưa ra cho một lớp học. Số câu trả lời đúng mà học sinh có thể nhận được là 0, 1, 2, 3, 4 và 5: chỉ có 6 khả năng và đây là một số hữu hạn. Do đó, nếu chúng tôi thu thập dữ liệu về số lượng câu hỏi được học sinh trả lời đúng, thì dữ liệu cụ thể đó sẽ rời rạc.
Trong một trò chơi, người ta phải bắn một mục tiêu. Nếu chúng ta thu thập dữ liệu về số lần một lần bắn cho đến khi anh ta bắn trúng mục tiêu, thì các giá trị sẽ là 1, 2, 3, 4…, v.v. Về mặt lý thuyết, các giá trị này không cần có giới hạn hữu hạn. Nhưng những giá trị này có thể đếm được. Do đó, dữ liệu chúng tôi thu thập được dưới dạng "số lần một lần bắn cho đến khi anh ta bắn trúng mục tiêu" là một dữ liệu rời rạc.
Dữ liệu rời rạc thường xảy ra nhất khi dữ liệu có thể nhận các giá trị nhất định hoặc khi đếm xong để lấy dữ liệu.
Dữ liệu liên tục là gì?
Dữ liệu số có thể nhận tất cả các giá trị có thể trong một phạm vi được gọi là dữ liệu liên tục. Do đó, nếu dữ liệu liên tục nằm trong phạm vi từ 0 đến 5, các điểm dữ liệu có thể nhận bất kỳ giá trị số thực nào trong khoảng từ 0 đến 5.
Ví dụ: nếu chúng ta đo chiều cao của học sinh trong một lớp học, thì các điểm dữ liệu có thể nhận bất kỳ giá trị số thực nào trong phạm vi chiều cao của con người. Tuy nhiên, nếu chúng tôi thêm một hạn chế bổ sung là "chiều cao của học sinh chính xác đến từng cm", thì dữ liệu thu thập được sẽ rời rạc vì nó có thể chỉ nhận một số lượng giá trị hữu hạn. Tương tự, một phép đo không hạn chế sẽ luôn mang lại một bộ dữ liệu liên tục trên lý thuyết.
Sự khác biệt giữa dữ liệu rời rạc và liên tục là gì?
• Dữ liệu rời rạc có thể nhận nhiều giá trị nhất có thể đếm được, trong khi dữ liệu liên tục có thể nhận bất kỳ số giá trị nào.
• Dữ liệu rời rạc thường xảy ra khi dữ liệu được thu thập bằng cách đếm, nhưng dữ liệu liên tục thường xảy ra khi dữ liệu được thu thập bằng cách thực hiện các phép đo.