Độ lệch so với Độ lệch chuẩn
Độ lệch so với Độ lệch chuẩn
Trong thống kê mô tả và suy diễn, một số chỉ số được sử dụng để mô tả một tập dữ liệu tương ứng với xu hướng trung tâm, độ phân tán và độ lệch của nó. Trong suy luận thống kê, chúng thường được gọi là công cụ ước lượng vì chúng ước tính các giá trị tham số tổng thể.
Độ phân tán là thước đo mức độ lan truyền của dữ liệu xung quanh trung tâm của tập dữ liệu. Độ lệch chuẩn là một trong những thước đo độ phân tán được sử dụng phổ biến nhất. Độ lệch của mỗi điểm dữ liệu so với giá trị trung bình được tính đến khi tính độ lệch chuẩn. Do đó, người ta có thể lập luận rằng độ lệch chuẩn cùng với giá trị trung bình sẽ cung cấp một bức tranh gần như đầy đủ về tập dữ liệu.
Hãy xem xét tập dữ liệu sau. Cân nặng của 10 người (tính bằng kilôgam) được đo là 70, 62, 65, 72, 80, 70, 63, 72, 77 và 79. Sau đó, trọng lượng trung bình của mười người (tính bằng kilôgam) là 71 (tính bằng kilôgam).
Độ lệch là gì?
Trong thống kê, độ lệch có nghĩa là số lượng điểm dữ liệu đơn lẻ khác với một giá trị cố định chẳng hạn như giá trị trung bình. Nói chung, đặt k là giá trị cố định và x1, x2,…, xnbiểu thị một dữ liệu bộ. Sau đó, độ lệch của xjso với k được xác định là (xj- k).
Ví dụ: trong tập dữ liệu trên, độ lệch tương ứng so với giá trị trung bình là (70 - 71)=-1, (62 - 71)=-9, (65 - 71)=-6, (72 - 71)=1, (80 - 71)=9, (70 - 71)=-1, (63 - 71)=-8, (72 - 71)=1, (77 - 71)=6 và (79 - 71)=8.
Độ lệch chuẩn là gì?
Khi dữ liệu từ toàn bộ dân số có thể được tính đến (ví dụ trong trường hợp điều tra dân số), thì có thể tính độ lệch chuẩn dân số. Để tính toán độ lệch chuẩn của tổng thể, trước tiên, độ lệch của các giá trị dữ liệu so với giá trị trung bình của tổng thể được tính toán. Bình phương trung bình gốc (trung bình bậc hai) của độ lệch được gọi là độ lệch chuẩn tổng thể. Trong các ký hiệu, σ=√ {∑ (xi-µ)2/ n} trong đó µ là trung bình của tổng thể và n là kích thước tổng thể.
Khi dữ liệu từ mẫu (cỡ n) được sử dụng để ước tính các tham số của tổng thể, độ lệch chuẩn của mẫu sẽ được tính. Đầu tiên, độ lệch của các giá trị dữ liệu so với giá trị trung bình của mẫu được tính toán. Vì giá trị trung bình mẫu được sử dụng thay cho giá trị trung bình tổng thể (chưa biết), nên việc lấy giá trị trung bình bậc hai là không phù hợp. Để bù cho việc sử dụng trung bình mẫu, tổng bình phương độ lệch được chia cho (n-1) thay vì n. Độ lệch chuẩn mẫu là căn bậc hai của điều này. Trong các ký hiệu toán học, S=√ {∑ (xi-ẍ)2/ (n-1)}, trong đó S là độ lệch chuẩn mẫu, ẍ là trung bình mẫu và xi là điểm dữ liệu.
Trong tập dữ liệu trước, tổng bình phương độ lệch là (-1)2+ (-9)2+ (-6)2+ 12+ 92+ (-1)2+ (-8)2+ 12+ 62+ 82=366. Như vậy, độ lệch chuẩn dân số là √ (366/10)=6,05 (tính bằng kilogam). (Giả sử rằng dân số đang được xem xét bao gồm 10 người mà dữ liệu được lấy từ đó).
Sự khác biệt giữa độ lệch và độ lệch chuẩn là gì?
• Độ lệch chuẩn là một chỉ số thống kê và một công cụ ước lượng, nhưng độ lệch thì không.
• Độ lệch chuẩn là thước đo mức độ phân tán của một nhóm dữ liệu từ trung tâm, trong khi độ lệch đề cập đến số lượng mà một điểm dữ liệu duy nhất khác với một giá trị cố định.