Sự khác biệt giữa Xu hướng Trung tâm và Phân tán

Sự khác biệt giữa Xu hướng Trung tâm và Phân tán
Sự khác biệt giữa Xu hướng Trung tâm và Phân tán

Video: Sự khác biệt giữa Xu hướng Trung tâm và Phân tán

Video: Sự khác biệt giữa Xu hướng Trung tâm và Phân tán
Video: Kính hiển vi điện tử phóng to 1200 lần: Thích vọc vạch chắc chắn nên có! 2024, Tháng bảy
Anonim

Xu hướng trung tâm vs Phân tán

Trong thống kê mô tả và suy diễn, một số chỉ số được sử dụng để mô tả tập dữ liệu tương ứng với xu hướng trung tâm, độ phân tán và độ lệch của nó: ba thuộc tính quan trọng nhất xác định hình dạng tương đối của phân phối tập dữ liệu.

Xu hướng trung tâm là gì?

Xu hướng trung tâm đề cập đến và định vị trung tâm của sự phân phối các giá trị. Trung bình, chế độ và trung vị là các chỉ số được sử dụng phổ biến nhất để mô tả xu hướng trung tâm của một tập dữ liệu. Nếu một tập dữ liệu là đối xứng, thì cả giá trị trung bình và giá trị trung bình của tập dữ liệu trùng khớp với nhau.

Cho một tập dữ liệu, giá trị trung bình được tính bằng cách lấy tổng của tất cả các giá trị dữ liệu rồi chia cho số dữ liệu. Ví dụ: cân nặng của 10 người (tính bằng kilôgam) được đo là 70, 62, 65, 72, 80, 70, 63, 72, 77 và 79. Khi đó, trọng lượng trung bình của mười người (tính bằng kilôgam) có thể là được tính như sau. Tổng các trọng lượng là 70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79=710. Trung bình=(tổng) / (số dữ liệu)=710/10=71 (tính bằng ki-lô-gam). Điều này được hiểu rằng các giá trị ngoại lai (các điểm dữ liệu lệch khỏi xu hướng bình thường) có xu hướng ảnh hưởng đến giá trị trung bình. Do đó, nếu chỉ có các giá trị ngoại lai thì sẽ không đưa ra bức tranh chính xác về trung tâm của tập dữ liệu.

Trung vị là điểm dữ liệu được tìm thấy ở giữa chính xác của tập dữ liệu. Một cách để tính giá trị trung bình là sắp xếp các điểm dữ liệu theo thứ tự tăng dần, sau đó định vị điểm dữ liệu ở giữa. Ví dụ: nếu một khi đã sắp xếp, tập dữ liệu trước đó trông giống như, 62, 63, 65, 70, 70, 72, 72, 77, 79, 80. Do đó, (70 + 72) / 2=71 nằm ở giữa. Từ đó, có thể thấy rằng trung vị không cần phải có trong tập dữ liệu. Trung vị không bị ảnh hưởng bởi sự hiện diện của các giá trị ngoại lai. Do đó, giá trị trung bình sẽ đóng vai trò là thước đo tốt hơn cho xu hướng trung tâm khi có các yếu tố ngoại lai.

Chế độ là giá trị xuất hiện thường xuyên nhất trong tập dữ liệu. Trong ví dụ trước, giá trị 70 và 72 đều xuất hiện hai lần và do đó, cả hai đều là chế độ. Điều này cho thấy rằng, trong một số bản phân phối, có nhiều hơn một giá trị phương thức. Nếu chỉ có một chế độ, tập dữ liệu được cho là đơn phương thức, trong trường hợp này, tập dữ liệu là hai phương thức.

Tán sắc là gì?

Độ phân tán là lượng dữ liệu lan truyền về trung tâm của sự phân phối. Phạm vi và độ lệch chuẩn là các thước đo độ phân tán được sử dụng phổ biến nhất.

Phạm vi chỉ đơn giản là giá trị cao nhất trừ đi giá trị thấp nhất. Trong ví dụ trước, giá trị cao nhất là 80 và giá trị thấp nhất là 62, do đó, phạm vi là 80-62=18. Nhưng phạm vi không cung cấp hình ảnh đầy đủ về độ phân tán.

Để tính độ lệch chuẩn, đầu tiên phải tính độ lệch của các giá trị dữ liệu so với giá trị trung bình. Trung bình bậc hai của độ lệch được gọi là độ lệch chuẩn. Trong ví dụ trước, độ lệch tương ứng so với giá trị trung bình là (70 - 71)=-1, (62 - 71)=-9, (65 - 71)=-6, (72 - 71)=1, (80 - 71)=9, (70 - 71)=-1, (63 - 71)=-8, (72 - 71)=1, (77 - 71)=6 và (79 - 71)=8. Tổng của bình phương độ lệch là (-1)2+ (-9)2+ (-6)2+ 12+ 92+ (-1)2+ (-8) 2+ 12+ 62+ 82=366 Độ lệch chuẩn là √ (366/10)=6,05 (tính bằng kilôgam). Trừ khi tập dữ liệu bị sai lệch nhiều, từ đó có thể kết luận rằng phần lớn dữ liệu nằm trong khoảng 71 ± 6,05 và thực sự là như vậy trong ví dụ cụ thể này.

Sự khác biệt giữa xu hướng trung tâm và phân tán là gì?

• Xu hướng trung tâm đề cập và xác định vị trí trung tâm của việc phân phối các giá trị

• Độ phân tán là lượng dữ liệu lan truyền về trung tâm của tập dữ liệu.

Đề xuất: