Sự khác biệt giữa Trung bình, Trung vị và Chế độ

Sự khác biệt giữa Trung bình, Trung vị và Chế độ
Sự khác biệt giữa Trung bình, Trung vị và Chế độ

Video: Sự khác biệt giữa Trung bình, Trung vị và Chế độ

Video: Sự khác biệt giữa Trung bình, Trung vị và Chế độ
Video: Toán lớp 8 - Bài 7 - Hình bình hành - Thầy Khúc Đình Vinh (DỄ HIỂU NHẤT) 2024, Tháng bảy
Anonim

Mean vs Median vs Mode

Trung bình, trung vị và chế độ là các thước đo chính về xu hướng trung tâm được sử dụng trong thống kê mô tả. Chúng hoàn toàn khác nhau và các trường hợp chúng được sử dụng để tóm tắt dữ liệu cũng khác nhau.

Nghĩa là

Trung bình cộng là tổng các giá trị dữ liệu chia cho số giá trị dữ liệu, tức là

[latex] bar {x}=\ frac {1} {n} sum_ {i=1} ^ {n} x_ {i}=\ frac {x_ {1} + x_ {2} + x_ {3} +… + x_ {n}} {n} [/latex]

Nếu dữ liệu từ không gian mẫu, nó được gọi là trung bình mẫu ([latex] bar {x} [/latex]), là thống kê mô tả của mẫu. Mặc dù đây là thước đo mô tả được sử dụng phổ biến nhất cho một mẫu, nhưng nó không phải là một thống kê mạnh mẽ. Nó rất nhạy cảm với các yếu tố ngoại lai và dao động.

Ví dụ: hãy xem xét thu nhập trung bình của công dân của một thành phố cụ thể. Vì tất cả các giá trị dữ liệu được tổng hợp và sau đó chia ra, nên thu nhập của một người cực kỳ giàu có ảnh hưởng đáng kể đến giá trị trung bình. Do đó, các giá trị trung bình luôn không phải là đại diện tốt cho dữ liệu.

Ngoài ra, trong trường hợp tín hiệu xoay chiều, dòng điện đi qua một phần tử biến thiên tuần hoàn từ chiều dương sang chiều âm và ngược lại. Nếu chúng ta lấy dòng điện trung bình đi qua phần tử trong một khoảng thời gian, nó sẽ cho giá trị 0, nghĩa là không có dòng điện nào chạy qua phần tử, điều này rõ ràng là không đúng. Do đó, trong trường hợp này, trung bình cộng không phải là một thước đo tốt.

Trung bình cộng là một chỉ báo tốt khi dữ liệu được phân bổ đồng đều. Đối với phân phối chuẩn, giá trị trung bình bằng mode và trung vị. Nó cũng có phần dư thấp nhất khi xem xét sai số bình phương trung bình gốc; do đó, là thước đo mô tả tốt nhất khi nó được yêu cầu đại diện cho một tập dữ liệu bằng một số duy nhất.

Trung vị

Các giá trị của điểm dữ liệu giữa sau khi sắp xếp tất cả các giá trị dữ liệu theo thứ tự tăng dần được xác định là giá trị trung bình của tập dữ liệu. Trung vị là phân vị thứ 2, phân vị thứ 5 và phân vị thứ 50.

• Nếu số lượng quan sát (điểm dữ liệu) là số lẻ, thì trung vị là quan sát chính xác ở giữa danh sách có thứ tự.

• Nếu số lượng quan sát (điểm dữ liệu) là số chẵn, thì giá trị trung bình là giá trị trung bình của hai quan sát ở giữa trong danh sách có thứ tự.

Trung vị chia quan sát thành hai nhóm; tức là một nhóm (50%) giá trị cao hơn và một nhóm (50%) giá trị thấp hơn giá trị trung bình. Giá trị trung bình được sử dụng cụ thể trong các phân phối lệch và thể hiện dữ liệu khá tốt hơn so với giá trị trung bình số học.

Chế độ

Chế độ là số xuất hiện nhiều nhất trong một tập hợp các quan sát. Chế độ của Tập dữ liệu được tính bằng cách tìm tần suất của từng phần tử trong tập.

• Nếu không có giá trị nào xuất hiện nhiều hơn một lần, thì tập dữ liệu không có chế độ.

• Nếu không, bất kỳ giá trị nào xuất hiện với tần suất lớn nhất là một chế độ của tập dữ liệu.

Có thể tồn tại nhiều hơn 1 chế độ trong một tập hợp; do đó, chế độ không phải là một thống kê duy nhất của một tập dữ liệu. Trong một phân phối đồng đều, có một chế độ. Chế độ phân phối xác suất rời rạc là điểm mà hàm khối lượng xác suất đạt điểm cao nhất. Từ các diễn giải trên, chúng ta có thể nói rằng cực đại toàn cầu là các chế độ.

Xem xét việc áp dụng cả ba biện pháp cho tập dữ liệu sau.

DỮ LIỆU: {1, 1, 2, 3, 5, 5, 5, 5, 6, 6, 8, 8, 9, 9, 9, 9, 9, 10, 10, 10, 14, 14, 15, 15, 15}

Mean=(1+ 1+ 2+ 3+ 5+ 5+ 5+ 5+ 6+ 6+ 8+ 8+ 9+ 9+ 9+ 9+ 10+ 10+ 10+ 14+ 14+ 15+ 15+ 15) / 25=8.12

Trung vị=9 (phần tử thứ 13)

Chế độ=9 (tần suất 9=5)

Sự khác biệt giữa Trung bình, Trung vị và Chế độ là gì?

• Trung bình số học là tổng các giá trị (quan sát) chia cho số quan sát. Nó không phải là một thống kê chắc chắn và phụ thuộc nhiều vào bản chất phân phối chuẩn trong phân phối được xem xét. Một giá trị ngoại lệ duy nhất có thể gây ra sự thay đổi đáng kể trong giá trị trung bình đưa ra các giá trị tương đối sai lệch. Khái niệm này có thể được mở rộng thành trung bình hình học, trung bình điều hòa, trung bình có trọng số, v.v.

• Trung vị là giá trị giữa của tập hợp các quan sát và nó tương đối ít bị ảnh hưởng bởi các giá trị ngoại lai. Nó có thể đưa ra một ước tính tốt là thống kê tóm tắt trong các trường hợp sai lệch cao.

• Chế độ là các giá trị quan sát phổ biến nhất trong tập dữ liệu. Nếu phân phối bị lệch dương, chế độ nằm bên trái về trung vị và nếu bị lệch âm, chế độ sẽ nằm ngay về trung vị.

• Nếu lệch dương, giá trị trung bình nằm ngay trên đường trung bình; nếu trung bình bị lệch âm là ở bên trái của đường trung bình.

• Trong phân phối chuẩn, cả ba giá trị, trung bình, chế độ và trung vị đều bằng nhau.

Đề xuất: