Nhị thức so với Phân phối Chuẩn
Phân phối xác suất của các biến ngẫu nhiên đóng một vai trò quan trọng trong lĩnh vực thống kê. Trong số các phân phối xác suất đó, phân phối nhị thức và phân phối chuẩn là hai trong số các phân phối thường xảy ra nhất trong cuộc sống thực.
Phân phối nhị thức là gì?
Phân phối nhị thức là phân phối xác suất tương ứng với biến ngẫu nhiên X, là số lần thành công của một dãy hữu hạn các thí nghiệm có / không độc lập, mỗi thí nghiệm có xác suất thành công là p. Từ định nghĩa của X, rõ ràng nó là một biến ngẫu nhiên rời rạc; do đó, phân phối nhị thức cũng rời rạc.
Phân phối được ký hiệu là X ~ B (n, p) trong đó n là số thí nghiệm và p là xác suất thành công. Theo lý thuyết xác suất, chúng ta có thể suy ra rằng B (n, p) tuân theo hàm khối lượng xác suất [latex] B (n, p) / sim \\ binom {n} {k} p ^ {k} (1-p) ^ {(n-k)}, k=0, 1, 2,… n [/latex]. Từ phương trình này, có thể suy ra thêm rằng giá trị kỳ vọng của X, E (X)=np và phương sai của X, V (X)=np (1- p).
Ví dụ: hãy xem xét một thí nghiệm ngẫu nhiên là tung đồng xu 3 lần. Định nghĩa thành công là thu được H, thất bại là thu được T và biến ngẫu nhiên X là số lần thành công trong thí nghiệm. Khi đó X ~ B (3, 0,5) và hàm khối lượng xác suất của X được cho bởi [latex] / binom {3} {k} 0.5 ^ {k} (0,5) ^ {(3-k)}, k=0, 1, 2. [/Latex]. Do đó, xác suất lấy được ít nhất 2 chữ H là P (X ≥ 2)=P (X=2 hoặc X=3)=P (X=2) + P (X=3)=3C2(0.52) (0.51) +3C3(0,53) (0,50)=0,375 + 0,125=0,5.
Phân phối chuẩn là gì?
Phân phối chuẩn là phân phối xác suất liên tục được xác định bởi hàm mật độ xác suất, [latex] N (\ mu, \\ sigma) / sim \\ frac {1} {\ sqrt {2 \\ pi \\ sigma ^ {2}}} / e ^ {- \\ frac {(x - \\ mu) ^ {2}} {2 \\ sigma ^ {2}}} [/latex]. Các tham số [latex] / mu và \\ sigma [/latex] biểu thị giá trị trung bình và độ lệch chuẩn của tập hợp quan tâm. Khi [latex] / mu=0 và \\ sigma=1 [/latex] thì phân phối được gọi là phân phối chuẩn chuẩn.
Phân phối này được gọi là bình thường vì hầu hết các hiện tượng tự nhiên đều tuân theo phân phối chuẩn. Ví dụ, chỉ số IQ của dân số con người được phân phối bình thường. Như nhìn từ biểu đồ, nó là đơn phương, đối xứng về giá trị trung bình và hình chuông. Giá trị trung bình, chế độ và trung vị đang trùng khớp. Diện tích dưới đường cong tương ứng với phần dân số, thỏa mãn một điều kiện nhất định.
Các phần của dân số trong khoảng [latex] (\ mu - \\ sigma, \\ mu + \\ sigma) [/latex], [latex] (\ mu - 2 \\ sigma, \\ mu + 2 \\ sigma) [/latex], [latex] (\ mu - 3 \\ sigma, \\ mu + 3 \\ sigma) [/latex] xấp xỉ 68,2%, 95,6% và 99,8% tương ứng.
Sự khác biệt giữa Phân phối Nhị thức và Bình thường là gì?
- Phân phối nhị thức là phân phối xác suất rời rạc trong khi phân phối chuẩn là phân phối liên tục.
- Hàm khối lượng xác suất của phân phối nhị thức là [latex] B (n, p) / sim \\ binom {n} {k} p ^ {k} (1-p) ^ {(n-k) } [/latex], trong khi hàm mật độ xác suất của phân phối chuẩn là [latex] N (\ mu, \\ sigma) / sim \\ frac {1} {\ sqrt {2 \\ pi \\ sigma ^ {2}}} / e ^ {- \\ frac {(x - \\ mu) ^ {2}} {2 \\ sigma ^ {2}}} [/latex]
- Phân phối nhị thức là gần đúng với phân phối chuẩn trong các điều kiện nhất định chứ không phải ngược lại.