Bài 2: PHƯƠNG SAI & ĐỘ LỆCH CHUẨN CỦA MẪU SỐ LIỆU GHÉP NHÓM
A. Lý thuyết
Phương sai
Phương sai của mẫu số liệu ghép nhóm, kí hiệu $S^2$, được tính bởi công thức: $$S^{2}=\frac{1}{n}[n_{1}(c_{1}-\overline{x})^{2}+n_{2}(c_{2}-\overline{x})^{2}+...+n_{k}(c_{k}-\overline{x})^{2}]$$ Trong đó:
- $n=n_{1}+n_{2}+...+n_{k}$ là cỡ mẫu;
- $\overline{x}=\frac{1}{n}(n_{1}c_{1}+n_{2}c_{2}+...+n_{k}c_{k})$ là số trung bình.
Độ lệch chuẩn
Độ lệch chuẩn của mẫu số liệu ghép nhóm, kí hiệu S, là căn bậc hai số học của phương sai: $$S = \sqrt{S^{2}}$$
Chú ý:
- Phương sai của mẫu số liệu ghép nhóm có thể được tính theo công thức sau: $$S^{2}=\frac{1}{n}(n_{1}c_{1}^{2}+n_{2}c_{2}^{2}+...+n_{k}c_{k}^{2})-\overline{x}^{2}$$
- Trong thống kê, người ta còn dùng đại lượng sau để đo mức độ phân tán của mẫu số liệu ghép nhóm: $$S^{2}=\frac{1}{n-1}[n_{1}(c_{1}-\overline{x})^{2}+n_{2}(c_{2}-\overline{x})^{2}+...+n_{k}(c_{k}-\overline{x})^{2}]$$
Ý nghĩa
- Phương sai và độ lệch chuẩn của mẫu số liệu ghép nhóm là giá trị xấp xỉ cho phương sai và độ lệch chuẩn của mẫu số liệu gốc.
- Chúng được dùng để đo mức độ phân tán của mẫu số liệu ghép nhóm.
- Phương sai và độ lệch chuẩn càng lớn thì dữ liệu càng phân tán.
- Độ lệch chuẩn có cùng đơn vị với đơn vị của mẫu số liệu.
B. Các dạng bài tập
Dạng 1. Lập mẫu số liệu ghép nhóm và tính giá trị trung bình
Phương pháp:
Xét mẫu số liệu ghép nhóm được cho ở bảng sau:
Nhóm | $[a_1; a_2)$ | ... | $[a_i; a_{i+1})$ | ... | $[a_k; a_{k+1})$ |
---|---|---|---|---|---|
Tần số | $m_1$ | ... | $m_i$ | ... | $m_k$ |
Số trung bình cộng được tính như sau:
- Bước 1: Tính giá trị đại diện mỗi nhóm $x_{i}=\frac{a_{i}+a_{i+1}}{2}$ với $i=1, 2, 3, ..., k$.
- Bước 2: Tính cỡ mẫu $n=m_{1}+m_{2}+...+m_{k}$.
- Bước 3: Tính số trung bình $\overline{x}=\frac{m_{1}x_{1}+m_{2}x_{2}+...+m_{k}x_{k}}{n}$.
Ví dụ 1.1.
Chiều cao của 20 cây giống được cho bởi bảng sau:
Chiều cao (cm) | [40;44) | [45;49) | [50;54) | [55;59) | [60;64) | [65;69) |
---|---|---|---|---|---|---|
Số cây giống | 2 | 5 | 3 | 4 | 3 | 3 |
Tính số trung bình $\overline{x}$ (làm tròn đến chữ số thứ hai sau dấu phẩy) của bảng nói trên.
Ví dụ 1.2.
Các bạn học sinh lớp 12A trả lời 40 câu hỏi trong một bài kiểm tra. Kết quả được thống kê ở bảng sau:
Số câu trả lời đúng | [16;21) | [21;26) | [26;31) | [31;36) | [36;41) |
---|---|---|---|---|---|
Số học sinh | 4 | 6 | 8 | 18 | 4 |
Tính giá trị trung bình số câu trả lời đúng.
Ví dụ 1.3.
Trong tuần lễ bảo vệ môi trường, các em học sinh đã tiến hành thu nhặt vỏ chai nhựa để tái chế. Nhà trường thống kê kết quả thu nhặt vỏ chai nhựa của học sinh ở bảng sau:
Số vỏ chai nhựa | [1;5] | [6;10] | [11;15] | [16;20] | [21;25] |
---|---|---|---|---|---|
Số học sinh | 53 | 82 | 48 | 39 | 18 |
Tính giá trị trung bình số câu trả lời đúng.
Dạng 2. Tính phương sai của mẫu số liệu ghép nhóm
Phương pháp:
- Bước 1: Tính giá trị đại diện mỗi nhóm $x_{i}=\frac{a_{i}+a_{i+1}}{2}$.
- Bước 2: Tính cỡ mẫu $n=m_{1}+m_{2}+...+m_{k}$.
- Bước 3: Tính số trung bình $\overline{x}=\frac{m_{1}x_{1}+m_{2}x_{2}+...+m_{k}x_{k}}{n}$.
- Bước 4: Tính phương sai: $$s^{2}=\frac{m_{1}(x_{1}-\overline{x})^{2}+m_{2}(x_{2}-\overline{x})^{2}+...+m_{k}(x_{k}-\overline{x})^{2}}{n}$$ Hoặc: $$s^{2}=\frac{1}{n}(m_{1}x_{1}^{2}+m_{2}x_{2}^{2}+...+m_{k}x_{k}^{2})-(\overline{x})^{2}$$
Ví dụ 2.1.
Cân nặng (kg) của một số quả mít trong một khu vườn được thống kê ở bảng sau:
Cân nặng (kg) | [4;6) | [6;8) | [8;10) | [10;12) | [12;14) |
---|---|---|---|---|---|
Số cây giống | 6 | 12 | 19 | 9 | 4 |
Hãy tính phương sai của mẫu số liệu ghép nhóm trên.
Lời giải
Ví dụ 2.2.
Thống kê điểm trung bình của hai lớp 12A và 12B được cho ở bảng sau:
Điểm trung bình | [5;6) | [6;7) | [7;8) | [8;9) | [9;10) |
---|---|---|---|---|---|
Số học sinh lớp 12A | 1 | 0 | 11 | 22 | 6 |
Số học sinh lớp 12B | 0 | 6 | 8 | 14 | 12 |
Nếu so sánh phương sai thì học sinh lớp nào có điểm trung bình ít phân tán hơn?
Ví dụ 2.3.
Tuổi thọ của một số linh kiện điện tử (đơn vị: năm) được sản xuất bởi hai phân xưởng được cho như sau:
Tuổi thọ (năm) | [1,5;2) | [2;2,5) | [2,5;3) | [3;3,5) | [3,5;4) |
---|---|---|---|---|---|
Số linh kiện của phân xưởng 1 | 4 | 9 | 13 | 8 | 6 |
Số linh kiện của phân xưởng 2 | 2 | 8 | 20 | 7 | 3 |
Tính phương sai của mỗi mẫu số liệu ghép nhóm và nhận xét về độ phân tán của tuổi thọ các linh kiện điện tử được sản xuất bởi mỗi phân xưởng.
Dạng 3. Tính độ lệch chuẩn của mẫu số liệu ghép nhóm & ý nghĩa
Phương pháp:
- Bước 1-4: Thực hiện tương tự như tính phương sai.
- Bước 5: Tính độ lệch chuẩn $S=\sqrt{S^{2}}$.
Ý nghĩa: Khi hai mẫu số liệu ghép nhóm có cùng đơn vị đo và có số trung bình cộng xấp xỉ nhau, mẫu số liệu nào có độ lệch chuẩn nhỏ hơn thì mức độ phân tán so với số trung bình cộng của các số liệu trong mẫu đó sẽ thấp hơn.
Ví dụ 3.1.
Cho mẫu số liệu ghép nhóm về độ tuổi của cư dân trong một khu phố.
Độ tuổi | [20;30) | [30;40) | [40;50) | [50;60) | [60;70) | [70;80) |
---|---|---|---|---|---|---|
Số cư dân | 25 | 20 | 20 | 15 | 14 | 6 |
Tính phương sai và độ lệch chuẩn của mẫu số liệu đó. (Kết quả làm tròn đến hàng phần mười)
Ví dụ 3.2.
Cho hai mẫu số liệu ghép nhóm thống kê mức lương của hai công ty A, B (đơn vị là triệu đồng)
Bảng thống kê mức lương công ty A
Mức lương (triệu đồng) | Số lượng nhân viên |
---|---|
[10;15) | 15 |
[15;20) | 18 |
[20;25) | 10 |
[25;30) | 10 |
[30;35) | 5 |
[35;40) | 2 |
Bảng thống kê mức lương công ty B
Mức lương (triệu đồng) | Số lượng nhân viên |
---|---|
[10;15) | 25 |
[15;20) | 15 |
[20;25) | 7 |
[25;30) | 5 |
[30;35) | 5 |
[35;40) | 3 |
(1) Tính phương sai và độ lệch chuẩn của mẫu số liệu ghép nhóm lần lượt biểu diễn mức lương của hai công ty A, B. (Kết quả làm tròn đến hàng phần mười)
(2) Công ty nào có mức lương đồng đều hơn?
Dạng 4. Sử dụng phương sai, độ lệch chuẩn đo độ rủi ro
Phương pháp:
Các bước tính toán tương tự như dạng 3.
Ý nghĩa: Khi hai mẫu số liệu ghép nhóm có cùng đơn vị đo và có số trung bình cộng xấp xỉ nhau, mẫu số liệu nào có phương sai và độ lệch chuẩn cao hơn thì mức độ rủi ro lớn hơn.
Ví dụ 4.1.
Giá đóng cửa của một cổ phiếu là giá của cổ phiếu đó cuối một phiên giao dịch. Bảng sau thống kê giá đóng cửa (đơn vị là nghìn đồng) của hai mã cổ phiếu A và B trong 50 ngày giao dịch liên tiếp.
Giá đóng cửa | [120;122) | [122;124) | [124;126) | [126;128) | [128;130) |
---|---|---|---|---|---|
Cổ phiếu A | 9 | 8 | 11 | 13 | 9 |
Cổ phiếu B | 14 | 6 | 5 | 20 | 5 |
(1) Tính phương sai và độ lệch chuẩn của hai mã cổ phiếu A, B. (Kết quả làm tròn đến hàng phần mười)
(2) So sánh độ rủi ro của cổ phiếu A và B?
Ví dụ 4.2.
Chỉ số P/B (viết tắt của từ Price to book ratio) là một chỉ số tài chính quan trọng, được sử dụng để so sánh giữa giá của cổ phiếu với giá trị ghi sổ của cổ phiếu đó. Khi chỉ số P/B cao, nghĩa là thị trường đang có nhiều kỳ vọng đối với cổ phiếu này, doanh nghiệp có tiềm năng phát triển tốt trong tương lai. Bảng sau thống kê chỉ số P/B của hai mã cổ phiếu A và B trong 10 năm giao dịch liên tiếp.
Giá đóng cửa | [0;2) | [2;4) | [4;6) | [6;8) | [8;10) | [10;12) |
---|---|---|---|---|---|---|
Cổ phiếu A | 1 | 0 | 4 | 2 | 2 | 1 |
Cổ phiếu B | 1 | 2 | 1 | 2 | 3 | 1 |
(1) Tính phương sai và độ lệch chuẩn của hai mã cổ phiếu A, B. (Kết quả làm tròn đến hàng phần mười)
(2) So sánh độ rủi ro của cổ phiếu A và B? Biết rằng các chỉ số tài chính còn lại của hai cổ phiếu đó là xấp xỉ nhau.