Tính trung bình khi biết ma trận hiệp phương sai năm 2024

Chứng minh. Giả sử X và Y là hai biến ngẫu nhiên liên tục có hàm mật độ xác suất lần lượt là f X ( x ) và f Y ( y ) . Vì X và Y độc lập nên f X,Y ( x, y ) = f X ( x ) f Y ( y ) , ở đây f X,Y ( x, y ) là hàm mật độ xác suất đồng thời của hai biến ngẫu nhiên X và Y. Theo Định nghĩa 3.10,

3.7.3 Hiệp phương sai

Nếu g ( X, Y ) = ( X − E ( X ))( Y − E ( Y )) thì Định nghĩa 3.10 cho ta một giá trị kỳ vọng, gọi là hiệp phương sai của hai biến ngẫu nhiên X và Y. Định nghĩa 3.11 (Hiệp phương sai). Cho biến ngẫu nhiên hai chiều ( X, Y ) , hiệp phương sai của hai thành phần X và Y, ký hiệu là cov ( X, Y ) được xác định bởi

Một công thức khác để tính hiệp phương sai, tương đương với công thức (3.23) được nêu trong định lý sau đây. Định lý 3.8.

Chứng minh. Ta chứng minh trong trường hợp biến ngẫu nhiên rời rạc. Giả sử biến ngẫu nhiên hai chiều ( X, Y ) có bảng phân phối xác suất đồng thời cho trong Định nghĩa 3.1. Theo Định nghĩa 3.2 và 3.11,

Đối với biến ngẫu nhiên liên tục được chứng minh tương tự.

Từ Định lý 3.7 và 3.8 ta thu được các tính chất sau đây của hiệp phương sai.

Định lý 3.9. (a) cov ( X, Y ) = cov ( Y, X ) . (b) V ( X ) = cov ( X, X ) , V ( Y ) = cov ( Y, Y ) . (c) Nếu X, Y độc lập thì cov ( Y, X ) = 0, điều ngược lại chưa chắc đã đúng. (d) cov ( aX, Y ) = acov ( X, Y ) với a là hằng số. (e) cov ( X + Z, Y ) = cov ( X, Y ) + cov ( Z, Y ) . (f)

Ví dụ 3.18. Cho biến ngẫu nhiên hai chiều ( X, Y ) có bảng phân phối xác suất là

(a) Tìm E ( X ) , E ( Y ) , cov ( X, Y ) . (b) X và Y có độc lập không?

Lời giải Ví dụ 3.18

Trong Ví dụ 3.18 ta có cov ( X, Y ) = 0 nhưng hai biến ngẫu nhiên X và Y không độc lập. Nhận xét 3.7. Hiệp phương sai được dùng làm độ đo quan hệ giữa hai biến X và Y: (a) cov ( X, Y ) > 0 cho thấy xu thế Y tăng khi X tăng. (b) cov ( X, Y ) < 0 cho thấy xu thế Y giảm khi X tăng. Sau đây là một số tính chất nhằm cung cấp thêm công cụ để tính phương sai và độ lệch chuẩn.

Định lý 3.10. Cho ( X, Y ) là biến ngẫu nhiên hai chiều, a, b, c là các hằng số. Khi đó

V ( aX + bY + c ) = a 2 V ( X ) + b 2 V ( Y ) + 2ab cov ( X, Y ) .

Chứng minh. Sử dụng Định nghĩa 2.9,

V ( aX + bY + c ) = E [( aX + bY + c ) − E ( aX + bY + c )] 2 .

Theo Hệ quả 3.1 và Hệ quả 2.1,

E ( aX + bY + c ) = aE ( X ) + bE ( Y ) + c.

Suy ra

Từ Định lý 3.10, nếu cho b = 0, c = 0 ta nhận được Định lý 2.9(a), nếu cho a = 0, b = 0 ta nhận được Định lý 2.9(b). Hệ quả 3.2. (a) Nếu a = 1, b = 1 và c = 0 ta có V ( X + Y ) = V ( X ) + V ( Y ) + 2cov ( X, Y ) . (b) Nếu a = 1, b = − 1 và c = 0 ta có V ( X − Y ) = V ( X ) + V ( Y ) − 2cov ( X, Y ) . Từ Định lý 3.10 và Định lý 3.9(c) ta có hệ quả sau. Hệ quả 3.3. Nếu X và Y là hai biến ngẫu nhiên độc lập thì

Định nghĩa 3.12 (Ma trận hiệp phương sai). Ma trận hiệp phương sai của biến ngẫu nhiên hai chiều ( X, Y ) được xác định bởi

Tính chất 3.4. (a) Ma trận hiệp phương sai là ma trận đối xứng. (b) Ma trận hiệp phương sai là ma trận của dạng toàn phương không âm.

Nhận xét 3.8. Hiệp phương sai có hạn chế cơ bản là khó xác định được miền biến thiên, nó thay đổi từ cặp biến thiên này sang cặp biến thiên khác. Chưa kể về mặt vật lý nó có đơn vị đo bằng bình phương đơn vị đo của biến ngẫu nhiên X, Y (nếu chúng cùng đơn vị đo). Vì thế cần đưa ra một số đặc trưng khác để khắc phục hạn chế này, đó là "hệ số tương quan".

3.7.4 Hệ số tương quan Định nghĩa 3.13 (Hệ số tương quan). Hệ số tương quan của hai biến ngẫu nhiên X và Y, ký hiệu là ρ XY , được xác định như sau:

Tính chất 3.5. (a) ρ XY ≤ 1. (b) Nếu ρ XY = ± 1 ta nói hai biến ngẫu nhiên X và Y có quan hệ tuyến tính (tức là tồn tại a và b sao cho Y = aX + b). (c) Nếu ρ XY = 0 ta nói hai biến ngẫu nhiên X và Y là không tương quan. Nói chung 0 < | ρ XY | < 1, trong trường hợp này ta nói hai biến X và Y tương quan với nhau. Chú ý rằng, hai biến tương quan thì phụ thuộc (không độc lập), nhưng không tương quan thì chưa chắc độc lập.

Ví dụ 3.19. Cho biến ngẫu nhiên hai chiều rời rạc ( X, Y ) có bảng phân phối xác suất là

(a) Tìm ma trận hiệp phương sai của ( X, Y ) . (b) Tìm hệ số tương quan ρ X,Y . Lời giải Ví dụ 3.19

(a) Tính

(b) Hệ số tương quan

Ví dụ 3.20. Trọng lượng của những người chồng tuân theo luật phân phối chuẩn với trọng lượng trung bình là 70kg và độ lệch chuẩn 9kg, còn trọng lượng của những người vợ tuân theo luật phân phối chuẩn với trọng lượng trung bình là 55kg và độ lệch chuẩn 4kg. Hệ số tương quan trọng lượng giữa vợ và chồng là 23 . Tính xác suất vợ nặng hơn chồng. Lời giải Ví dụ 3.20 Gọi X và Y lần lượt là các biến ngẫu nhiên chỉ "trọng lượng của chồng" và "trọng lượng của vợ". Ta có X ∼ N ( 70; 9 2 ) , Y ∼ N ( 55; 4 2 ) . Ta cần tính P ( X < Y ) . Vì X − Y là biến ngẫu nhiên có phân phối chuẩn với

E ( X − Y ) = E ( X ) − E ( Y ) = 70 − 55 = 15 và V ( X − Y ) = V ( X ) + V ( Y ) − 2cov ( X, Y ) = 9 2 + 4 2 − ( 2 )( 24 ) = 49,

trong đó

Suy ra

trong đó φ ( 2, 14 ) = 0, 48382 được tra từ bảng hàm số Láp-la-xơ (Phụ lục 2).

3.8 Luật số lớn và định lý giới hạn trung tâm Trong mục này ta nghiên cứu luật số lớn đó là sự hội tụ theo xác suất của dãy các biến ngẫu nhiên và định lý giới hạn trung tâm: khảo sát sự hội tụ theo phân phối xác suất của dãy các biến ngẫu nhiên.

3.8.1 Sự hội tụ của dãy các biến ngẫu nhiên

Định nghĩa 3.14 (Hội tụ theo xác suất). Xét dãy biến ngẫu nhiên {Xn }∞n = 1 và biến ngẫu nhiên X trong cùng một phép thử. Ta nói rằng dãy các biến ngẫu nhiên {Xn}∞n = 1 hội tụ theo xác suất về biến ngẫu nhiên X nếu với mọi ε > 0

Như vậy dãy các biến ngẫu nhiên {Xn}∞n = 1 hội tụ theo xác suất về biến ngẫu nhiên X thì với n đủ lớn, thực tế gần như chắc chắn ta có thể coi rằng X n không khác mấy so với X. Định nghĩa 3.15 (Hội tụ theo phân phối). Dãy biến ngẫu nhiên {Xn}∞n = 1 được gọi là hội tụ theo phân phối về biến ngẫu nhiên X nếu dãy các hàm phân phối xác suất

hội tụ về hàm phân phối F X ( x ) . Tức là với mọi x ∈ R

3.8.2 Luật số lớn Trê-bư-sep Định lý 3.11 (Bất đẳng thức Markov). Cho Y là biến ngẫu nhiên không âm có kỳ vọng hữu hạn. Khi đó với ε > 0 tùy ý cho trước ta có:

Chứng minh. Ta chứng minh cho trường hợp Y là biến ngẫu nhiên liên tục có hàm mật độ xác suất là f Y ( y ) .

Dấu bằng không thể đồng thời xảy ra ở cả 2 dấu " = " và " ≤ " trong biểu thức trên.

Định lý 3.12 (Bất đẳng thức Trê-bư-sep). Cho X là biến ngẫu nhiên có kỳ vọng E ( X ) = µ và phương sai V ( X ) = σ 2 hữu hạn. Khi đó với ε > 0 tùy ý cho trước ta có:

hay tương đương

Chứng minh. Ta chứng minh cho trường hợp X là biến ngẫu nhiên liên tục. Đặt Y = | X −µ | ≥ 0 và áp dụng Định lý 3.11. Các bất đẳng thức (3.29) và (3.30) được gọi là bất đẳng thức Trê-bư-sep. Nhận xét 3.10. Bất đẳng thức Trê-bư-sep có nhiều ứng dụng. Trước hết nó cho phép ta đánh giá cận trên hoặc cận dưới của xác suất để biến ngẫu nhiên X nhận giá trị sai lệch so với kỳ vọng E ( X ) không quá e. Bất đẳng thức Trê-bư-sep có ý nghĩa to lớn về mặt lý thuyết, nó được sử dụng để chứng minh các định lý của luật số lớn.

Ví dụ 3.21. Để ước lượng nhanh chóng sai số của số vải bán ra trong một tháng của một cửa hàng, ta tiến hành như sau: 1. Giả sử có n khách hàng trong một tháng và số vải của mỗi khách hàng được làm tròn bởi số nguyên gần nhất (ví dụ trong sổ ghi 195,6m thì được làm tròn là 196m). 2. Ký hiệu X i là sai số giữa số mét vải thực bán và số mét vải đã làm tròn của khách hàng thứ i trong tháng, i = 1, 2, . . . , n. Các sai số X 1 + X 2 + · · · + X n là các biến ngẫu nhiên độc lập cùng có phân bố đều trên đoạn [− 0, 5; 0, 5 ] . Khi đó E ( X i ) = 0 và V ( X i ) = 1/12, i = 1, 2, . . . , n. Sai số tổng cộng trong cả tháng là X = X 1 + X 2 + · · · + X n . Ta tính được E ( Xi ) = 0 và V ( Xi ) = n/12 . Theo bất đẳng thức Trê-bư-sep, xác suất để sai số vượt quá ε mét sẽ được đánh giá bởi:

3. Bây giờ giả sử n = 10000. Để xác suất P (| X | ≥ ε ) bé hơn 0,01 ta phải có n/(12ε2) ≤ 0, 01 hay ε ≥ 288, 6746.