Bài toán xác suất đổi hay không đổi

Nguồn gốc bài toán là một trò chơi truyền hình thực tế ở Mỹ, người dẫn chương trình cũng chính là người lập nên bài toán này - Monty Hall.

Giả sử bạn đứng trước ba ô cửa mà đằng sau nó là một trong hai thứ: con dê hoặc một chiếc xe hơi giá trị. Bạn mong muốn mở trúng ô cửa có chiếc xe để được nhận nó [nếu mở trúng ô cửa có dê thì bạn phải rinh nó về nhà].

Monty yêu cầu bạn chọn một trong các ô cửa. Dĩ nhiên bạn chọn một cách “hú họa” tại xác suất lúc này để nhận xe hơi ở mỗi ô cửa đều là $latex \frac{1}{3}$. Giả sử bạn chọn ô cửa số 1.

Monty sẽ giúp bạn LOẠI TRỪ 1 ĐÁP ÁN SAI bằng cách mở một ô cửa có dê trong hai ô cửa còn lại [dĩ nhiên ông ta đã biết mỗi ô cửa có gì]. Sau đó bạn được lựa chọn LẦN HAI: Giữ nguyên ô cửa ban đầu hay đổi sang ô cửa còn lại chưa được lật mở?

II - Nhận xét

Thoạt nhìn thì nhiều người tin rằng lựa chọn lần hai có vẻ “thừa thãi” vì xác suất là $latex 50-50$: lựa chọn ban đầu vẫn chưa sai cho đến thời điểm này và dĩ nhiên trong hai ô cửa còn lại, một ô cửa là dê còn ô kia là xe. Tuy nhiên, việc thay đổi quyết định, trong bài toán này, lại có thể tăng xác suất trúng xe của bạn lên gấp đôi, từ $latex \frac{1}{3}$ lên $latex \frac{2}{3}$. Các bạn có thể theo dõi đoạn video dưới đây về các trường hợp có thể xảy ra khi bạn chọn ô cửa số 1:

III - Định lý Bayes

Theo video trên thì nếu bạn đổi, xác suất trúng xe là $latex \frac{2}{3}$. Bài toán trên xuất phát từ nhận xét: xác suất một biến cố thay đổi khi ta thêm điều kiện cho biến cố đó. Như bài toán trên, xác suất mở cửa trúng xe đã thay đổi khi MONTY MỞ CỬA CÓ DÊ. Điều này đã được nhà thống kê học Thomas Bayes nghiên cứu và phát triển thành một định lý mang tên ông.

Theo định lý Bayes, xác suất xảy ra $latex A$ khi biết $latex B$ sẽ phụ thuộc vào 3 yếu tố:

  • Xác suất xảy ra $latex A$ của riêng nó, không quan tâm đến $latex B$ ký hiệu là $latex P[A]$ và đọc là xác suất của $latex A$. Đây được gọi là xác suất biên duyên hay xác suất tiên nghiệm, nó là "tiên nghiệm" theo nghĩa rằng nó không quan tâm đến bất kỳ thông tin nào về $latex B$.
  • Xác suất xảy ra $latex B$ của riêng nó, không quan tâm đến $latex B$. Ký hiệu là $latex P[B]$ và đọc là xác suất của $latex B$. Đại lượng này còn gọi là hằng số chuẩn hóa [normalising constant], vì nó luôn giống nhau, không phụ thuộc vào sự kiện $latex A$ đang muốn biết.
  • Xác suất xảy ra $latex B$ khi biết $latex A$ xảy ra. Ký hiệu là $latex P[B|A]$ và đọc là xác suất của $latex B$ nếu có $latex A$. Đại lượng này gọi là khả năng [likelihood] xảy ra $latex B$ khi biết $latex A$ đã xảy ra. Chú ý không nhầm lẫn giữa khả năng xảy ra $latex B$ khi biết $latex A$ và xác suất xảy ra $latex A$ khi biết $latex B$.

Khi biết ba đại lượng này, xác suất của $latex A$ khi biết $latex B$ cho bởi công thức:

$latex P[A|B]=\dfrac{P[B|A]P[A]}{P[B]}=\dfrac{likelihood\times prior}{normalizing_{constant}}$

IV - Trở lại bài toán

Với bài toán trên, coi như ban đầu ta chọn ô cửa 1. Nếu ta lấy $latex A$ là biến cố chiếc xe ở ô cửa 1 [ô cửa được chọn ban đầu], $latex B$ là biến cố Monty mở cửa số 2. Khi đó:

$latex P[A]=\dfrac{1}{3}.$

Lại có $latex P[B|A]$ là xác suất Monty mở cửa số 2 [biến cố B] khi chiếc xe ở ô cửa số 1 [biến cố A xảy ra]. Xác suất này bằng $latex \frac{1}{2}$ do khi đó ông ta sẽ chỉ mở cửa số 2 hoặc số 3.

Xác suất để Monty mở cửa số 2 là $latex P[B]=\frac{1}{2}$. [theo luật ông ta phải mở một trong hai cửa còn lại, khác cửa ta đã chọn].

Thế thì $latex P[A|B]=\frac{1}{3}$, tức xác suất chiếc xe nằm ở ô cửa 1 [biến cố A] khi Monty đã mở ô cửa 2 [biến cố B xảy ra] chỉ là $latex \frac{1}{3}$.

Đặt $latex C$ là biến cố xe nằm ở ô cửa số 3. Ta sẽ tính $latex P[C]$. Ta thấy và là hai biến cố xung khắc [do xe chỉ ở ô cửa 1 hoặc ô cửa 3] nên $latex P[C]=1-P[A]=\frac{2}{3}$.

Vậy thực hiện thay đổi ô cửa đã chọn sẽ tăng xác suất trúng xe!

Mở rộng ra, nếu có $latex n$ ô cửa $latex [n\geq 3]$ thì nếu ta chọn trước một ô bất kì, Monty loại cho ta $latex n-2$ đáp án sai trong $latex n-1$ ô cửa còn lại, thì việc đổi ô cửa đã chọn ban đầu sẽ giúp ta tăng xác suất trúng xe lên $latex n-1$ lần.

Bài toán Monty Hall, đặt theo tên của ngưởi điều khiển chương trình “Let’s Make A Deal” trên truyền hình, là một bài toán rất nổi tiếng về xác suất và đã gây nhiều tranh luận ban đầu trong giới toán học. Bài toán bắt đầu với câu chuyện sau đây:

Thí sinh đứng trước 3 cánh cửa, phía sau 1 cánh cửa là 1 xe hơi, phía sau mỗi cánh cửa còn lại là 1 con dê. Thí sinh phải chọn 1 cánh cửa và lảnh giải của mình phía sau cánh cửa. Lẽ dĩ nhiên, thí sinh mong muốn chọn được cánh cửa mà phía sau có xe hơi. Khi thí sinh đã chọn 1 cánh cửa, người điều kiển chương trình không mở cánh cửa đó nhưng lại mở một cánh cửa khác có con dê phía sau và cho phép thí sinh được thay đổi ý kiến, tức là hoặc giữ cánh cửa đã chọn hoặc chọn cánh cửa khác.

Trước sự cổ võ nồng nhiệt của khán giả, người bảo “giữ nguyên”, kẻ bảo “thay đối”, thí sinh sinh ra lúng túng và thường chỉ có thể giải quyết theo cảm tính như: “chỉ còn 2 cánh cửa, may rủi như nhau, giữ nguyên hay thay đổi cũng giống nhau” hay tệ hơn: “người điều khiển chương trình chỉ cho phép thí sinh thay đổi quyết định khi thí sinh đã chọn đúng cánh cửa có xe hơi phía sau”, …

Bài toán Monty Hall đã gây ra nhiều tranh luận vì những giả thiết ban đầu của bài toán đã không được xác định rõ ràng. Những giả thiết đó như sau:

  • Người điều khiển chương trình là người ngay thẳng, luôn luôn cho phép thí sinh thay đổi cánh cửa đã chọn nếu muốn, dù biết rằng đàng sau nó có xe hơi hay không. Nếu người điều khiển chương trình không ngay thẳng thì thí sinh chỉ cần giữ sự lựa chọn ban đầu là tốt nhứt vì thí sinh chỉ được đề nghị thay đổi cánh cửa đã chọn khi đàng sau cánh cửa nầy có chiếc xe hơi!
  • Người điều khiển chương trình biết rõ cánh cửa có xe hơi phía sau. Khi ông ta mở cánh cửa, ông ta đã tránh không chọn cánh cửa nầy, nhưng chọn cánh cửa có con dê phía sau.
  • Xe hơi được được đặt một cách may rủi sau một cánh cửa bất kỳ.

Chúng ta giả thiết rằng các điều kiện cần thiết đều được thỏa trong bài toán Monty Hall nầy.

Câu chuyện trở nên sôi động khi độc giả Craig Whitaker đặt một câu hỏi cho ký giả Marilyn vos Savant trên tạp chí Parade. Câu hỏi như sau. Giả sử cô là thí sinh của trò chơi “Let’s Make a Deal”. Có 3 cánh cửa. Sau 1 cánh cửa là chiếc xe hơi, sau 2 cánh cửa còn lại là 2 con dê. Cô chọn cánh cửa số 1. Người điều khiển chương trình mở cánh cửa số 3 với con dê phía sau và hỏi cô có muốn thay đổi ý định và chọn cửa số 2 hay không? Theo cô thì giữ nguyên hay thay đổi sự lựa chọn, cái nào tốt hơn?

Trong phần trả lời, Marilyn cho là thay đổi ý định thì tốt hơn, tức là thay vì giữ ý định đã chọn cửa số 1 nên thay đổi chọn cửa số 2. Cửa số 1 chỉ có 1/3 cơ hội được xe hơi nhưng cửa số 2 có cơ hội đó đến 2/3. Marilyn còn đưa ra một thí dụ: giả sử có 1 triệu cánh cửa và chỉ có 1 cánh cửa có xe hơi phía sau còn tất cả các cánh cửa khác đều có con dê phía sau. Khi thí sinh chọn cánh cửa số 1, người điều khiển chương trình đóng hết các cánh cửa còn lại, chỉ chừa cánh cửa số 777,777 thì thí sinh sẽ nhanh chóng bỏ cánh cửa số 1 mà nhảy sang cánh cửa đó, có phải thế không?

Sau ngày giải đáp của Marilyn đăng trên báo, bàn giấy của cô tràn ngập thư của độc giả gởi đến phản đối, cho là câu trả lời của cô là sai, trong đó có thư của nhiều vị có bằng PhD, có cả giáo sư dạy về xác suất, phần lớn với lời lẽ nặng nề, có ý chê bai là Marilyn chưa hiểu gì về xác suất! [Xem bài tổng kết một số ý kiến của độc giả trong Website của Marilyn: “//marilynvossavant.com/game-show-problem/ “].

Tất cả các ý kiến phản đối đều cho rằng, dù giữ nguyên hay thay dổi sự chọn lựa ban đầu, xác suất để thí sinh chọn đúng cánh cửa có xe hơi chỉ lả 50% chớ không phải 2/3 như Marilyn đã viết. Lý luận cho kết quả đó rất đơn giản, như sau: “Khi người điều khiển chương trình mở cánh cửa số 3 có con dê phía sau, thì trước mặt chỉ còn 2 cánh cửa đóng số 1 và 2, một cánh cửa có xe hơi và một cánh cửa có con dê phía sau. Trong 2 cánh cửa đó, thí sinh phải chọn 1. Như vậy, xác suất để thí sinh chọn đúng cánh cửa có xe hơi phía sau là 1/2 hay 50%.

Nhưng …….. kết luận đó sai, theo ký giả Marilyn vos Savant!. Trong bài tổng kết các ý kiến, Marilyn bảo vệ ý kiến của mình bằng cách xét 6 trường hợp, 3 trường hợp thí sinh giữ nguyên và 3 trường hợp thí sinh thay đổi sự lựa chọn ban đầu. Để ý rằng thí sinh chọn cánh cửa số 1 và người điều khiển chương trình mở một cánh cửa có con dê phía sau:

Chủ Đề