Vietlott và BIRTHDAY PARADOX (Nghịch lý ngày sinh nhật).

Từ câu chuyện nghe trên xe bus.


Đó là hồi chuẩn bị thi cuối kỳ 1 năm 4 đại học, trên chuyến xe bus 202 về quê, đang say sưa đọc Tru Tiên thì đài phát thanh trên xe nói về việc "các chuyên gia lý giải việc vì sao xổ số Vietlott lại dễ trúng đến thế". Vài hôm trước mình nghe thằng bạn cũng thử mua 1 vé 10k thì vé đó trúng giải 30k; tuy là không đáng bao nhiêu nhưng công nhận là dễ trúng hơn xổ số kiến thiết thật. Well, nghe một chút xem sao.

Sau khi nghe các chuyên gia giải thích 1 hồi, mình cảm thấy buồn cười quá, vì không biết đấy là giải thích vấn đề hay trình bày vấn đề nữa. Các lý do đưa ra rất là mơ hồ, đang đi chứng minh "vì sao tỷ lệ trúng cao" thì các ông vừa nói thao thao bất tuyệt, vừa lấy lý do trúng nhiều để khẳng định lại điều đó, chứ không thấy câu giải thích nào nghe hợp lý cả, ngộ nhận vcđ. Bla bla bla ... .

Tuy nhiên, mình cũng thấy thêm hiếu kỳ vì cái Vietlott này. Tự nhiên mình liên tưởng đến bài toán Balls - into - Bins trong môn Toán Chuyên Đề mà Sư Phụ dạy trên lớp hồi kỳ 2 năm 3. Nhưng hình như có vẻ không cần thiết đến mức dùng Balls - into - Bins. Cái ta cần khảo sát ở đây là xác suất trúng giải của 1 tờ vé số Vietlott, mà để tờ vé số đó là tờ trúng giải thì cần ít nhất 1 trong bộ 6 số của tờ vé đó phải trùng với 1 số trúng giải được quay ra. Vậy vấn đề ở đây có vẻ giống với việc tính xác suất giống nhau giữa 2 số được chọn trong 1 bộ 45 số của Vietlott thì đúng hơn.

Do vậy, mình đã nghĩ đến bài toán Birthday Paradox cũng được học trong môn Toán Chuyên Đề của Sư Phụ dạy. Công nhận là có nhiều điểm khớp nhau thật. Nếu như ở Birthday Paradox, ta khảo sát việc 2 học sinh cùng lớp có cùng ngày sinh với nhau hay không, thì ở Vietlott này, ta có thể khảo sát việc 2 số trong cùng 1 bộ 45 số (1 số trong tờ vé của mình và 1 số trong giải trúng thưởng) có giống nhau hay không. Do vậy, bộ 45 số của Vietlott sẽ tương ứng với 45 học sinh trong cùng 1 lớp học. Vcđ, theo như kết quả đã tính toán, chỉ cần 1 lớp có 23 thằng thôi, xác suất để tìm ra 2 thằng cùng ngày sinh với nhau cũng lớn hơn 50% cmnr; mà đây có đến 45 thằng, thôi có vẻ nát thật rồi!

Vậy là sau 1 hồi liên tưởng và tổ lái suy nghĩ đi từ cái này đến cái khác, mình cũng đã xác định được phương án có thể khảo sát được Vietlott. Nhưng khổ nỗi đang trên xe bus, mình cũng chẳng pro j môn Toán Chuyên Đề của Sư Phụ cả, nên giờ muốn làm Toán thì phải có giấy bút và xem lại giáo trình môn đó chứ chịu không ngồi nhẩm nhẩm xuất thần được. Sao lại có cái môn Toán vừa khó vừa hay thế nhỉ! Thôi đọc truyện tiếp, về nhà tính sau.

Cho đến việc tính ra xác suất của Vietlott.


Sau khi đã nháp ra cả 1 đống, mình cũng tìm ra kết quả và tổng hợp lại như sau.
  1. Birthday Paradox (nghịch lý Ngày sinh nhật): Trong 1 lớp học có k người, xác suất để tồn tại ít nhất 2 người cùng ngày sinh là bao nhiêu (ngày sinh bao gồm ngày/tháng).

    - Giả sử 1 năm có 365 ngày, do đó mỗi người sẽ có 365 khả năng về ngày sinh.
    - Do có k người, nên không gian mẫu sẽ có tất cả  số ngày sinh là: \[\Omega  = {365^k}\] 
    - Gọi A là số khả năng để không ai trong lớp cùng ngày sinh với nhau, nên A là chỉnh hợp chập k của 365 phần tử, tức là: \[A_{365}^k\]

    - Do đó, xác suất để không ai trong lớp cùng ngày sinh với nhau là:
    \[\overline P  = \frac{A}{\Omega } = \frac{{A_{365}^k}}{{{{365}^k}}} = \frac{{365!}}{{\left( {365 - k} \right)!\,\,365!}}\]
    - Vậy, xác suất để tồn tại 2 người cùng ngày sinh với nhau là:
    \[P = 1 - \overline P  = 1 - \frac{{365!}}{{\left( {365 - k} \right)!\,\,365!}}\]
    Với k = 23, ta thu được P xấp xỉ 0.5073 > 50%. Do đó, trong 1 lớp có 23 người, xác suất tồn tại 2 người cùng ngày sinh sẽ lớn hơn 50%.

    Với bản thân mình thì khẳng định này khá đúng. Có nhiều tập thể mình tham gia mà có người cùng ngày sinh với mình.

    Trong lớp KSTN - CNTT K58 hồi đại học của mình cũng có 1 thằng tên nghe kêu vãi *beep* - Thái Quý Đại Nhân - cùng ngày sinh với mình; nó với mình tuy sinh cùng ngày cùng tháng cùng năm, học cùng 1 lớp, nghiên cứu cùng 1 Lab nhưng 2 mảng khác nhau, cùng 1 Sư Phụ chỉ dạy, nhưng 2 thằng thường bảo vs nhau là không nguyện chết cùng năm cùng tháng cùng ngày. :LOL: Và đương nhiên nó bá đạo hơn mình nhiều lắm!

    Em trai của ông anh kết nghĩa của mình cũng sinh cùng ngày với mình (nhưng hơn mình 3 tuổi). Do đó ông anh mình thường bảo có 2 thằng em GSTT cùng sinh nhật. Nhưng nếu so với anh ấy thì đúng là Chu Tước so với Phượng Hoàng!

    Lớp tiếng Anh ở Hoangology English hồi hè năm 3 mình học, cũng có 1 em gái sinh cùng ngày tháng với mình (nhưng kém mình 1 tuổi). Đương nhiên em ấy xinh gái hơn mình sure cmnr!

    Well done, Birthday Paradox quá mạnh! Tiếp sau đây mình sẽ phân tích kỹ Birthday Paradox để đem áp dụng nó vào con Vietlott.
  2. Phân tích Birthday Paradox: Giả sử trong N ngày, cần tìm xác suất để k người không trùng ngày sinh với nhau.

    - Xác suất để người thứ nhất sinh vào 1 ngày nào đó trong N ngày là:
    \[{p_1} = \frac{1}{N}\]
    - Bây giờ, ta bắt đầu tính các xác suất để k người không cùng ngày sinh với nhau. Bắt đầu với xác suất để người thứ hai không cùng ngày sinh với người thứ nhất là:
    \[{p_2} = 1 - \frac{1}{N}\]
    - Xác suất để người thứ ba không cùng ngày sinh với 2 người đầu là:
    \[{p_3} = 1 - \frac{2}{N}\]
    - Cứ lặp lại như vậy cho đến người thứ k không cùng ngày sinh với (k - 1) người đầu là:
    \[{p_k} = 1 - \frac{{k - 1}}{N}\]
    - Do đó, xác suất để k người này không cùng ngày sinh với nhau là:
    \[\overline P  = \left( {1 - \frac{1}{N}} \right)\left( {1 - \frac{2}{N}} \right)...\left( {1 - \frac{{k - 1}}{N}} \right)\]
    - Tiến hành Logarit Napier (logarit tự nhiên) cả 2 vế, ta được:
    \[\ln \overline P  = \ln \left( {1 - \frac{1}{N}} \right) + \ln \left( {1 - \frac{2}{N}} \right) + ... + ln\left( {1 - \frac{{k - 1}}{N}} \right)\]
    - Mà với x nằm trong (0; 1), ta có bất đẳng thức:
    \[\ln \left( {1 - x} \right) <  - x\]
    - Bất đẳng thức này có thể dễ dàng chứng minh bằng kiến thức liên quan đến đạo hàm được dạy ở lớp 12 nhé, đạo hàm 1 phát duy nhất, rất đơn giản nên mình không chứng minh mà sử dụng luôn.
    - Áp dụng bất đẳng thức vào biến đổi, ta được:
    \[\ln \overline P  <  - \left( {\frac{1}{N} + \frac{2}{N} + ... + \frac{{k - 1}}{N}} \right) =  - \frac{{1 + 2 + ... + \left( {k - 1} \right)}}{N} = \frac{{ - k\left( {k - 1} \right)}}{{2N}}\]
    - Do đó, ta thu được xác suất để trong nhóm k người này, không ai có cùng ngày sinh là:
    \[\overline P  < {e^{\frac{{ - k\left( {k - 1} \right)}}{{2N}}}}\]
    - Vậy xác suất để nhóm k người này có ít nhất 2 người cùng ngày sinh là:
    \[P = 1 - \overline P  > 1 - {e^{\frac{{ - k\left( {k - 1} \right)}}{{2N}}}}\,\,\,\left( * \right)\]
    Vậy là ta đã thu được công thức tổng quát tính xác suất để có hiện tượng cùng ngày sinh với nhau, nghĩa là có ít nhất 2 người cùng ngày sinh với nhau. 

  3. Áp dụng vào xổ số Vietlott.Giả sử 1 người mua 1 tờ vé số Vietlott, áp dụng công thức tổng quát trên với các tham số được xác định trong trường hợp của xổ số Vietlott, ta có:
    - Bộ 45 số được lựa chọn (từ 01 - 45), do đó N = 45.
    - 6 lựa chọn cho mỗi tờ vé, do đó k = 6.
    - Ở đây, ta sẽ khảo sát sự trùng nhau giữa các số được chọn và bộ số trúng thưởng.
    - Nên xác suất để tờ vé số đó trúng giải (trùng ít nhất 1 số):
    \[P > 1 - {e^{ - \frac{{6*5}}{{2*45}}}} \approx 0.2835\]
    - Do đó, xác suất để tờ vé số đó trúng full bộ 6 số là:
    \[billionaire = {P^6} > 5.1884*{10^{ - 4}}\]
    Well, từ 2 kết quả thu được trên, ta thấy rằng 1 tờ vé số Vietlott có xác suất trúng giải là 28%, và xác suất để nó trúng giải độc đắc là xấp xỉ 0.05%. Cả 2 tỷ lệ trên, nếu đem so sánh với xổ số kiến thiết truyền thống thì cái nào cũng cứ gọi là cao hơn vcđ luôn. Do vậy, việc có nhiều người trúng Vietlott cũng là điều hiển nhiên thôi; cũng là do đặc tính bản thân của loại xổ số này mà ra. 

Kết


Bản thân mình thấy có phần cũng bá đạo vãi *beep* sau khi tìm ra được những kết quả trên. Nào là "không uổng công Sư Phụ dạy môn Toán Chuyên Đề", rồi là "*beep* ngờ được là mình có thể hiểu và đem áp dụng vào thực tế",... . Nhưng mà nghĩ lại thấy đây cũng chẳng qua chỉ là 1 vấn đề tiêu khiển thôi, chẳng có cái khỉ gió j là thực tế cả, mới sử dụng được có một chút võ vẽ mà đã có suy nghĩ tinh tướng thế này rồi, thế thì khiêm nhường ở đâu ra.

Lúc đầu mình nghĩ cái xổ số này xuất hiện là để làm công cụ rửa tiền, chắc sẽ có nhiều người trúng giải lắm; khi nào không cần rửa tiền nữa thì lại héo người trúng jackpot ngay ấy mà. Giờ tìm ra cái công thức này thì cũng có ai quan tâm mà đem sử dụng cái công thức xác suất này đâu!
Tuy nhiên mình cũng thấy vui vì không ngờ có thể đem áp dụng kiến thức học đc ở trường lớp vào thực tế, mà lại còn là thực tế cuộc sống chứ không phải thực tế công việc.

Thực tế, Birthday Paradox có ứng dụng rất mạnh mẽ trong An toàn thông tin; cụ thể có một hình thức tấn công liên quan đến nó, có tên là Birthday Attack (tấn công Ngày sinh nhật). Cái trò tấn công này ảo diệu lắm, ảo diệu như là tư tưởng của Birthday Paradox vậy; nhìn qua thì tưởng là nghịch lý, nhưng thực chất cái làm cho ta nghĩ nó là "nghịch lý" lại chính là cảm quan của chúng ta về hiện tượng Birthday.
Hầu như ai chả nghĩ là 1 năm có 365 ngày thì trong lớp cũng phải có hơn 182 người mới đảm bảo rằng sẽ có khả năng 50% là có 2 người cùng ngày sinh; nhưng mà nếu bạn ốp k = 182 và N = 365 vào công thức tổng quát của Birthday Paradox thì bạn sẽ thu được một kết quả xác suất kinh ngạc đến mức nghịch lý, và đó chính là lý do vì sao Birthday Paradox lại được người ta gọi là Paradox!

Nhận xét

Đăng nhận xét

Bài đăng phổ biến từ blog này

Trên con đường tu đạo luôn cực kỳ theo đuổi!

C++ Con trỏ (Pointer) toàn thư: Phần 4: Con trỏ "đa cấp". Đánh nhau bằng con trỏ.

Vừa ngộ ra sự vi diệu của Padding Oracle Attack thì được tin crush hồi lớp 12 sắp cưới.