Science Focus (issue 25)

越不可能發生的事件，一旦發生的話能提供的資訊量就越高。譬如說，一個單字裡可能沒有 Z，但並不太可能沒有 E，因此欠缺 E 將能大大縮小我們的搜索範圍。換言之， E 變成灰色方格給予我們的資訊比 Z 變成灰色方格多，因此在同樣取得五個灰色方格的情況下，猜「RAISE」的資訊量比猜「FUZZY」的多。 Shannon 熵和單字提供的資訊以上計算告訴我們猜一個單字時不幸得到五個灰色方格的資訊量，可是我們亦有機會得到不同顏色組合的方格，譬如「灰黃灰灰灰」或是「綠黃灰灰綠」。透過利用全部 2,315 個答案作分析，對於每個輸入的單字，我們都可以精確計算出得到每個可能顏色組合的概率，以及其相應的資訊量。考慮所有可能情境後，我們可以計算出一個單字在不同顏色組合下給予我們資訊量的加權平均值。這個平均值名為Shannon熵（Shannon entropy），但與物理學的熵（entropy）並沒有直接關係。有了這指標後，我們就能將所有單字以在第一回合裡可提供的資訊量排序。很多人已經透過這方法分析過 Wordle，包括著名的數學 YouTube 頻道主持 Grant Sanderson（3Blue1Brown）。第一回合應該猜甚麼？第一回合能提供最多資訊的單字是「SOARE」（5.89 位元），一個過時的用字，意思是年幼的鷹 [3]。有更好的選擇嗎？我們可以考慮接下來的幾回合，畢竟 Wordle 是個多回合的遊戲，下回合的選擇也很關鍵，因此其中一個有用的思考角度是考慮第一回合選擇的單字如何影響下一回合。假設我們第二回合有能力作出最合適的選擇，在考慮兩回合選擇給出的平均資訊量後，就能計算出第一回合的最佳選擇為「SLANE」，意指愛爾蘭一種園藝用的鏟，首兩回合平均能提供10.04位元的資訊 [3]。有些讀者可能想以最少的回合勝出 Wordle。研究人員在考慮不同第一回合選擇在首兩回合的表現後，篩選了最佳的250 個第一回合選擇，然後再用這些選擇各自執行全部 2,315 場遊戲，以找出每個選擇在遊戲中的實際表現。研究人員發現「SALET」的表現最佳，平均只需 3.412 回合就能夠勝出遊戲，而「SALET」是一款中世紀的頭盔 [4]。但實話實說，頭幾名的表現確實不相伯仲。如果你不想以太艱澀的字眼開始遊戲，「CRATE」會是一個好選擇，它在首兩回合能提供 10.01位元的資訊，平均以 3.434 回合就能贏出遊戲，不會比以上提及的艱深字眼相差太遠 [3]。最後，我們並不是建議你背誦所有可能的答案，然後像電腦般分析每一步，但一個明智的選擇也許能幫你以一局美好的遊戲，開展一個美好的早晨。 1 編按：第二個 Z 其實也能提供額外資訊；如果猜的單字跟答案均有兩個相同的字母，例如「FUZZY」和「WHIZZ」，兩個 Z 的方格都會變為黃色或綠色以表示答案包含兩個 Z。 2 編按：數值受文本來源（例如一般文件、字典等）影響。表一列出了字母在各類型英文文件中出現的頻率 [2]，但其實更準確估算概率的方法，是找出並採用每個字母出現於《紐約時報》答案列表單字中每一字元的頻率。這裡為了簡單說明概念而採用了一般英語裡的數值，但較準確的估算已經由 YouTube 頻道主持 Grant Sanderson（3Blue1Brown）實驗過 [3]。 25 References 參考資料： [1] Glaiel, T. (2021, December 30). The mathematically optimal first guess in Wordle. Medium. https://medium. com/@tglaiel/the-mathematically-optimal-first-guessin-wordle-cbcb03c19b0a [2] Lewand, R. E. (2000). Cryptological Mathematics. MAA Press. [3] Sanderson, G. (2022). [3Blue1Brown Wordle video source files] [Source code]. GitHub. https://github.com/3b1b/ videos/tree/master/_2022/wordle [4] Selby, A. (2022, January 19). The best strategies for wordle. https://sonorouschocolate.com/notes/index. php?title=The_best_strategies_for_Wordle

Made with FlippingBook

RkJQdWJsaXNoZXIy NDk5Njg=