Science Focus (issue 25)

越不可能發生的事件,一旦發生的話能提供的資訊量 就越高。譬如說,一個單字裡可能沒有 Z,但並不太可能沒 有 E,因此欠缺 E 將能大大縮小我們的搜索範圍。換言之, E 變成灰色方格給予我們的資訊比 Z 變成灰色方格多,因 此在同樣取得五個灰色方格的情況下,猜「RAISE」的資訊 量比猜「FUZZY」的多。 Shannon 熵和單字提供的資訊 以上計算告訴我們猜一個單字時不幸得到五個灰色 方格的資訊量,可是我們亦有機會得到不同顏色組合的 方格,譬如「灰黃灰灰灰」或是「綠黃灰灰綠」。透過利用 全部 2,315 個答案作分析,對於每個輸入的單字,我們都 可以精確計算出得到每個可能顏色組合的概率,以及其相 應的資訊量。 考慮所有可能情境後,我們可以計算出一個單字在不同 顏色組合下給予我們資訊量的加權平均值。這個平均值名 為Shannon熵 (Shannon entropy),但與物理學的熵 (entropy)並沒有直接關係。有了這指標後,我們就能將 所有單字以在第一回合裡可提供的資訊量排序。很多人已經 透過這方法分析過 Wordle,包括著名的數學 YouTube 頻 道主持 Grant Sanderson(3Blue1Brown)。 第一回合應該猜甚麼? 第一回合能提供最多資訊的單字是「SOARE」(5.89 位 元),一個過時的用字,意思是年幼的鷹 [3]。 有更好的選擇嗎?我們可以考慮接下來的幾回合,畢竟 Wordle 是個多回合的遊戲,下回合的選擇也很關鍵,因此 其中一個有用的思考角度是考慮第一回合選擇的單字如何 影響下一回合。假設我們第二回合有能力作出最合適的選 擇,在考慮兩回合選擇給出的平均資訊量後,就能計算出第 一回合的最佳選擇為「SLANE」,意指愛爾蘭一種園藝用的 鏟,首兩回合平均能提供10.04位元的資訊 [3]。 有些讀者可能想以最少的回合勝出 Wordle。研究人員 在考慮不同第一回合選擇在首兩回合的表現後,篩選了最佳 的250 個第一回合選擇,然後再用這些選擇各自執行全部 2,315 場遊戲,以找出每個選擇在遊戲中的實際表現。研究 人員發現「SALET」的表現最佳,平均只需 3.412 回合就能 夠勝出遊戲,而「SALET」是一款中世紀的頭盔 [4]。 但實話實說,頭幾名的表現確實不相伯仲。如果你不想 以太艱澀的字眼開始遊戲,「CRATE」會是一個好選擇,它 在首兩回合能提供 10.01位元的資訊,平均以 3.434 回合 就能贏出遊戲,不會比以上提及的艱深字眼相差太遠 [3]。 最後,我們並不是建議你背誦所有可能的答案,然後像電腦 般分析每一步,但一個明智的選擇也許能幫你以一局美好 的遊戲,開展一個美好的早晨。 1 編按:第二個 Z 其實也能提供額外資訊;如果猜的單字跟答案均有兩個相同 的字母,例如「FUZZY」和「WHIZZ」,兩個 Z 的方格都會變為黃色或綠色 以表示答案包含兩個 Z。 2 編按:數值受文本來源(例如一般文件、字典等)影響。表一列出了字母在 各類型英文文件中出現的頻率 [2],但其實更準確估算概率的方法,是找出 並採用每個字母出現於《紐約時報》答案列表單字中每一字元的頻率。這 裡為了簡單說明概念而採用了一般英語裡的數值,但較準確的估算已經由 YouTube 頻道主持 Grant Sanderson(3Blue1Brown)實驗過 [3]。 25 References 參考資料: [1] Glaiel, T. (2021, December 30). The mathematically optimal first guess in Wordle. Medium. https://medium. com/@tglaiel/the-mathematically-optimal-first-guessin-wordle-cbcb03c19b0a [2] Lewand, R. E. (2000). Cryptological Mathematics. MAA Press. [3] Sanderson, G. (2022). [3Blue1Brown Wordle video source files] [Source code]. GitHub. https://github.com/3b1b/ videos/tree/master/_2022/wordle [4] Selby, A. (2022, January 19). The best strategies for wordle. https://sonorouschocolate.com/notes/index. php?title=The_best_strategies_for_Wordle

RkJQdWJsaXNoZXIy NDk5Njg=