倖存者
#study_design
蘇子廷
群體健康數據中心,國立成功大學 , Taiwan
2026/05/13

    1943年,第二次世界大戰的戰事漸趨白熱化,在這一年的1月14日至24日,美國總統羅斯福(Franklin Delano Roosevelt)和英國首相邱吉爾(Sir Winston Leonard Spencer Churchill)在盟軍攻下北非的卡薩布蘭加後,隨即在當地召開了卡薩布蘭加會議。會議中除了討論在非洲等地的作戰策略外,雙邊針對削弱納粹德國的工業實力和軍事能力為目標也達成了協議,於是在數個月後,展開一系列大規模的戰略轟炸行動,也就是「聯合轟炸攻勢(Combined Bomber Offensive)」。這個作戰計劃中,由美國第八航空隊(Eighth Air Force)執行日間轟炸任務,並在夜間由英國皇家空軍負責加強對德軍不間斷的空襲作戰。

    然而德軍也絕非省油的燈,在執行轟炸攻勢不久後,第八航空隊就面臨了一個嚴重的問題:太多轟炸機在執行任務時被德軍擊落了。根據統計,光是在十月的「黑色星期四(Black Thursday)」一役,所派遣出去的291架轟炸主力——B-17飛行堡壘中,就有77架在當天折損,此外還造成上百架包含B-24解放者等轟炸機的損害,更別提數以千計的人員傷亡了。為了提高轟炸機的存活率,軍方找來了哥倫比亞大學的統計研究小組(Statistical Research Group, SRG)的研究者,希望 SRG 能利用統計分析,了解飛機受損的情形並提供建議,告訴他們應該在飛機的哪些部位加強裝甲。於是他們提供了大量返航飛機的受損報告,這些數據顯示機翼、機身和尾部都有大量彈痕。

    正當大多數的研究人員都在討論如何加強這些經常被擊中部位的防護時,研究小組中的亞伯拉罕・沃德(Abraham Wald)卻提出了一個截然不同的觀點。他發現這些資料存在一個根本且關鍵的問題,那就是所收集的數據只來自於能夠返航的飛機。在 SRG 的辦公室裡,沃德仔細分析了各種數據,包括 B-17、B-24 等不同機型的受損統計。他發現,在返航飛機的數據中,某些關鍵部位(如駕駛艙、油箱和發動機區域)的受損記錄異常稀少。這不是因為這些部位不容易被擊中,而是因為被擊中這些部位的飛機,根本就無法返航。沃德的觀察與想法很快就被軍方納入採用。同一時間,SRG也擴大研究範圍,收集並分析各種軍用飛機的數據,發現都有共同的趨勢。於是他們建立的分析方法很快被應用到整個空軍機隊。經過改良後的飛機存活率顯著提升,拯救了無數飛行員的生命。甚至相關的分析概念,在戰後的韓戰、越戰,以及近代民用飛機的設計上都被採用。

    這段歷史是「倖存者偏差(survivorship bias)」的經典案例,提醒我們在分析問題時,不只是分析我們所看到或所擁有的資訊,更重要的是要去思考那些「看不見的」、「未被納入」資料可能隱含著什麼重要的的訊息。在這個例子中,只有那些能夠活過敵軍攻勢的飛機,才有機會被觀察到彈孔的分布並被納入分析。

想了解關於資料科學的小知識,或是學習更多真實世界數據分析的技術嗎?歡迎追蹤我們的網站threadsFacebookInstagram喔~

 

Reference:

  1. PDFDenosumab.pdf