Product Info
Description
超乎想像的化學課:原來,拉瓦節、道耳頓、亞佛加厥,還有許多科學家,竟然和我們想得不一樣!
NOW: RM 58.50 (-0%)
MEMBER: RM 52.65 (-10%)
PRODUCT INFORMATION
話說在英國劍橋的某天午后,有位女士聲稱,把茶加到牛奶裡,和把牛奶加到茶裡,兩種方法調出來的下午茶喝起來味道不同。在座的科學家都對她的說法嗤之以鼻,但有位來訪的瘦小紳士,R.A.費雪,提議要用科學的方法,來檢驗這位女士的假設…… 費雪所用的,其實就是一種統計方法。統計的觀點在十九世紀末萌芽,在接下來的一百年間茁壯,至今已大舉擴展到任何一個需要實驗、檢驗與資料分析的專門領域。 本書作者以這位喝下午茶的英國女士為起點,帶領讀者一一回顧統計學幾個重要理論的發展過程與應用,與隱身幕後的許多統計學家邂逅,看看統計這門應用範圍最廣的科學,究竟為現今世界,帶來了什麼樣的改變。
薩爾斯伯格(David Salsburg) 薩爾斯伯格為輝瑞大藥廠(Pfizer, Inc.)前資深統計研究員,目前擔任私人顧問,且為美國統計學會(ASA)會員,並獲「藥品研究暨製造學會」頒贈終生成就獎。薩爾斯伯格是康乃狄克大學統計學博士,先後任教於哈佛公共衛生學院、康乃狄克學院、康乃狄克大學、賓州大學、羅德島學院及三一學院(Trinity College);著有《The Use of Restricted Significance Tests in Clinical Trials》等專門書籍,及超過50篇科學論文。
葉偉文 1950年出生於台北市。國立清華大學核子工程系畢業,原子科學研究所碩士(保健物理組)。曾任台灣電力公司核能發電處放射實驗室主任、國家標準起草委員(核子工程類)及中華民國實驗室認證體系的評鑑技術委員(游離輻射領域)。現任台灣電力公司緊急計畫執行委員會執行祕書。 譯作有《愛麗絲漫遊量子奇境》、《矽晶之火》、《小氣財神的物理夢遊記》、《幹嘛學數學?》、《物理馬戲團1、2、3》、《數學小魔女》、《統計,改變了世界》、《數學是啥玩意?I~III》、《葛老爹的推理遊戲1、2》、《典雅的幾何》、《太陽系的華爾滋》、《一生受用的公式》、《看漫畫,學物理》、《詭論、鋪瓷磚、波羅米歐環》、《迷宮、黃金比、索馬立方體》、《統計你贏的機率》、《蘇老師化學黑白講》、《搞定幾何!—問數學博士就對了》、《別讓統計圖表唬弄你》、《搞笑學物理》、《費曼手札》、《刻卜勒的猜想》、《神奇數學117》、《蘇老師化學五四三》、《牛頓物理駕訓班》、《蘇老師化學聊是非》、《薛丁格的兔子》、《觀念化學I》、《靈魂有多重?》、《蚊子幹嘛老叮我?》、《隱藏的邏輯》、《物理早自習》、《數學嗆聲班(基礎班)》、《數學嗆聲班(進階班)》、《蘇老師生活化學快問妙答》、《物理A+班(物質與能量)》、《物理A+班(原子與量子)》、《打呵欠為什麼會傳染?》、《科學新聞不能這樣看》、《不懂科學會倒大楣》、《用科學方法解決日常生活大大小小的難題》、《不可忽視的印度》、《相對世界的美麗》等四十多種書(皆為天下文化出版)。並曾翻譯大量專業作品,散見於《台電核能月刊》。
TABLE OF CONTENT
序 與統計革命的幕後功臣相遇 薩爾斯伯格 第一章 淑女與下午茶 費雪考慮了各種實驗方法,來測試那位女士是否能分辨不同的茶。 第二章 偏斜分布 皮爾生聲稱這組分布函數,可描述數據的任何一種散布形式。 第三章 那位親愛的戈斯特先生 隨著「學生」t檢定的發展,統計分布理論悄悄在科學界擴展開來。 第四章 在肥料堆裡搜覓 羅素決定聘請費雪來看看這些堆積如山的數據,針對這些數據做一次統計審查。 第五章 作物收成變化研究 現在,費雪終於開口了:「用隨機的方法吧。」 第六章 百年難得一見的洪水 這種問題要如何用統計模型來分析呢?逖皮特找到了答案。 第七章 費雪大勝利 費雪認為純分布只是抽象的數學式,蒐集到的數據只能用來估計參數。 第八章 致命的劑量 「使用過量,什麼東西都是毒藥。」機率單位分析就是這句話的數學基礎。 第九章 鐘形曲線 不過,要假設數據是常態分布之前,中央極限定理必須成立。 第十章 適合度檢定 皮爾生發展出這種統計檢定,是為了檢驗觀測數據是否符合某種分布。 第十一章 假設檢定 尼曼發現,除非有兩個以上的可能假設,否則這種檢定毫無意義。 第十二章 是信賴,還是詐騙? 我們有多大的把握,認為參數的真值會落在估計的區間裡? 第十三章 貝氏異論 貝氏發現可以計算後面事件已發生的條件下,前面事件發生的機率。 第十四章 數學界的莫札特 柯莫格洛夫解決的第一個理論問題是:機率真正的數學基礎是什麼? 第十五章 F•N•大衛 她想當個保險精算師,但當時這個行業只招男生。 第十六章 無母數方法 威爾考克森認為自己想到一個解決問題的方法,似乎能得到答案。 第十七章 當部分優於全體 我們可以用一種隨機化的機制,由大母體當中選取出個體。 第十八章 抽菸會致癌嗎? 費雪是在處理一個深層的哲學問題:「因果關係」代表的意義究竟是什麼? 第十九章 若您要的是最佳人選…… 從斯內德克推薦科克斯開始,「最佳人選」經常是位女士。 第二十章 威爾克斯:一個樸實的農家小孩 他使盡全力,讓數理統計成為一種實用的工具。 第二十一章 家裡的天才 迪亞科尼斯一生的經歷與I•J•古德大不相同,但兩人從小都很喜歡數學謎題。 第二十二章 杜奇,統計學界的畢卡索 對正確的問題有個近似的答案,勝過對錯的問題有精確的答案。 第二十三章 處理有瑕疵的數據 把這些看似有問題的數據剔除,只會使結論產生偏差。 第二十四章 改造產業界的人 戴明認為顧客要的,並不是「完美」的產品,而是「可靠」的產品。 第二十五章 黑衣女士的忠告 坎利芙認為,統計學家的工作之一就是要告訴大眾,數字是很有趣的。 第二十六章 平賭序列的進展 奧斯陸大學的阿倫瞭解到,臨床試驗病人的反應方式就是一種平賭序列。 第二十七章 臨床研究與統計分析 找不出差異,並不代表兩種療法的效果一樣。 第二十八章 電腦萬能 這種以「基里文柯—坎特里引理」為基礎的新統計方法,只存在於高速電腦的世界裡。 第二十九章 期待下一場科學革命 在進入二十一世紀時,統計革命已在科學界取得勝利,統計觀點已經擊敗了決定論。 後記 年表
CONTENT PREVIEW OF THE BOOK
第一章 淑女與下午茶 一九二○年代後期的一個夏日午後,一群大學研究員與他們的女眷及訪客,正坐在英國劍橋的戶外餐桌旁,悠閒地享受著下午茶。忽然有位女士堅稱,下午茶的調製順序對風味有很大的影響,把茶加進牛奶裡,和把牛奶加進茶裡,兩者喝起來完全不同。席間那些有科學頭腦的紳士們都對這種說法嗤之以鼻,怎麼會不一樣?他們完全無法理解兩種混合結果的化學成分會有什麼差異。但是有個身材瘦小、嘴上的小鬍子已開始變灰白的紳士卻緊抓住這個問題。 他很興奮地說:「我們來檢定這個命題。」並立刻著手準備實驗。他調製很多杯不同的茶,有些先放茶水再加牛奶,有些先放牛奶後加茶水,然後一杯杯拿給那位主張味道不同的女士分辨。 走筆至此,我想有些讀者會對這項實驗不以為然,認為只是夏日午後的一個小消遣,他們可能會說:「這位女士能不能分辨不同茶湯的風味有什麼關係?這種芝麻蒜皮的小問題根本沒有科學價值,這些人應該把聰明才智放在一些對人類社會有貢獻的重要事情上,不應該不務正業,浪費時間。」 不幸的是,不管外行人如何看待科學與科學的重要性,依照我的經驗,大部分的科學家之所以從事研究工作,是對結果感興趣,以及能從研究過程中獲得知性的刺激與滿足。優秀的科學家很少是基於成果的重要性而努力工作的,在劍橋的那個晴朗夏日午後也是一樣。那位女士可能分辨得出不同的茶,也可能分辨不出,但其中的樂趣在於找出一種方法來判斷她的說法對不對,於是在「小鬍子」的指導下,大家開始討論該如何進行判斷。 很多人都熱心參與,協助小鬍子設計實驗的飲料,幾分鐘內,他們就採用很多不同的方法調製茶,準備給那位女士品嚐,但她並不知道每杯茶的調法。最後,答案揭曉的時刻來臨,小鬍子端給她第一杯茶,她啜了一口,然後宣稱這一杯是先放茶再加牛奶。小鬍子記下她的說法,不發一語地再送上第二杯茶…… >> 科學研究要靠合作 我是在一九六○年代末聽到這段故事的,而告訴我這個故事的人那天下午也在場。他就是史密斯(Hugh Smith,但他都以H. Fairfield Smith這個名字來發表科學論文),我認識他的時候,他是康乃狄克大學的統計學教授,而我則是在那之前兩年,拿到該校的統計學博士學位。在賓州大學教了一陣子書之後,我進入輝瑞大藥廠(Pfizer)的臨床研究部門服務,輝瑞是個大型的製藥公司,研究園區設在康乃狄克州的格羅頓(Groton),離康大所在地的史托爾斯(Storrs)大概只有一小時的車程。我在輝瑞負責處理很多困難的數學問題,當時我是他們僅有的統計學家,必須對他們把這些數學問題說清楚、講明白,並提出我的「解決方案」。 在輝瑞工作期間,我發現幾乎沒有任何科學研究工作可以獨力完成。科學研究通常需要集眾人的心力,因為太容易犯錯了;當我拿某個數學公式解決一個問題時,所用的模型有時並不恰當,或者我所給的假設不對,或是我找到的「解」是由方程式裡有問題的部分推導出來的,甚至我有可能在演算過程中出錯。 每當我去康乃狄克大學與史密斯教授討論事情,或在輝瑞與公司內的藥理學家及化學家坐在一起談論某些問題時,他們通常都會欣然接受我所提出的問題,並熱烈而興致盎然地與我討論。科學家在工作中最感興趣的,就是解決問題時那種興奮的感覺,他們在處理並設法瞭解一個問題時,是非常期盼與別人交流的。 >> 費雪和《實驗設計》 劍橋那個夏日午後的情形正是如此。留著小鬍子的紳士是費雪(Sir R. A. Fisher, 1890-1962,英國統計學家),當時差不多快四十歲了,後來被冊封為勳爵士。在一九三五年,費雪寫了《實驗設計》(The Design of Experiments)這本書,在第二章就提到那次品嚐下午茶的實驗。在書裡,費雪談到那位女士及她的看法,並把這當做一個假設性的問題。他考慮了各種可設計出的實驗方法,來測試那位女士是否能分辨不同的茶。在設計實驗時碰到的問題是,如果只拿一杯茶給她品嚐,她有百分之五十的機會猜出這杯茶的調製方法,就算她其實分不出來,也有同樣大的機會;如果給她兩杯茶,她還是有機會猜對,事實上,如果她知道這兩杯茶以不同的方法調成,她可能一次就全部猜對(或全部猜錯)。 同樣的,即使她真的可以分辨其中的不同,她還是有機會弄錯,或是其中一杯的茶與牛奶沒有充分混合,又或者在泡茶的時候,茶水的溫度不夠高,影響了茶的味道。再不然,她可能試了十杯茶,其中九杯都說對了,只有一杯說錯——就算她真的能分辨,這情況還是有可能發生。 在書裡,費雪討論了這樣一個實驗的各種可能結果,描述該如何決定要準備多少杯茶,依照什麼順序拿給她,是否該讓她知道試喝的順序以及該透露多少。他依照她的答對與否,計算出各項結果的機率。不過,他在這段討論中,從頭到尾都沒提到這種實驗是真正進行過,還是虛構的,他也沒有描述實際實驗的最後結果。 費雪這本有關實驗設計的書,是二十世紀前半掃過所有科學領域的一場革命的重要因素。早在費雪之前,科學實驗已進行了幾百年;在十六世紀末,英國醫生哈維(William Harvey, 1578-1657)就曾利用動物做實驗,他把不同靜脈與動脈裡的血流塞住,想找出血液由心臟流向肺,再從肺流回心臟,然後流向全身,最後再流回心臟的循環路線。 實驗是一種累積知識的工具,但費雪並沒有發現到這一點意義。在費雪的年代以前,實驗總帶著科學家濃厚的獨特風格,一流的科學家可以做出很有價值的實驗,產生新知識,而二流科學家只是忙於各種實驗,蒐集大量數據,但對知識的累積沒什麼用處。其中比較明顯的例子,就是十九世紀末有很多實驗都想測量光速,但並未得到決定性的結果,一直到美國物理學家邁克生(Albert Michelson, 1852-1931)設計了一系列非常複雜的實驗,利用很多平面鏡和光線,才初次得到比較好的估計值。 在十九世紀,科學家很少發表自己的實驗結果,他們僅描述結論,並公布那些能「證明」此結論真實性的數據。孟德爾(Gregor Mendel, 1822-84)並沒有把所有豌豆培育實驗的結果公布出來,而只是敘述了自己的實驗步驟,接著寫道:「兩組實驗中的前十株豌豆或許能做為一個實例,來說明……」(在一九四○年代,費雪檢驗了孟德爾提出的數據「實例」,發現這些數據完美得不像真的,根本沒有展現應有的隨機程度。) 雖然科學是從審慎思考、觀測與實驗發展而成的,但究竟要怎麼做實驗,卻從來沒有人提及,所有的實驗結果通常也不會公布出來給大家看。 >> 考量科學問題的第一步:實驗數據 在十九世紀末至二十世紀初的農業研究中,上述情況更為明顯。二十世紀初,費雪任職於羅森斯特農業試驗所(Rothamsted Agriculture Experimental Station),在他到職之前,該試驗所已進行實驗研究各種不同的人工肥料,前後長達九十多年。他們的做法大致如下:先將磷肥與氮肥的混合物均勻撒在整片田裡,然後種植作物,在收成時再記錄收穫量及該年夏季的雨量。他們會精心選用公式,以「調整」每塊田或每年的收成量,以便比較不同的田的收穫量,或同一塊田在不同年度的產量。他們稱這些公式為「肥力」(fertility index),每個農業試驗所都擁有自己的肥力,並且相信它比別人的指數更準確。 九十多年的實驗成果,僅是一大堆未經發表、毫無用處的混亂數據:有些品種的小麥似乎對某種肥料的反應優於其他品種,但這情形只發生在降雨過量的年度;而其他實驗似乎顯示,若第一年施用鉀硫化物,第二年改用碳酸硫化物,會使某些品種的馬鈴薯產量增加,但對別的品種無效。這些人工肥料實驗最多只能透露,其中某些肥料大概、或許、也許在某些時候對某類農作物有用,其他細節統統不知道。 身為一個卓越的數學家,費雪首先研究的,就是這些農業科學家用來修正實驗結果的肥力,進而以該指數解釋不同年度天氣變化所造成的差異,最後再檢驗其他農業實驗單位使用的肥力。當他把這些指數化簡為基本代數式時,卻發現這些指數根本就是相同公式的不同變化形式,換句話說,長久以來彼此激烈競爭的不同指數,所做出來的結果實際上是完全相同的。一九二一年,他在重量級農業期刊《應用生物學年報》(Annals of Applied Biology)上發表論文,指出用哪種肥力並沒有任何差異,他同時表示,這些調整不足以表示不同田地在收成上的差異。這篇非凡的論文,為一場延燒二十年的科學論戰畫上了休止符。 接下來,費雪繼續研究過去九十年間降雨量和作物收成的數據,發現降雨量對農作物產量的影響,遠大於肥料對產量的作用;若借用後來費雪在發展實驗設計理論時所用的字眼,我們會說「各年天氣差異」與「各年人工肥料的不同」這兩個變數是交絡的(confounded),意思就是,靠這些實驗數據,我們沒有辦法區分這兩種因素對作物收成的影響。搞到最後,九十年來的實驗與二十多年的科學論戰幾乎是白忙一場,毫無收穫! 這件事讓費雪開始思考實驗與實驗設計的問題,而他最後的結論是,科學家應該從潛在實驗結果的數學模型著手。他所說的數學模型,是指一組方程式,其中有些符號代表我們想經由實驗蒐集到的數據,而其餘的符號則代表實驗的全部結果。在考量科學問題時,科學家必須先從實驗中取得數據,再由這些數字計算出恰當的結果。 我們現在來看看下面這個「老師與學生一對一」的簡單例子。老師想找個方法,瞭解一下某學生的學習成效,因此他做了一個「實驗」:他給這個學生一組試題,每道試題的評分範圍都介於0到100分之間。只靠一次考試的分數,很難判定學生的學習成效。可能他剛好沒讀到考卷上的那一點東西,卻弄懂許多沒出現在考卷上的東西;可能在考試當天他正好頭疼,身體不舒服;又或許他那天早晨被父母責備,所以心情不好。總而言之,很多原因會使學生的某一次考試表現失常。因此,這個老師打算採用多次小考,再以所有小考的平均分數評量學生的表現,這比只考一次試要好得多。在這個例子中,學生的學習成效是實驗的結果,而每次小考的分數就是數據。 那麼老師應該怎麼進行這些小考呢?這些小考是不是只要涵蓋幾天前剛教過的內容?或是也要包括先前教過的所有範圍?他應該每週考一次?還是每天考?或者在每個單元結束的時候考?這些都是在設計實驗時需考慮的問題。 農業科學家想知道某種人工肥料對小麥生長有什麼影響時,他所做的實驗要能提供必要的數據,讓他能估計這項影響。費雪指出,在設計這種實驗的時候,第一步是要建立一組數學方程式,描述欲蒐集的數據與待估計結果之間的關係,因此,有用的實驗必須是能夠提供估計值的實驗。費雪還強調,此實驗必須是特定的,使科學家能夠決定不同的實驗結果到底是由天氣的不同造成的,或是不同人工肥料所造成的,特別是必須包含同一實驗裡欲加以比較的所有處理(treatment,即任何加諸於個體的特定實驗條件)。 >> 數學為實驗之本 在《實驗設計》一書裡,費雪舉了幾個實驗設計的絕佳範例,並推導出優良設計的一般規則。但是,費雪提出的方法牽涉到非常複雜的數學,因此大部分的科學家沒有辦法自行設計所需的實驗,只能按照費雪在書裡提供的設計範例,依樣畫葫蘆。 那些農業科學家瞭解到費雪實驗設計的偉大價值,因此不久之後,費雪的方法就成為英語系國家在農業科技上的主流學派。在這之後,整個科學界以費雪的研究為起點,發展出描述不同實驗設計的方法,這些實驗設計已廣泛應用於農業之外的領域,包括醫學、化學與工業上的品質管制。很多例子都用到了深奧且複雜的數學,但此時此刻,我們不妨停下來想一想,科學家總不能一想到什麼主意,就馬上捲起袖子「做實驗」吧?實驗進行前必須經過一段時間的謹慎思考——這當然也包括了很多高深的數學。 至於那位試喝下午茶的女士最後怎麼了?費雪並沒有描述那個夏日午後在劍橋所做的實驗結果。但史密斯教授告訴我,她分辨出每一杯茶,完全答對。厲害吧!