Home
大演算：機器學習的終極演算法將如何改變我們的未來，創造新紀元的文明？

Product Info Description Review

大演算：機器學習的終極演算法將如何改變我們的未來，創造新紀元的文明？

The Master Algorithm: How the Quest for the Ultimate Learning Machine Will Remake Our World

Author Name: 佩德羅．多明戈斯

Original Author Name: Pedro Domingos

Translator:張正苓,胡玉城

USUAL: RM95.50

NOW: RM 95.50 (-0%)

MEMBER: RM 85.95 (-10%)

Qty:

Quantity

In Stock.
Estimated day(s) of Delivery: 3 working days(Orders placed before 3pm ).

Qty:

Rate this product

Product Info

ISBN/Ean:

9789863426677

Published Date:

2016/08/05

No. Of Pages:

528

Publisher:

三采

Date Added:

2016/08/19

Edition:

初版

Product Size(CM):

14.8x21.0

Country Of Publication:

台灣

Language :

中文/繁體

Binding Type:

精裝

Printing Color:

單色

Category:

All Departments > Chinese Books > 财经商管 > 市场行销

All Departments > Chinese Books > 科学/电脑/摄影 > 科技电脑

Wrong Category?

View All

PRODUCT INFORMATION
RECOMMENDED BY
TABLE OF CONTENT
PREFACE/READING GUIDANCE
CONTENT PREVIEW OF THE BOOK

Description

Font Size

Description

★亞馬遜AI與機器學習類暢銷榜　第1名 ★亞馬遜數學與統計類暢銷榜　第1名 ★亞馬遜資訊理論類暢銷榜　第1名 ★CNN、《新科學人》、《經濟學人》、《柯克斯書評》等多家媒體推薦報導 ★比爾．蓋茲年度選書！　　揭開大數據、人工智慧、機器學習的祕密，　　打造人類文明史上最強大的科技——終極演算法！　　有一個終極演算法，可以解開宇宙所有的祕密，　　現在大家都在競爭，誰能最先解開它！　　．機器學習是什麼？大演算又是什麼？　　．大演算如何運作與發展，機器可以預測什麼？　　．我們可以信任機器學過的東西嗎？　　．商業、政治為什麼要擁抱機器學習？　　．不只商業與政治，醫學與科學界也亟需機器學習，包含DNA解碼、癌症藥品開發等。　　．你擔心人類會被大演算所取代嗎？可以避免嗎？該如何做？　　華盛頓大學電腦工程系教授佩德羅．多明戈斯（Pedro Domingos）破解了一個在機器學習領域中長久以來的瓶頸，成功把機器學習、哲學與人工智慧結合起來，這個突破性研究還登上了《新科學人》（New Scientist）雜誌的封面故事。　　他指出，機器學習有五大思想學派，每個學派有主要的演算法，能幫我們解決特定的問題── 　　．符號理論學派：將學習視為是逆向演繹法，從哲學、心理學和邏輯思路方面取得概念　　．類神經網路學派：導傳遞演算法可以模擬人腦思考行為，是受到神經科學和物理學的啟發　　．演化論學派：遺傳程式規劃會在電腦上模擬演化，澈底運用遺傳基因和演化生物學理論　　．貝氏定理學派：相信學習是機率推理的形式，是根據統計學的理論　　．類比推理學派：支持向量機從相似度判斷進行推論學習，並受到心理學和數學的影響　　多明戈斯認為，如果有人可以成功整合這些演算法的優點，　　就能發展出「終極演算法」，便可以從大數據與人工智慧中，　　獲得世界上過去、現在與未來的所有知識，將創造新紀元的文明。　　站在大數據與文明終將合一的浪潮上，　　終極演算法將帶領我們，望見未來。　　【為什麼你必須知道大演算？】　　◎如果你是一般市民或決策人士　　讓你了解大演算的來龍去脈，從隱私到未來的工作與機器人戰爭的倫理，　　你將會看到真正的問題在哪裡，並思考如何看待這些問題。　　◎如果你要把機器學習運用在工作上　　不管你在哪個行業、什麼職業別，機器學習能幫你省下人工編寫程式的費用，　　避免資訊系統僵化，並預測未來你會面臨的科技發展，　　甚至讓你成為精準的市場分析家、解讀大數據的科學家。　　◎如果你是科學家或工程師　　過去的數學和現有資訊學習與數據分析，不會讓你有任何改變。　　機器學習將讓你具備非線性分析，帶給你嶄新的科學世界觀，有所突破。　　◎如果你是機器學習專家　　雖然你應該很熟悉機器學習，但本書仍會提供給你許多新的想法、　　機器學習發展史上有價值的資訊、有用案例與類似的情境，　　甚至提供給你機器學習的嶄新觀點，啟迪你全新的思考方向。　　◎如果你是任何學齡階段的學生　　目前世界各地極度缺乏機器學習專家，這是現在也是未來最受關注的領域。　　未來，不只局限現有的資訊工程、電機工程等相關科系，　　無論是醫學、醫工、生物科技、行銷、電商、社會、心理、哲學、教育、財經等各科系，　　機器學習終將與這些領域整合，現在了解大演算，你就不會被趨勢潮流所淘汰。

View All

PRODUCT INFORMATION

AUTHOR INFORMATION :

作者簡介佩德羅．多明戈斯（Pedro Domingos）　　電腦工程博士，現任華盛頓大學電腦工程系教授，該系是全美前十大電腦工程名校。他初試啼聲聞名圈內是兩度在資料採礦大會上獲得最佳論文，並在此後成為該領域的意見領袖。他在專業領域內獲獎無數，還包含美國國家科學職業成就奬，他也是史丹佛大學及麻省理工學院客座教授。　　他最有名的功績是破解了一個在機器學習領域中長久以來的瓶頸，成功把機器學習、哲學與人工智慧結合起來。這個突破性的研究還曾經登上著名的《新科學人》（New Scientist）雜誌的封面故事。　　他在華盛頓大學開設的機器學習課程，一向都是該校最受歡迎的課程之一。　　電腦工程學術背景的他，卻不是個嚴肅學究，他擅長公開演說，傳達機器學習與大數據的相關知識，經常受邀公開演講。他對寫作非常有興趣，曾經鑽研過寫作課，師承《辛德勒的名單》作者湯瑪斯．肯納利。　　除了電腦科技的學術論文，他也經常撰寫音樂技術相關的專欄文章。因為他年輕時代曾經是個搖滾樂團的鍵盤手。該樂團還曾經與EMI簽約，經常四處表演，當時他除了是鍵盤手，還是負責接受媒體採訪的人。他離開樂團，是因為要專心攻讀電腦科學博士，他很早就對機器學習興趣濃厚，因為他認為，這是最後會統治世界的一種關鍵技術。審訂者簡介成大資工系特聘教授兼系主任／謝孫源　　臺灣大學資訊工程系博士，現為成功大學資訊工程系特聘教授兼系主任。　　主要研究領域為演算法設計與分析及其應用。他曾榮獲行政院國科會97年度傑出研究獎、科技部104年度傑出研究獎、中華民國資訊學會李國鼎穿石獎、中國電機工程師學會傑出電機工程教授獎、中國工程師學會傑出工程教授獎、第十三屆有庠科技論文獎(資通訊領域)、中華民國102年資訊月傑出資訊人才獎、並獲選為英國皇家資訊學會會士。　　謝教授並貢獻其所學於資訊教育上，曾於2003及2016擔任國際資訊奧林匹亞競賽國家隊指導教授，指導國手參加國際資訊奧林匹亞競賽榮獲佳績。

TRANSLATOR INFORMATION :

張正苓　　淡江大學資訊管理所碩士畢業。　　曾擔任美國CNET財經版即時新聞翻譯、美國宏碁大觀園矽谷時報新聞編譯、東森寬頻數位內容副理、美國華爾街財經系列書編譯。胡玉城　　政治大學傳播學院EMA碩士畢業。　　曾擔任工商時報科技記者與召集人、科技島副總編輯、中時分類廣告副總經理、美國矽谷時報執行副總編輯、東森寬頻副總經理、太平洋寬頻副總經理、美國休士頓城市電通共同創辦人與美國阿肯色WoConn總經理。　　現任美國矽谷天使交易所、美國馬里蘭紅點行動支付 ReeDot Inc.共同創辦人。　　著有暢談類神經網路與華爾街股市總覽等相關書籍。

RECOMMENDED BY

專業推薦　　王國禎｜交大資工系系主任　　林泰宏｜前臺灣微軟合作夥伴技術支援顧問　　林蔚君｜亞洲大學副校長　　張宗堯｜美商凱博數據創辦人／總經理　　陳明義｜資策會技術長／大數據所所長　　陳縕儂｜美國微軟研究所研究員　　趙坤茂｜臺大資工系系主任　　謝孫源｜成大資工系特聘教授兼系主任　　簡禎富｜清華講座教授暨清華-台積電卓越製造中心主持人　　「大至預測變化萬千的商業潮流的走向，到小至預知是否能成功約到心儀對象，都屬於《大演算》的範疇。本書作者以極盡生動活潑的闡述及例子，與讀者分享如何將機器學習演算法應用於日常生活中，甚至可以應用於學習治療癌症。」──交大資工系系主任　王國禎　　「我們生活在一個充滿數據與機器學習的環境。無論是在網路或實體世界，我們的一舉一動，隨時隨地被記錄和分析。數據分析，知識精煉與學習精進的能力，對人類、企業、社會、環境及臺灣的經濟發展都很重要。訪間大數據的書雖然已有不少，但對機器學習的處理大都一筆帶過。佩德羅．多明戈斯在這本書中，不但將深奧的機器學習概念，以深入淺出的方式，介紹給非專業的讀者，同時也以清楚的內容，滿足專家深入了解的需求。」──亞洲大學副校長　林蔚君國際好評如潮　　「作者多明戈斯專業與熱情筆觸，讓這本書極具可讀性。」──《新科學人》（New Scientist）　　「《大演算》研究與統整了機器學習領域的五大主流技術……內容豐富，主題發人深省。作者透過適時深入淺出的巧妙介紹手法，讓我們很快汲取精髓觀念。」──《經濟學人》（The Economist）　　「隨著『機器學習』和『大數據』經常登上頭條新聞，有關於這類的主題，不乏充斥炒作話題的商業書籍，以及還有一些過於技術導向的教課書，使得較難理解。對於普羅大眾來說，不管事從經理主管到大專院校學生，這是一本理想的書籍，真正展現了為什麼不用透過沉重的數學演算，就能明白機器學習如何運作。不同於其他書籍只是浮誇宣稱一個光明的未來，這本書實際上給你需要了解的知識，並且明白即將到來的變化。」──Google研究總監彼得．諾維格（Peter Norvig）　　「這是一本令人愛不釋手的書，由在這創新領域的領導專家所著。如果你想知道新世代人工智慧將如何改變你我未來的生活，就閱讀這本書吧！」──Google研究員、無人駕駛車發明人塞巴斯蒂安．史朗（Sebastian Thrun）　　「一開始便大膽主張所有知識都可以透過一個單一的『大演算』，從數據資料中分析推論得出，多明戈斯透過明快節奏的說明歷程，帶領讀者進入這華麗全新的機器學習世界。輕鬆的寫作筆法卻深具威信，多明戈斯是一位完美的嚮導，從書上你將會學到一切你需要知道關於這個令人振奮的領域，以及有關科學與哲學的大量闡釋。」──微軟研究院首席研究員、《6個人的小世界》（Six Degrees）與《為什麼常識不可靠？》（Everything Is Obvious）作者鄧肯．華茲（Duncan Watts）　　「電腦科學的聖杯就是一種可以教導自己學習的機器，如同我們人類一樣，從經驗中獲取知識。機器學習可以幫助我們從事每一件事情，從治療癌症到建立人形機器人。佩德羅．多明戈斯揭開機器學習的神祕面紗，並充分展現未來是多麼令人驚奇與振奮人心。」──《賈伯斯傳》（Steve Jobs）作者沃爾特．艾薩克森（Walter Isaacson）　　「機器學習是一種最具變革性的技術，將在未來15年裡，塑造人類的嶄新生活。這是一本必讀之書──一個用詞大膽、文辭優美的新框架，帶領我們展望美好的未來。」──《跨越鴻溝》（Crossing the Chasm）作者傑弗里．墨爾（Geoffrey Moore）　　「這是一本非常重要且實用的書籍。機器學習已經是你我生活與工作的關鍵，且對未來的影響只會變得日益加遽。終於等到佩德羅．多明戈斯以清晰易懂的方式寫出關於這方面的著作。」──貝伯森學院（Babson College）特聘教授、《決勝分析力》（Competing on Analytics）與《大數據@工作力》（Big Data at Work）作者湯瑪斯．戴文波特（Thomas H. Davenport）　　「機器學習正在改變世界，被廣為人知的是運用在商業的預測分析。這本引人入勝、廣泛深遠，並啟發靈感的書籍，將深奧的科學概念，不只是介紹給非專業的讀者，也滿足專家嘗鮮的閱讀需求，深刻的觀點揭露了最有前景的研究方向。這真是一顆堪稱罕見的寶石。」──預測分析世界大會（Predictive Analytics World）創辦人、《預測分析時代》（Predictive Analytics）作者艾瑞克．席格（Eric Siegel）　　「機器學習是個迷人的世界，之前卻鮮少被外人看上一眼。佩德羅．多明戈斯透過書中五大學派的語法，傳授你神祕的語言，並邀請你參與他的整合學派計畫，打造人類文明史上見識過最強大的科技。」──普林斯頓教授、《連結》（Connectome）作者塞巴斯蒂安．升（Sebastian Seung）　　「一本充滿專業熱情，而不是概略介紹機器學習的書……內容清晰易懂、理論與實務講解兼具……具有智慧、遠見和學術價值，多明戈斯完整詮釋科學家如何開發程式，讓電腦可以自我教導。你將會發現許多令人著迷的創見。」──《柯克斯書評》（Kirkus Reviews）　　「這是劃時代突破性的電腦科學，開始展開一場令人振奮的全新冒險旅程。」──《書目》（Booklist）布萊斯．克理斯坦森（Bryce Christensen）　　「多明戈斯絕對是一位親切且有趣的知識導師，他能用最淺顯易懂的語言，通透解釋這些艱澀難懂的機器學習理論學派知識領域，協助初學者快速領略這演算法，可謂近幾十年來難得的經典之作……這是一本理論完整與實務說明詳實的書籍，不僅能滿足單純好奇的初學讀者，更是適合早已具備基本機器學習領域知識的專業人員，更能融會貫通此領域的重要神髓。透過每一篇章的學理翔實描述和討論，淺白解釋難懂的術語，以及提出明確與易於理解的實例，這些努力都是本書最值得推薦讚揚之處。」──《英國泰晤士高等教育專刊》（Times Higher Education）　　「《大演算》澈底勾勒我們眾人從沒看到或人心未曾思想過的嶄新世界，並對我們的日常生活產生難以抹滅的巨大影響。」──《讀者的書意識》（Shelf Awareness for Readers）　　「這真是令人驚訝且博學、幽默、易讀易懂的入門書。」──大數據分析網站 KDNuggets

TABLE OF CONTENT

【好評推薦】【推薦序】　大演算顛覆世界，也顛覆我的看法／林泰宏【推薦序】　想跟上資訊革命時代的多變世界，本書是你的敲門磚／張宗堯【推薦序】　從5萬呎的高空鳥瞰機器學習，望見未來／陳明義【推薦序】　讓我們站在巨量資料的肩膀上，看得更高更遠／趙坤茂【推薦序】　大演算，是飽覽大數據與機器學習的最佳指南／謝孫源【推薦序】　大演算強化「工業3.5」，讓臺灣在物聯網時代中卡位／簡禎富【前言】　機器學習早已融入你我的生活第1章　機器學習的革命進入機器學習的世界／企業為何擁抱機器學習？增加科學方法的馬力／十億個比爾．柯林頓一則透過傳統攻防，二則透過網路之戰我們將走向何方？第2章　大演算從神經科學方面獲得的論證／從演化方面獲得的論證從物理方面獲得的論證／從統計學方面獲得的論證從電腦科學方面獲得的論證／機器學習專家與知識工程師天鵝咬了機器人／大演算是隻狐狸還是刺猬？什麼是危機所在？／一個不同的萬有理論候選者還不夠格／機器學習的五大學派第3章　人類的歸納問題約會，還是不約會？／「沒有免費的午餐」定理啟動知識學習機／如何讓世界規則化在暗黑和幻覺之間／你可以相信的準確性歸納法是逆向演繹法則／學習治療癌症二十個問題的遊戲／符號理論學派第4章　你的大腦是如何學習？感知器的潮起潮落／物理學家用玻璃製造大腦世界上最重要的曲線／在多維空間的爬山演算法感知器的復仇／細胞的完整模型／更深入大腦第5章　演化：自然學習演算法達爾文的演算法／探索與利用的困境適者生存的程式／性交配行為是為了什麼？培育天性／學習最快的人勝出第6章　貝葉斯牧師的教堂運行世界的定理／所有模型都是錯的，但有些還是有用從《尤金．奧涅金》到Siri手機語音行動祕書一切都是相關聯的，但不是直接的／推理問題學習貝氏的方法／馬爾可夫權衡事證邏輯與機率：命運多舛的一對第7章　你就是相似的你如果你能與我相匹配／維度的詛咒平面上的蛇形分割線／攀登階梯旭日東升，光彩奪目第8章　學習無師自通物以類聚／發掘數據資料的形狀享樂主義的機器人／孰能生巧學習建立關聯第9章　每一塊拼圖各得其所跳脫許多模型，整合成一體／大演算馬爾可夫邏輯網路／從休謨到你的家事機器人行星尺度的機器學習／醫生如今會診斷你了第10章　這是機器學習的世界性、謊言和機器學習／數位鏡／一種模型的社會分享或不分享，如何分享與在何處分享類神經網路偷了我的工作／不是用人類來作戰 Google＋大演算=天網（Skynet）？演化，第二部分【結語】搭上機器學習的船，航向未來誌謝延伸閱讀

PREFACE/READING GUIDANCE

【推薦序】　大演算顛覆世界，也顛覆我的看法 ──前臺灣微軟合作夥伴技術支援顧問　林泰宏 1997年，IBM的深藍電腦擊敗了世界西洋棋冠軍，震撼了整個業界。媒體大肆報導。伴隨而來的是另一股恐慌性的思維──電腦會不會有一天取代人腦，甚至統治了人類？20年過去了，我們都還在為生活而忙碌工作。別說電腦統治人類，它連讓我早一點下班都很勉強了。 2016年，Google Alphago擊敗了世界圍棋冠軍，用的不再是超級電腦的運算能力。取而代之的，是大數據的分析能力、雲端的運算能力和機器學習。機器學習是一個廣泛的名詞，意思是讓電腦透過樣本數據來回答問題或進行預測。也許大家從前幾年開始就不斷聽到大數據，而近期從微軟語音助理Cortana進行世界盃足球的賽事預測，到美國總統大選分析，或是透過相片猜測年齡／顏值，這些都是機器學習的產物。提到演算法，我想對於資訊相關背景的人來說都不陌生。事實上，我們現在身處的世界，到處都可以看到演算法的身影。舉凡搜尋、電子地圖上的路線、推薦系統等，無一不是透過演算法來達成。如同本書作者所說，大演算終將顛覆我們的世界，在閱讀完本書之後，我覺得這本書則是顛覆我對演算法的看法。過去在學習演算法的時候，它對我而言，是離散數學。而大演算卻能夠把它描繪得如此生動。例如井字遊戲（Tic-Tac-Toe）使用的極大極小搜尋（Minimax Algorithm），作者卻以另一種形式來描述：如果你或你的對手，一排已經占有兩個格子，在接續的棋步中，只要下在剩餘的另一個空格上，便可贏得這盤井字遊戲。否則如果有一個棋步，可以創造出兩行連成兩條連線的雙頭蛇優勢，那麼下在那裡。否則如果井字中心還是空的，那麼就下在那裡。否則如果你的對手已經下在一個角位，那麼就下在他相反的角位。否則如果有一個空的角位，那麼就下在那裡。否則就下在任何一個空格裡。當然，本書也不只針對從未接觸過演算法及機器學習的讀者。所謂外行的看熱鬧，內行的看門道。針對相關行業背景的讀者。本書也提供了機器學習所用到的大部分演算法的詳細說明，例如：決策樹、最近鄰居演算法、簡單貝氏演算法等。相信不管是對這個領域充滿好奇，或是想要深入了解的，都能從中獲得幫助。【推薦序】　想跟上資訊革命時代的多變世界，本書是你的敲門磚 ——美商凱博數據創辦人／總經理　張宗堯自從Google的深度學習人工智慧系統AlphaGo四度打敗世界圍棋冠軍李世乭後，一夕間全球新創公司、科研機構、科技業巨頭都紛紛宣告，將在人工智慧領域投入更大量的人力與金錢，現在全世界都關切：「機器取代了勞力後，竟然也能思考、學習，那接下來還能做什麼？」顯然這股席捲全球的人工智慧熱潮正撲天蓋地而來。事實上，人工智慧早就不是新課題，問世以來少說有60年歷史，只是這門學科近期火熱，除了受惠這場話題十足的圍城之戰，主要還是歸因行動網路、物聯網、大數據、雲端，以及GPU運算等核心關鍵技術的重大突破，人工智慧得以從in vitro （體外）階段，進入in vivo （體內）階段。人工智慧因而跨出研究中心，充分展現在生活中，也讓令人切實感受人類正邁向下一個新時代。如今導入人工智慧的機器，已經能夠精準地模仿出截然不同的繪畫風格、音樂曲調，這全有賴日益精進的演算法，機器可以從海量數據中，分析出各種迥異的風格，甚至還能進行預測。現階段，全世界所有硬體都面臨著「被智慧化」，而人類對於智慧化的終極追求無非為了更好的生活品質。機器學習的演算法大致上可以分成五個理論學派，本書以深入淺出的文字分別細數之，這些學派各有優缺點，對於某些狀況處理得宜，但面對其他事情卻可能很糟，有沒有一種「終極的演算法」，可以集結各門各派的優點，從海量的數據資料中，整合出世界上所有關乎過去、現在和未來的知識，這種大演算法無疑是科學史上最偉大的進步之一，它不但會全面加速機器學習的進展，並且以我們幾乎無法想像的方式改變世界。我從與企業接觸的經驗中觀察到一個現象：傳統企業營運思維下，要完成一份專案，通常是先設定目標與明確預期投資回報率（ROI），然後才一步步地往目標前進；然而在演算法的時代裡，專案執行前，須先經過統計思維，將所有資料進行演算、分析，在沒有得到分析結果前，這個專案是絕對無法準確估計的，這與企業現行評估計畫、資源分配的方式有顯著差異。這種差異也正是我想推薦這本書的理由，許多企業不乏可以解決數據問題的優秀員工，然而他們的主管卻極少有數據思維，這種落差會導致企業營運出現斷層，在全球產業競爭激烈的環境下，著實是個危機。機器替代藍領的工業革命時代過去了，在這資訊革命的時代，下一個會被取代的是白領階級，速度甚至會比想像中來得快，人類能掌握的聖杯，就是不斷適應新的時代，跟上世界的腳步，而我相信這本書會是幫助你快速適應這個多變世界的敲門磚。【推薦序】　從5萬呎的高空鳥瞰機器學習，望見未來 ──資策會技術長／大數據所所長　陳明義探討機器學習領域，這是一本非常獨特的書，任何對機器學習有興趣的人，不論你是專家或門外漢都值得一讀。佩德羅．多明戈斯以他豐富的學識，從5萬呎的高空鳥瞰機器學習領域的現況，展望機器學習的未來以及它對人類社會各個層面將帶來的衝擊。他以簡單易懂的言語介紹了機器學習的五個學派，各學派演算法的精髓、理論基礎及發展的歷史，並點出其優缺點。他以專家的洞悉和豐富的想像力勾勒出機器學習終極演算法的概貌，以及這種具有自我學習的演算法對人類社會所將造成的巨變。書中文采奕奕，作者的博學多聞以及他對機器學習的熱忱躍然紙上。不論你是否贊同他對未來世界的預言，他的論述和哲理都將引人深思。【推薦序】　大演算，是飽覽大數據與機器學習的最佳指南 ──成大資工系特聘教授兼系主任謝孫源你是否注意到當你在瀏覽網頁時，旁邊總是會出現一些你有興趣商品的廣告？你是否曾經好奇臉書（Facebook）為什麼總是會出現你才剛查詢過商品的廣告？因為這些都是根據你瀏覽網頁的搜尋習慣，分析而得到的結果，進而將你有興趣的商品推薦給你。其實，這些都是機器學習的成果。在這個資訊爆炸的時代，機器學習早已經悄悄進入到我們的日常生活，只是我們都沒有注意到這個變化。你也許聽說過大數據（big data），也曾經從新聞中聽聞政府、產業界、學術界討論大數據相關的政策，然而大數據究竟是什麼？對我們生活又有什麼影響呢？其實，大數據和我們的日常生活息息相關，例如：我們幾乎每天都會使用的電話和電子郵件，根據美國國家安全局的統計，世界各地每天都有超過十億通的電話，電子郵件的數量就更可觀了。然而，美國國家安全局要如何在這龐大的電話及電子郵件中，過濾出恐怖分子的通訊呢？而如何從大數據資料中，去獲取我們所需要的資訊，是科學家、工程師一直在努力的課題，這也是機器學習很重要的一環。《大演算》這本書的核心假設是：｢透過一個單一、通用的機器學習演算法，可以從數據資料中，推論得出過去、現在和未來的所有知識。｣這個假設類似於牛頓的萬有引力概念，作者大膽稱之為｢大演算｣（The Master Algorithm）！作者介紹了現今機器學習的五大學派，各學派都有其主要的機器學習演算法，有各自的優點，當然也會有其盲點存在。因此，到目前為止，仍然沒有一個可以一統江湖的機器學習演算法。作者期望在未來的一天，會有｢大演算｣的出現！作者介紹機器學習五大學派的主要演算法，沒有艱深的數學式子推導，而是透過最簡單、最熟悉的日常生活例子來介紹，讓讀者可以更容易了解各個演算法的意涵和精髓，也可以了解到機器學習這塊領域目前發展的現況。對於一個好奇大數據和機器學習的讀者，這本書可以幫助你了解大數據和機器學習所帶來的變化；對於想要進入機器學習領域的讀者，這本書可以提供一個基礎的概念，引領你進入機器學習領域；而對於已經在機器學習領域努力的讀者，更是不能錯過這本書，讓你可以深入了解不同學派之間的異同。不論你的專長領域是什麼，相信這本書將是幫助你飽覽大數據與機器學習的最佳指南。【推薦序】　機器學習讓我們站在巨量資料的肩膀上，看得更高更遠 ──臺大資工系系主任趙坤茂 2016年6月的最後一堂計算機概論課，我問：「十年後，你是否會和某機器人成為知己？」大約三分之一的同學回答可能會，認為人工智慧進展神速，或許會出現很貼心的機器人，比誰都了解你，甚至比你自己更了解你。另外有大約三分之二的同學回答不會，畢竟機器人只是協助人類的工具，它所說的每一句話都是「算」出來的，在情感上無法真正交心。無論如何，未來機器人允文允武已是公認事實，其背後推動力來自於機器學習的革新、運算資源的躍進及巨量資料的累積，使得機器人能夠深度學習，不僅可以無日無夜學習，還可本尊分身一起學習，讓人類望塵莫及。現在，就讓本書為你揭開機器學習的神祕面紗。對於有志了解機器學習的讀者，這是一本極佳的入門書籍。作者佩德羅．多明戈斯以生動活潑的專業論述，深入淺出地介紹了機器學習的五大學派：符號理論學派（Symbolists）、類神經網路學派（Connectionists）、演化論學派（Evolutionaries）、貝氏定理學派（Bayesians）、類比推理學派（Analogizers），讓讀者能理解機器學習的關鍵原理，並對現況有所掌握。多明戈斯也呼籲開發一個結合五大學派重要特點的單一演算法，稱之為終極演算法（the ultimate master algorithm），該方法可以從數據資料中，習得這個世界上過去、現在和未來的所有知識。我們不禁要問：終極演算法是否存在呢？如果存在的話，它必須像金庸小說《笑傲江湖》中的吸星大法，可以將別人的內力化為自己的內力；但它又不能像2016年3月微軟推出的聊天機器人Tay那樣消化不良，在網友的調教下，居然頻頻說出種族歧視的跳針發言。我個人對終極演算法是否存在抱持著比較保守的看法，追尋聖杯的結局，很可能如同《功夫熊貓》電影一般，到最後才發現最高的武功秘笈竟是一部無字天書。不管終極演算法是否存在，機器學習已讓我們站在巨量資料的肩膀上，看得更高更遠。各位朋友，請接受多明戈斯的邀約，參加這場機器學習的知性饗宴！【推薦序】大演算強化「工業3.5」，讓臺灣在物聯網時代中卡位 ──清華講座教授暨清華-台積電卓越製造中心主持人簡禎富隨著電子商務、物聯網、「工業 4.0」、機械人和聰明生產等典範移轉，全球經濟發展和產業價值鏈將革命性重構，也由於網路社群、人工智慧、大數據、機器學習和最佳化等技術創新和日益廣泛的應用，正在改變世界，人類生活和社會各個層面有翻天覆地的變化。本書作者佩德羅．多明戈斯（Pedro Domingos）現任華盛頓大學電腦工程系教授，認為透過「大演算」（Master Algorithm）作為解析機器學習的概念模型，可以從數據資料中分析推論得出所有知識，並以清晰易懂和引人入勝的方式介紹機器學習（machine learning）及其五大學派，並有系統地介紹每一學派主要的演算法和相關的應用。其中，有不少與我在美國威斯康辛大學麥迪遜分校（UW-Madison）攻讀決策科學與作業研究博士時，參與「綜合醫療促進支援系統」（CHESS）計畫的資料挖礦研究，乃至於領導清華大學「決策分析研究室」（DALab）研究夥伴們投入決策分析、大數據和最佳化的產學合作研究經驗相關，發現本書能夠讓讀者很容易地明白機器學習的運作原理和應用，值得推薦。隨著軟硬體計算能力和雲網端的發展，還有處理結構化和非結構化的大數據分析能力，這些進步讓大數據和機器學習應用的趨勢已經由量化到質化的分析。各國產業結構和社會文化迥異下，所需發展的大數據產業和應用也不盡相同。臺灣長期以大量生產、規模經濟的製造模式，在「工業4.0」、物聯網和客製化時代需要轉型，而世界各國都普遍面臨因為自動化和機械人而加劇的貧富差距和年輕人就業供需不等問題。相對於工業先進國家的製造戰略，臺灣應善用目前在「工業3.0」的供應鏈管理、整合能力和彈性應變的優勢，發展「工業3.0―工業3.5―工業4.0」的策略藍圖，利用本書介紹的「大演算」等相關技術，將既有的核心管理能力系統化、數位化，發展以大數據分析、智慧製造系統和聰明生產為核心的「工業3.5」作為現有「工業3.0」和未來「工業4.0」之間的混合策略，利用臺灣製造相對競爭優勢、供應鏈系統彈性和客製化能力，透過產品生命週期管理和大量客製化彈性以更快更聰明地滿足消費者需求，使臺灣能在被先進國家和紅色供應鏈上下夾擊之前，用「工業3.5」的破壞性創新先在物聯網時代的全球供應鏈中卡位，避免未來先進國家挾著「工業4.0」的先進系統鯨吞整個製造價值鏈。

CONTENT PREVIEW OF THE BOOK

機器學習的革命我們生活在演算法的時代。只有一、兩代人之前，提到演算法（algorithm ）這個詞，對大多數人來說，腦袋會是一片空白。時至今日，演算法已儼然普及在文明的各個角落。它們被融入日常生活中，不只存在於智慧手機、筆記型電腦裡，而且普及在汽車、房屋、電器，以及玩具中，就連你的銀行也是一個龐大複雜的演算法，讓人們可以到處輕易的使用銀行服務。演算法可以安排航班，然後駕駛飛機；演算法還可以運營工廠、貿易與貨物路線配送、現金收入，以及保存紀錄。如果每個演算法戛然停止運作，那絕對就像我們所知的世界末日一樣。進入機器學習的世界每一個演算法都有一個輸入和一個輸出，亦即數據資料進入電腦後，演算法會利用這些資料去做它該做的，然後輸出結果。機器學習則是扭轉這種模式，亦即數據資料與預期結果輸入後，機器學習會將一個演算法轉變成另一個後，結果輸出一個演算法。機器學習演算法也被稱為學習器（learners），是一種演算法，可以推演產生另一個演算法。有了機器學習，電腦可以自己編寫程式，所以我們不必再對電腦逐步下達指令了。哇！電腦會編寫自己的程式。如今這是一個強大的觀念，甚至有點嚇人。如果電腦開始自己編寫程式，那我們將如何控制它們呢？原來我們可以把它們控制得很好，如同我們將會看到的。但針對這一點，有一個更直接的反對意見：也許這聽起來太好了，以至於無法成真。當然編寫演算法需要智慧、創造力和問題解決的能力，這些事情不是電腦沒有具備的嗎？機器學習如何區別得出是否為不可思議的魔法想像呢？實際上，截至今天，人們可以編寫許多軟體程式是電腦無法學會的。但是更令人驚訝的，電腦可以學會許多程式是人們所不能編寫的。我們知道如何駕駛汽車和辨讀筆跡，這些技能是潛意識的，但我們無法向電腦解釋，如何去做到這些事情。然而，如果我們給予每一個學習器足夠多的範例，它將愉快地找出如何做自己，屆時我們就可以放手讓電腦自動學習運作。這就是郵局如何利用學習器讀取郵政編碼（zip）和為何路上已經出現自動駕駛車了。或許機器學習的強大魅力，透過低科技（low-tech）的農業（farming）比喻，是最恰當的詮釋。在一個工業社會中，產品在工廠製造，意味著工程師必須確切地弄清楚究竟是如何從它們的零組件組裝產品、如何製造生產這些零組件等，從頭到尾都與原物料有關，而且整個過程有許多工作必須進行。電腦則是有史以來發明過最複雜的產品，從設計它們，到工廠大量製造它們，以及運行在電腦上的軟體程式是相當繁重的工作。但還有另一種更古老的方式，這種方式可以讓我們取得一些需要的東西，藉由大自然製造生產它們。在農業時代，我們播下種子，並確保有足夠的水分和養分，最後收割這些種植的作物。技術為什麼不能更像這樣呢？它是可以的，而且這是機器學習的承諾。機器學習演算法就像種子一樣，數據資料是土壤，而學會的軟體程式就是種植的作物。機器學習專家就像農夫，播下種子，辛勤的灌溉土壤並加以施肥，同時密切關注作物的健康，但在其他方面就不必特別介入了。每當我們看到「機器學習」這個字眼，兩件事情立即浮現出來。第一，我們需要越多的數據學習資料，機器才能學習到越多。如果沒有數據資料就沒有什麼可以學習。一定要有大數據（Big data）嗎？因為透過大數據可以讓機器獲得更多的學習。這就是為什麼機器學習已經出現在每一個地方，透過指數倍增、堆積如山的數據資料，推動了機器學習的迅速發展。如果機器學習是某件你在超市購買的商品，那麼商品的紙箱上一定會特別標示「運作時只需要添加數據學習資料」。第二，機器學習可說是一把能砍殺複雜怪物的利劍。只要給予足夠的數據資料，一套只有幾百行程式碼的學習程式就可以很容易產生一套數百萬條程式碼的軟體程式，而且可以針對不同的問題，一次又一次地做到這一點。這對軟體程式設計師來說，複雜性的降低是相當驚人的。當然就像九頭魔蛇海德拉一樣，就算我們砍斷舊的頭，複雜怪物依然會立即長出新的頭，但新生成的頭剛開始比較小，而且需要一段時間成長，所以我們仍然取得了大優勢。機器學習擁有許多不同的形式，而且也有許多不同的名稱，例如：模式識別（pattern recognition）、統計模擬（statistical modeling）、資料探勘（data mining）、知識發現（knowledge discovery）、預測分析（predictive analytics）、資料科學（data science）、自我調適系統（adaptive systems）、自我組織系統（self-organizing systems）等。每一種機器學習都被不同的團體所使用，而且擁有不同的協會。有些機器學習擁有一個很長的半衰期（long half-life），有些則是少有如此現象。在這本書中，我統一使用機器學習（machine learning）這個術語，來泛指所有的機器學習。機器學習有時會與人工智慧（Artificial Intelligence，簡稱AI）混淆。從技術面來說，機器學習是人工智慧的一個分支領域，但由於機器學習擴展得如此廣大與成功，以至於如今已讓它引以為榮的父母──人工智慧，黯然失色。發展人工智慧的目標，就是教導電腦做到比現在人類所做的更好境界，而機器學習可以說是這些事情中最重要的。如果沒有它，就沒有電腦可以長期跟得上人類的腳步；有了它，其餘的則會遵循它的發展。企業為何擁抱機器學習？為什麼Google公司的市值比雅虎（Yahoo）高出許多？明明兩家公司都是從網路廣告帶來營收，而且兩者都是最熱門的入口網站，也都採用拍賣模式出售廣告，且都是透過機器學習來預測用戶有多少可能會去點擊廣告（點擊的機率越高，這個廣告位置就越有價值）。但Google的機器學習演算法比雅虎的還要好得多了。當然這不是他們在市值差異的唯一原因，但絕對是一個大的問題。對於廣告客戶來說，如果每一個預測的點擊並沒有發生，那等於是平白浪費了一個機會，而且對於網站而言，自然也會損失財源收入。隨著Google網路廣告年收入高達500億美元，只要潛在的有效點擊預測每提高1％，等於意謂著每年就可為公司增加5億美元的廣告收入存入銀行。難怪Google是一個機器學習的超級大粉絲，而雅虎與其他網站業者正試著努力的急起直追。網路廣告正是主流商業型態的一種表現形式。在每一個市場中，生產者和消費者需要在交易之前進行聯繫，才能促成一場交易的發生。在網際網路出現之前的年代，買賣雙方交易的主要障礙在於實體面，例如：你只能在當地書店購買書籍，而且你的當地書店會局限於有限的貨架空間。但是當你可以在任何時間下載任何一本書到你的電子閱讀器時，就變成了選擇過多的問題。你如何在一家書店，瀏覽書架上數百萬冊的銷售圖書呢？對於其他資訊產品，例如：影音視訊、音樂、新聞、推文（tweets）、部落格（blogs）、一般的舊式網頁等，也有相同的選擇問題。除此之外，對於一切可透過遠程採購的商品與服務也是如此，如鞋子、鮮花、小工具、飯店客房、補教、投資等。它甚至會反映到人們尋找工作或交友的選擇問題上。你們到底如何能在茫茫大海中找到彼此？這是一個網路世代天天面臨的問題，而機器學習就是解決這類方案的最佳選擇。隨著公司的成長，職場員工也經歷三個階段。早期，公司處處都是用人工完成一切，一位小型家庭自營式商店老闆，會親自了解客戶，而且他們會訂購、展示，並推薦相對應的商品。這種經營型態還算不錯，但沒有規模。在第二階段，也是最不快樂的階段，公司的發展擴大到需要開始使用電腦，因此開始招聘軟體程式設計師、顧問和資料庫管理人員，編寫出數百萬行程式碼，將公司所有能被自動化的功能完全自動化。還有更多的人被服務，但卻未必服務得一樣好，決策的制定可說是基於粗糙的人口類別，而電腦程式過於生硬死板，以至於無法匹配人類無限可能的多樣性。第三階段，企業進入起飛轉折點，由於傳統缺乏足夠的軟體程式設計師和顧問，以滿足所有的客戶需求，所以公司無可避免地轉向機器學習。亞馬遜（Amazon）為了靈活將所有客戶採購喜好媒合，編寫在電腦機器學習程式中；臉書（Facebook）也強化編寫一套機器學習程式，對每位社群會員傳遞最佳、最期待的喜好資訊。全球最大零售公司沃爾瑪（Walmart）銷售數以百萬計產品，每天提供客戶數十億種商品購買選擇。沃爾瑪的軟體程式設計師更是試著編寫一套機器學習程式，滿足所有客戶需要的功能。這些公司所做的，就是採用機器學習演算法，把他們堆積如山的巨量數據資料進行資料探勘分析，並讓機器學習演算法推測出客戶想要的東西。機器學習演算法可以稱得上是最佳媒合者，它們可以媒合生產者和消費者彼此接觸，克服資訊過載的問題。如果機器學習足夠聰明的話，你就可以從兩方面蒙受其益：在大規模方面，擁有大量的選擇與低成本；在小規模方面，可以具備個人化的風格。雖然學習器仍不盡完美，而且制定決策的最後一步，通常還是需要由人類來做判斷，但學習器可以睿智地簡化選擇，讓事情能控制在一個人可以管理的範圍之內。我們將走向何方？一直以來，技術趨勢總是起起落落、來來去去。唯有機器學習呈現出不尋常的魅力，它渡過了所有這些改變，也渡過了繁榮與蕭條，它只是不斷地增長。金融產業是機器學習的第一個應用領域，早在20世紀八○年代末期，就開始運用機器學習預測股價漲跌。下一波應用的領域是在企業資料庫的資料探勘上，這是到了20世紀九○年代中期，才開始變得規模很大，另外像是直銷、客戶關係管理、信用評等和欺詐偵測等領域均有廣泛地應用。然後是隨之而來的網路和電子商務，此時自動個人化服務迅速成為司空見慣的應用。當網路泡沫破滅暫時退潮時，運用機器學習的網路搜索和廣告位置效益快速起飛。不論好壞，911恐怖攻擊事件，更將機器學習推向反恐戰爭的最前線。新一代網際網路的應用Web 2.0，則帶來了一系列全新的應用榮景，從社交網路的探勘，到找出哪些部落客（bloggers）正在談論你的產品。與此同時，各領域中越來越多的科學家，逐漸轉向大規模的模擬，其中又以分子生物學家和天文學家引領了這個改變。此外，當美國房市蕭條幾乎沒有登記買賣時，它的主要影響是歡迎人才從華爾街轉移到矽谷發展。到了2011年，「大數據」迅速爆紅，深受歡迎，無疑把機器學習推向未來全球經濟發展的中樞。如今人類似乎還在努力將機器學習應用到其他尚未觸及的領域，包括看似不太可能的音樂、體育和品酒等領域。這種增長是顯著的，這只是一個什麼即將到來的預示。不管機器學習是否有用，事實上，目前這一代的機器學習演算法對產業的影響仍然十分有限。然而當現在正在實驗室裡的演算法，實際應用到業界最前線時，微軟創辦人比爾．蓋茲（Bill Gates）的評論，在機器學習領域的一個突破，將價值十倍的微軟，就會顯得太過保守。如果這些觀點「真正」能讓研究學者眼放微光，產生實際的成果，那麼機器學習帶來的不只是一個文明的新紀元，更是地球生命演化的嶄新階段。是什麼讓這一切成為可能？機器學習演算法到底如何運作？什麼是機器學習演算法目前不能做到的，以及下一代的機器學習演算法將是什麼樣子？機器學習的革命將如何展開？你應該留意哪些機會和危險？這些都是這本書裡會探討的課題，請繼續往下讀吧！機器學習的五大學派當然在探求大演算的過程中，我們不必辛苦從無到有。我們已經有幾十年的機器學習研究，可以從中借鑑完整全貌。尤其在這地球上最頂尖聰明的人，全都把自己的生命奉獻於發明機器學習演算法，而且有的人甚至聲稱，他們已經握有一個通用的學習器。雖然我們將站在這些巨人的肩膀上（因為後人的學識是建築在前人的學識之上），但是對於這樣的聲稱，我們半信半疑。這樣一來，就產生了一個問題：我們如何知道，何時我們已經真正找到大演算？當相同的學習器只有參數的改變，而且除了數據資料以外，只需要輸入最小量的學習範本，就可以和人類一樣，理解影音與文件內容，這樣的學習器並能在生物學、社會學及其他科學領域，做出重大的新發現。顯然，在這種標準下，目前還沒有任何學習器已經被證明就是大演算，即使在不太可能的情況下，已有能解決某領域的演算法存在，仍不足以承擔機器學習統一理論的大局。最重要的是，在每一個新問題上，大演算是不需要從頭開始的。或許上述我們所要求的這個門檻可能太高了，所以對於任何學習器來說，很難符合這些要求標準，而且學習器肯定和人們所做的很不一樣。舉例來說，語言並非在無塵的真空中進行學習，如果我們無法擁有這個世界涉及到它的相關知識，我們就不可能理解一個句子的句義。因此學習閱讀的時候，大演算可以依靠之前累積的學習基礎，去看、去聽，並去控制一個機器人。同樣地，一位科學家不只是一味地將數據資料套用到模型中，他還是可以利用自己在這個領域的所有知識，對這個問題產生影響。因此，在進行生物學的探索時，大演算可以先讀取它想要了解的所有生物知識，依靠以前已經學到的基礎進行判讀。大演算不只是一個數據資料的被動消費者，它還可以與所處環境進行互動，並積極尋求它想要的數據資料，就像英國實驗室的機器人科學家亞當一樣，或者像是任何一位孩童，學習探索他的世界。由於在機器學習領域存有許多競爭的思想學派，所以我們在大演算的尋求過程，可以說是相當複雜，但也因此變得十分有趣。這些主要的學派包括符號理論學派（Symbolists）、類神經網路學派（Connectionists）、演化論學派（Evolutionaries）、貝氏定理學派（Bayesians）和類比推理學派（Analogizers）。每個學派都有一套核心理念，以及一個它最關心的特定問題。不過它已經針對這個特定問題，基於其相關領域的科學概念，找到一個適合的解決方案，並且擁有一個主要的演算法，可以適度體現它的機器學習行為。對於符號理論學派來說，所有的智慧可以被簡化成操縱符號，就像數學家求解方程式的過程，是透過用其他表達式來替換表達式的方法。符號理論學派明白，你不能從頭學起，你需要一些初步的知識，與數據資料相配合。符號理論學派們已經找到了如何將先前存在的知識納入學習，以及如何快速地將不同的知識進行結合，以解決新的問題。他們的主要演算法是逆向的演繹法（Inverse Deduction），透過這種演算法可以找出哪些知識是欠缺的，以便能做出邏輯的演繹推論，然後使其盡可能地被通則應用。對於類神經網路學派來說，學習就是人類大腦所做的事情，所以我們需要做的，就是對大腦進行反向工程。大腦的學習是透過調整神經元之間的連結強度，而關鍵的問題是找出哪些神經元的連接，必須對哪些錯誤負責，並依此相對應地改變它們。類神經網路學派的主要演算法是倒傳遞理論演算法（Backpropagation），它會比較系統的輸出與期望的輸出，然後依次改變一層又一層的神經元連結，以便使得輸出結果可以更接近於它應該呈現的。演化論學派則認為，所有學習之母就是物競天擇。如果物競天擇可以造就我們，那麼它就可以造就任何事情，而我們所需要做的，就是在電腦上模擬它。演化論學派所解決的關鍵性問題就是學習的結構，不只是調整參數而已，就像倒傳遞理論演算法所做的，可以創建一種能夠讓這些調整進行微調的大腦。演化論學派的主要演算法是一種遺傳程式規劃（genetic programming），就像大自然會交配與演化生物一樣；同樣地，遺傳程式規劃也會以相同的方式，繁衍與演化電腦程式系統。貝氏定理學派最關注的課題就是不確定性。這門學派主張所有學到的知識都是不確定的，而且學習本身就是一種不確定的推理形式。那麼這個問題就變成如何處理雜訊、不完整，以及相互矛盾的資訊，而不會造成分崩離析。解決的辦法就是機率推理，而主要的演算法是貝氏定理與其衍生物。貝氏定理告訴我們如何把新證據轉化為信念，而機率推理演算法則盡可能有效地做到這一點。對於類比推理學派而言，學習的關鍵是認識各種情況之間的相似之處，從而推斷其他情境的相似地方。如果兩位患者都有相似的症狀，也許他們患有相同的疾病，問題的關鍵是要判斷兩件事情之間是如何相似。類比推理學派的主要演算法就是支持向量機（Support Vector Machine，簡稱SVM），它可以找出哪些經驗是需要記住的，以及如何結合這些經驗，做出新的預測。針對各個學派的核心問題，每個學派都有提出相對應的解決方案，這些解決方案都是相當卓越，且得來不易的進展。然而真正的大演算，是必須同時解決這五類問題，而不只是一個。例如：為了治療癌症，我們需要理解在細胞中的代謝網路，哪些基因會控制其他基因，蛋白質控制因而會產生哪些化學反應，以及添加一個新分子的組合會如何影響網路。此時，機器學習若必須試圖從頭開始學習所有的知識，忽略生物學家已經煞費苦心，累積了幾十年得來的所有知識，那麼這種機器學習必定是愚蠢的。符號理論學派知道如何利用從DNA序列測定儀、基因表達微陣列（gene expression microarrays）等所取得的資料，結合這方面的知識以產生結果，這種結果是你不可能單獨取得的。但我們藉由逆向演繹所獲得的知識是純定性（purely qualitative）的，我們需要學習的不只是誰與誰進行互動，還要包括互動多少次，而這些都是倒傳遞理論演算法可以做到的事情。然而無論是逆向演繹或倒傳遞理論演算法，若沒有一些相互作用與參數的基本結構，兩者將會迷失在機器學習的空間裡，不過遺傳程式規劃可以彌補這個問題。在這一點上，如果我們有完整的代謝知識，並且擁有給定病患的所有相關資料，我們就可以找出一種針對他的治療模式。但在現實生活中，我們所擁有的資訊總是非常不完整的，甚至在某些地方並不正確；儘管如此，我們仍舊需要取得進展，這就是機率推理為什麼存在的理由。在最困難的情況下，病人的癌症看起來跟以往的癌症有很大不同，所有我們以前學過的知識，都不足以理解判斷。此時，基於相似性的演算法（Similarity-based algorithms），可以在表面上看起來非常不同的情況之間，尋找類似之處，並且專注於他們基本的相似點，忽略其他剩餘的地方。無論你讀這本書是出自於好奇或是專業的興趣，我希望你能將已經學到的東西，分享給你的朋友和同事。機器學習觸動我們每個人的生活，它取決於我們所有的人，自主決定我們想要用它來做什麼。憑藉著你對機器學習的新理解，你處於一個更好的位置，可以去思考類似隱私和數據資料分享、未來的工作、機器人作戰，以及人工智慧的希望和危險等問題；如果我們有越多人擁有這樣的理解，我們就越可能可以避免重蹈覆轍，並且找到正確的成功途徑。這是我撰寫這本書的另一個重要原因。統計學家知道要進行預測是很困難的，尤其是有關於未來，然而電腦科學家都知道，預測未來的最好方式就是去創造它，但渾渾噩噩的未來，就不值得去開創了。謝謝你讓我成為你的嚮導，我想要送給你一份臨別的禮物。牛頓說過，他覺得自己像是一位在海邊玩耍的男孩，在這裡撿到一顆鵝卵石，在那裡發現一個漂亮貝殼，而躺在他面前的則是浩瀚且尚未被探索的真理大海。300年之後，我們已經擁有許多鵝卵石和貝殼的驚人收藏，但是這個未被發現的真理大海，仍然綿延到遠方，閃耀著希望的光芒。我要送的這件禮物就是一艘船──機器學習，而且現在正是揚帆啟航的時候了。