《周志華 機器學習ppt Chap01緒論》由會員分享,可在線閱讀,更多相關《周志華 機器學習ppt Chap01緒論(39頁珍藏版)》請在裝配圖網上搜索。
1、機器學習導論(2016 春季學期)一、緒 論 機器學習機器學習是從人工智能中產生的一個重要學科分支,是實現(xiàn)智能化的關鍵 機器學習機器學習(Machine Learning)究竟是什么東東?看個例子 “文獻篩選”的故事 C. Brodley et al., AI Magazine 2012 在“循證醫(yī)學”(evidence-based medicine)中,針對特定的臨床問題,先要對相關研究報告進行詳盡評估查詢 PubMed 以獲取候選摘要人工找出值得全文審讀的文章 “文獻篩選”的故事在一項關于嬰兒和兒童殘疾的研究中,美國Tufts醫(yī)學中心篩選了約 33,000 篇摘要盡 管 Tufts醫(yī) 學
2、中 心 的 專 家 效 率很高,對每篇摘要只需 30 秒鐘,但該工作仍花費了 250 小時每項新的研究都要重復這個麻煩的過程!需篩選的文章數在不斷顯著增長! “文獻篩選”的故事為了降低昂貴的成本, Tufts醫(yī)學中心引入了機器學習技術邀請專家閱讀少量摘要,標記為“有關”或 “無關”分類模型對是否“有關”進行預測人類專家只需閱讀 50 篇摘要,系統(tǒng)的自動篩選精度就達到 93% 人類專家閱讀 1,000 篇摘要,則系統(tǒng)的自動篩選敏感度達到 95%(人類專家以前需閱讀 33,000 篇摘要才能獲得此效果) 色澤根蒂敲聲好瓜青綠蜷縮濁響是烏黑蜷縮濁響是青綠硬挺清脆否烏黑稍蜷沉悶否決策樹,神經網絡,支持
3、向量機,Boosting,貝葉斯網,模型訓練數據(label)訓練新數據樣本(淺白, 蜷縮, 濁響, ?) ?= 是類別標記未知典型的機器學習過程使用學習算法(learning algorithm)類別標記 機器學習與數據挖掘 機器學習能做什么?我們可能每天都在用機器學習 權16南京大學機器學習導論課程專用所有20保留機器學習 模型搜索引擎機器學習技術正在支撐著各種搜索引擎搜索:南京大學 例如:互聯(lián)網搜索 有器學習導論課程專保留權用所2016南京大學機例如:自動汽車駕駛(即將改變人類生活)機器學習模型方向盤旋轉幅度油門幅度剎車幅度車載攝像頭車載雷達控制汽車美國在20世紀80年代就開始研究基于機
4、器學習的汽車自動駕駛技術 DARPA Grand Challenge 2004 2016南京大學機器學習導論課程專用所有權保留機器學習能做什么?小數據上就已經很有用 2016南京大學機器學習導論課程專用所有權保留例如:畫作鑒別(藝術)畫作鑒別(painting authentication):確定作品的真?zhèn)尾斏w爾(1525-1569)的作品?出自 J. Hughes et al., PNAS 2009梵高(1853-1890)的作品?出自 C. Johnson et al., IEEE-SP, 2008 機器學習導論2016南京大學課程專用所有權保留例如:畫作鑒別(藝術)除專用技術手段外,
5、筆觸分析(brushstroke analysis) 是 畫 作 鑒定的重要工具;它旨在從視覺上判斷畫作中是否具有藝術家的特有“筆跡”。該工作對專業(yè)知識要求極高- 具有較高的繪畫藝術修養(yǎng)- 掌握畫家的特定繪畫習慣只有少數專家花費很大精力才能完成分析工作!很難同時掌握不同時期、不同流派多位畫家的繪畫風格!C. Johnson et al., IEEE-SP, 2008 論課程專用所有權16南京大學20機器學習導保留例如:畫作鑒別(藝術)真跡 + 贗品特有“筆跡”待鑒定畫作為了降低分析成本, 機器學習技術被引入自動鑒定分類模型Krller Mller美術館與Cornell等大學的學者對82幅梵高真
6、跡和6幅贗品進行分析,自動鑒別精度達 95% C. Johnson et al., IEEE-SP, 2008Dartmouth學院、巴黎高師的學者對8幅勃魯蓋爾真跡和5幅贗品進行分析,自動鑒別精度達 100% J. Hughes et al., PNAS 2009J. Mairal et al., PAMI12(對用戶要求低、準確高效、適用范圍廣) 2016南京大學機器學習導論課程專用所有權保留例如:古文獻修復(文化)古文獻是進行歷史研究的重要素材,但是其中很多損毀嚴重Dead Sea Scrolls (死海古卷)- 1947年出土- 超過30,000個羊皮紙片段Cairo Genizah-
7、 19世紀末被發(fā)現(xiàn)- 超過300,000個片段- 散布于全球多家博物館高水平專家的大量精力被用于古文獻修復L. Wolf et al., IJCV 2011 2016南京大學機器學習導論課程專用所有權保留例如:古文獻修復(文化)一個重要問題:原書籍已經變成分散且混雜的多個書頁,如何拼接相鄰的書頁?人工完成書頁拼接十分困難- 書頁數量大,且分布在多處- 部分損毀較嚴重,字跡模糊- 需要大量掌握古文字的專業(yè)人才近年來,古文獻的數字化浪潮給自動文學修復提供了機會 所有權保留2016南京大學機器學習導論課程專用例如:古文獻修復(文化)以色列特拉維夫大學的學者將機器學習用于自動的書頁拼接已確定相鄰已確定
8、不相鄰分類模型判斷是否相鄰專家確認相鄰在Cairo Genizah測試數據上,系統(tǒng)的自動判斷精度超過 93%新完成約 1,000 篇Cairo Genizah文章的拼接(對比:過去整個世紀,數百人類專家只完成了幾千篇文章拼接) 2016南京大學機器學習導論課程專用所有權保留機器學習能做什么?大數據上更驚人 2016南京大學機器學習導論課程專用所有權保留例如:幫助奧巴馬勝選(政治)時代周刊 2016南京大學機器學習導論課程專用所有權保留例如:幫助奧巴馬勝選(政治)通過機器學習模型: 在總統(tǒng)候選人第一次辯論后,分析出哪些選民將倒戈,為每位選民找出一個最能說服他的理由 精準定位不同選民群體,建議購買
9、冷門廣告時段,廣告資金效率比2008年提高14% 向奧巴馬推薦,競選后期應當在什么地方展開活動 那里有很多爭取對象 借助模型幫助奧巴馬籌集到創(chuàng)紀錄的10億美元例如:利用模型分析出,明星喬治克魯尼(George Clooney)對于年齡在40-49歲的美西地區(qū)女性頗具吸引力,而她們恰是最愿意為和克魯尼/奧巴馬共進晚餐而掏錢的人 喬治克魯尼為奧巴馬舉辦的競選籌資晚宴成功募集到1500萬美元 導論課程專用學習2016南京大學機器所有權保留例如:幫助奧巴馬勝選(政治)隊長:Rayid Ghani卡內基梅隆大學機器學習系首任系主任Tom Mitchell教授的博士生這個團隊行動保密,定期向奧巴馬報送結果
10、;被奧巴馬公開稱為總統(tǒng)競選的“核武器按鈕”(“They are our nuclear codes”) 權專用所有2016南京大學機器學習導論課程保留約翰 麥卡錫(1927-2011)“人工智能之父”1971年圖靈獎1956年夏美國達特茅斯學院J. McCarthy, M. Minsky, N. Lochester, C. E. Shannon,H.A. Simon, A. Newell, A. L. Samuel 等10余人達特茅斯會議標志著人工智能這一學科的誕生John McCarthy (1927 - 2011):1971年獲圖靈獎, 1985年獲IJCAI終身成就獎。人工智能之父。他提
11、出了“人工智能”的概念,設計出函數型程序設計語言Lisp,發(fā)展了遞歸的概念,提出常識推理和情境演算。出生于共產黨家庭,從小閱讀10萬個為什么,中學時自修CalTech的數學課程,17歲進入CalTech時免修兩年數學,22歲在Princeton獲博士學位,37歲擔任 Stanford大學AI實驗室主任。 機器學習源自“人工智能”Artificial Intelligence (AI), 1956 - 權程專用所有保16南京大20學機器學習導論課留赫伯特 西蒙(1916-2001)1975年圖靈獎第一階段:推理期1956-1960s: Logic Reasoning 出發(fā)點:“數學家真聰明!”
12、主要成就: 自動定理證明系統(tǒng) (例如,西蒙與紐厄爾的“Logic Theorist”系統(tǒng))漸漸地,研究者們意識到,僅有邏輯推理能力是不夠的 阿倫 紐厄爾(1927-1992)1975年圖靈獎 用所有權保留2016南京大學機器學習導論課程專 出發(fā)點:“知識就是力量!”愛德華 費根鮑姆(1936- )1994年圖靈獎 主要成就: 專家系統(tǒng) (例如,費根鮑姆等人的“DENDRAL”系統(tǒng))漸漸地,研究者們發(fā)現(xiàn),要總結出知識再“教”給系統(tǒng),實在太難了 第二階段:知識期1970s -1980s: Knowledge Engineering 2016南京大學機器學習導論課程專用所有權保留 出發(fā)點:“讓系統(tǒng)自
13、己學!”第三階段:學習期1990s -now: Machine Learning 主要成就: 機器學習是作為“突破知識工程瓶頸”之利器而出現(xiàn)的恰好在20世紀90年代中后期,人類發(fā)現(xiàn)自己淹沒在數據的汪洋中,對自動數據分析技術機器學習的需求日益迫切 權專用所有16南京大學機器學保習導論留課程20 汽車自動駕駛(DARPA Grand Challenge) 機器學習已經“無處不在”入侵檢測Web搜索生物信息學 決策助手(DARPA)火星機器人 (JPL) 2016南京大學機器學習導論課程專用所有權保留今天的“機器學習”已經是一個廣袤的學科領域經常被談到的“深度學習”(Deep Learning)僅是
14、機器學習中的一個小分支例如,這是第32屆國際機器學習大會的“主題領域”2006年,美國CMU(卡內基梅隆大學)成立“機器學習系” 導論課程專用所2016南京大學機器學習有權保留大數據時代的關鍵技術奧巴馬提出“大數據計劃”后,美國NSF進一步加強資助UC Berkeley研究如何整合將”數據”轉變?yōu)椤毙畔ⅰ钡娜箨P鍵技術機器學習、云計算、眾包(crowd sourcing)整合三大關鍵技術 權保2016南京留大學機器學習導論課程專用所有大數據時代,機器學習必不可少收集、傳輸、存儲大數據的目的,是為了“利用”大數據沒有機器學習技術分析大數據,“利用”無從談起 權有所習導論課程專用保2016南京大學
15、機器學留基本術語 數據集; 訓練, 測試示例(instance), 樣例(example)樣本(sample)屬性(attribute), 特征(feature); 屬性值屬性空間, 樣本空間, 輸入空間特征向量(feature vector)標記空間, 輸出空間 監(jiān)督學習(supervised learning)無監(jiān)督學習(unsupervised learning) 假設(hypothesis)真相(ground-truth)學習器(learner) 分類, 回歸 二分類, 多分類 正類, 反類未見樣本(unseen instance)未知“分布”獨立同分布(i.i.d.)泛化(gener
16、alization) 權2016南京大學機器學習導論課程專用所有保留假設空間(色澤=?)(根蒂=?)(敲聲=?)好瓜學習過程 在所有假設(hypothesis)組成的空間中進行搜索的過程目標: 找到與訓練集“匹配”(fit)的假設假設空間的大?。簄1 x n2 x n3 + 1 權用所有保留論課程專機器學習導2016南京大學例如: (青綠; 蜷縮; 沉悶)應該采用哪一個模型(假設)?版本空間版本空間(version space): 與訓練集一致的假設集合濁響濁響在面臨新樣本時,會產生不同的輸出 課程專用所有2016南京大學機器學習導論權保留歸納偏好(inductive bias)機器學習算法在
17、學習過程中對某種類型假設的偏好A更好?B更好?一般原則:奧卡姆剃刀(Ocams razor)任何一個有效的機器學習算法必有其偏好學習算法的歸納偏好是否與問題本身匹配,大多數時候直接決定了算法能否取得好的性能! 權有用16南京大學機器學習導論課程專所保20留哪個算法更好?沒有免費的午餐!NFL定理:一個算法若在某些問題上比另一個算法好,必存在另一些問題,比好。 2016南京大學機器學習導論課程專用所有權保留NFL定理簡單起見,假設樣本空間和假設空間 離散,令代表算法基于訓練數據 X 產生假設 h 的概率,f 代表要學的目標函數, 在訓練集之外所有樣本上的總誤差為考慮二分類問題,目標函數可以為任何函數,函數空間為,對所有可能的 f 按均勻分布對誤差求和,有 權大學機器學習導論課程專用2016南京所有保留NFL定理總誤差與學習算法無關!所有算法一樣好! 權器學習導論課程專用所有2016南京大學機保留NFL定理的寓意NFL定理的重要前提:所有“問題”出現(xiàn)的機會相同、或所有問題同等重要脫離具體問題,空泛地談論“什么學習算法更好”毫無意義 !實際情形并非如此;我們通常只關注自己正在試圖解決的問題 2016南京大學機器學習導論課程專用所有權保留前往第二站