機器學習

用手机看条目

出自 MBA智库百科(https://wiki.mbalib.com/)

機器學習(Machine Learning)

目錄

什麼是機器學習

  機器學習是一門多領域交叉學科,涉及概率論統計學、逼近論、凸分析、演算法複雜度理論等多門學科。專門研究電腦怎樣模擬或實現人類的學習行為,以獲取新的知識技能,重新組織已有的知識結構使之不斷改善自身的性能。它是人工智慧的核心,是使電腦具有智能的根本途徑。它的應用已遍及人工智慧的各個分支,如專家系統、自動推理、自然語言理解、模式識別電腦視覺、智能機器人等領域。其中尤其典型的是專家系統中的知識獲取瓶頸問題,人們一直在努力試圖採用機器學習的方法加以剋服。

  學習能力是智能行為的一個非常重要的特征,但至今對學習的機理尚不清楚。人們曾對機器學習給出各種定義。H.A.Simon認為,學習是系統所作的適應性變化,使得系統在下一次完成同樣或類似的任務時更為有效。R.s.Michalski認為,學習是構造或修改對於所經歷事物的表示。從事專家系統研製的人們則認為學習是知識的獲取。這些觀點各有側重,第一種觀點強調學習的外部行為效果,第二種則強調學習的內部過程,而第三種主要是從知識工程實用性角度出發的。

  機器學習在人工智慧的研究中具有十分重要的地位。一個不具有學習能力的智能系統難以稱得上是一個真正的智能系統,但是以往的智能系統都普遍缺少學習的能力。例如,它們遇到錯誤時不能自我校正;不會通過經驗改善自身的性能;不會自動獲取和發現所需要的知識。它們的推理僅限於演繹而缺少歸納,因此至多只能夠證明已存在事實、定理,而不能發現新的定理、定律和規則等。隨著人工智慧的深入發展,這些局限性表現得愈加突出。正是在這種情形下,機器學習逐漸成為人工智慧研究的核心之一。它的應用已遍及人工智慧的各個分支,如專家系統、自動推理、自然語言理解、模式識別、電腦視覺、智能機器人等領域。其中尤其典型的是專家系統中的知識獲取瓶頸問題,人們一直在努力試圖採用機器學習的方法加以剋服。

機器學習的研究與發展

  機器學習的研究是根據生理學、認知科學等對人類學習機理的瞭解,建立人類學習過程的計算模型或認識模型,發展各種學習理論和學習方法,研究通用的學習演算法併進行理論上的分析,建立面向任務的具有特定應用的學習系統。這些研究目標相互影響相互促進。

  自從1980年在卡內基梅隆大學召開第一屆機器學習研討會以來,機器學習的研究工作發展很快,已成為中心課題之一。隨著機器學習的蓬勃發展,人們在工作中累積了大量可供測試演算法的數據集或者超大數據集,機器學習工作者在此基礎上可以進行更精準的研究,例如ICCV2011年馬爾獎:相對屬性的數據;AOL-user-ct-collection數據集;科雷爾圖片特征數據集(UCI);植被型數據集(UCI)等等。

  學習是人類具有的一種重要智能行為,但究竟什麼是學習,長期以來卻眾說紛紜。社會學家、邏輯學家和心理學家都各有其不同的看法。

  比如,Langley(1996) 定義的機器學習是“機器學習是一門人工智慧的科學,該領域的主要研究對象是人工智慧,特別是如何在經驗學習中改善具體演算法的性能”。(Machine learning is a science of the artificial. The field's main objects of study are artifacts, specifically algorithms that improve their performance with experience.')

  Tom Mitchell的機器學習(1997)對資訊理論中的一些概念有詳細的解釋,其中定義機器學習時提到,“機器學習是對能通過經驗自動改進的電腦演算法的研究”。(Machine Learning is the study of computer algorithms that improve automatically through experience.)

  Alpaydin(2004)同時提出自己對機器學習的定義,“機器學習是用數據或以往的經驗,以此優化電腦程式的性能標準。”(Machine learning is programming computers to optimize a performance criterion using example data or past experience.)

  儘管如此,為了便於進行討論和估計學科的進展,有必要對機器學習給出定義,即使這種定義是不完全的和不充分的。顧名思義, 機器學習是研究如何使用機器來模擬人類學習活動的一門學科。稍為嚴格的提法是:機器學習是一門研究機器獲取新知識和新技能,並識別現有知識的學問。這裡所說的“機器”,指的就是電腦,電子電腦,中子電腦、光子電腦或神經電腦等等。

  機器能否象人類一樣能具有學習能力呢?1959年美國的塞繆爾(Samuel)設計了一個下棋程式,這個程式具有學習能力,它可以在不斷的對弈中改善自己的棋藝。4年後,這個程式戰勝了設計者本人。又過了3年,這個程式戰勝了美國一個保持8年之久的常勝不敗的冠軍。這個程式向人們展示了機器學習的能力,提出了許多令人深思的社會問題哲學問題。

  機器的能力是否能超過人的,很多持否定意見的人的一個主要論據是:機器是人造的,其性能和動作完全是由設計者規定的,因此無論如何其能力也不會超過設計者本人。這種意見對不具備學習能力的機器來說的確是對的,可是對具備學習能力的機器就值得考慮了,因為這種機器的能力在應用中不斷地提高,過一段時間之後,設計者本人也不知它的能力到了何種水平。

  機器學習是人工智慧研究較為年輕的分支,它的發展過程大體上可分為4個時期。

  第一階段是在50年代中葉到60年代中葉,屬於熱烈時期。

  第二階段是在60年代中葉至70年代中葉,被稱為機器學習的冷靜時期。

  第三階段是從70年代中葉至80年代中葉,稱為復興時期。

  機器學習的最新階段始於1986年。

  機器學習進入新階段的重要表現在下列諸方面:

  (1) 機器學習已成為新的邊緣學科併在高校形成一門課程。它綜合應用心理學、生物學和神經生理學以及數學、自動化和電腦科學形成機器學習理論基礎。

  (2) 結合各種學習方法,取長補短的多種形式的集成學習系統研究正在興起。特別是連接學習符號學習的耦合可以更好地解決連續性信號處理中知識與技能的獲取與求精問題而受到重視。

  (3) 機器學習與人工智慧各種基礎問題的統一性觀點正在形成。例如學習與問題求解結合進行、知識表達便於學習的觀點產生了通用智能系統SOAR的組塊學習。類比學習與問題求解結合的基於案例方法已成為經驗學習的重要方向。

  (4) 各種學習方法的應用範圍不斷擴大,一部分已形成商品。歸納學習的知識獲取工具已在診斷分類型專家系統中廣泛使用。連接學習在聲圖文識別中占優勢。分析學習已用於設計綜合型專家系統。遺傳演算法與強化學習在工程式控制制中有較好的應用前景。與符號系統耦合的神經網路連接學習將在企業智能管理與智能機器人運動規劃中發揮作用。

  (5) 與機器學習有關的學術活動空前活躍。國際上除每年一次的機器學習研討會外,還有電腦學習理論會議以及遺傳演算法會議。

本條目對我有幫助13
MBA智库APP

扫一扫,下载MBA智库APP

分享到:
  如果您認為本條目還有待完善,需要補充新內容或修改錯誤內容,請編輯條目

本条目由以下用户参与贡献

Tracy,林晓辰,nonameh.

評論(共0條)

提示:評論內容為網友針對條目"機器學習"展開的討論,與本站觀點立場無關。

發表評論請文明上網,理性發言並遵守有關規定。

MBA智库
打开APP

以上内容根据网友推荐自动排序生成