機器學習正是這樣一門學科,它致力于研究如何通過計算的手段,利用經(jīng)驗來改善系統(tǒng)自身的性能.在計算機系統(tǒng)中,“經(jīng)驗”通常以“數(shù)據(jù)”形式存在,因此,機器學習所研究的主要內(nèi)容,是關于在計算機上從數(shù)據(jù)中產(chǎn)生“模型”(model)的算法,即“學習算法”(learning algorithm).有了學習算法,我們把經(jīng)驗數(shù)據(jù)提供給它,它就能基于這些數(shù)據(jù)產(chǎn)生模型;在面對新的情況時(例如看到一個沒剖開的西瓜),模型會給我們提供相應的判斷(例如好瓜).如果說計算機科學是研究關于“算法”的學問,那么類似的,可以說機器學習是研究關于“學習算法”的學問,本書用“模型”泛指從數(shù)據(jù)中學得的結果,有文獻用“模型”指全局性結果(例如一棵決策樹),而用“模式”指局部性結果(例如一條規(guī)則).?