本書是一本數(shù)據(jù)科學的入門書籍。每個知識點盡量從實際的應用案例出發(fā),從數(shù)據(jù)出發(fā),以問題為導向,在解決問題中學習數(shù)據(jù)挖掘、機器學習等數(shù)據(jù)科學相關方法。本書將數(shù)據(jù)讀寫、數(shù)據(jù)清洗和預處理作為開端,逐漸深入到和數(shù)據(jù)科學相關的決策樹、支持向量機、神經(jīng)網(wǎng)絡、無監(jiān)督學習等知識。此外,結合數(shù)據(jù)科學的實際應用,書中還講解了推薦算法、文本挖掘和社交網(wǎng)絡分析等熱門實用技術。本書在寫作過程中盡量刪去太過抽樣的理論,讓具有一定高等數(shù)學和概率論基礎的讀者就能看得懂。當然,如果讀者對方法原理確實不感興趣,只是為了用R程序?qū)崿F(xiàn)某種方法,可以跳過方法只看案例和程序。本書適合作為高校數(shù)據(jù)科學、機器學習、數(shù)據(jù)挖掘、大數(shù)據(jù)分析等相關專業(yè)的研究生和高年級本科的教科書,也適合作為相關企業(yè)的數(shù)據(jù)科學家、數(shù)據(jù)挖掘工程師、數(shù)據(jù)分析師及數(shù)據(jù)科學的愛好者等的工具書。方匡南,現(xiàn)為廈門大學經(jīng)濟學院統(tǒng)計系教授、博士生導師,耶魯大學博士后,廈門大學數(shù)據(jù)挖掘研究中心副主任,靠前統(tǒng)計學會會士,全國工業(yè)統(tǒng)計學會理事、廈門統(tǒng)計學會常務理事。主要研究方向為數(shù)據(jù)挖掘、機器學習、應用統(tǒng)計。曾先后在國外非常不錯期刊發(fā)表論文七十多篇,主持了國家自然科學基金等項目二十多項。多年從事大數(shù)據(jù)及相關領域研究與教學,著有《R數(shù)據(jù)分析》等多部相關作品。
|