Python預測分析與機器學習(簡體書)
商品資訊
系列名:開發者書庫·Python
ISBN13:9787302592549
出版社:清華大學出版社(大陸)
作者:王沁晨
出版日:2022/05/01
裝訂/頁數:平裝/324頁
規格:24cm*17cm (高/寬)
版次:一版
商品簡介
本書從理解問題定義、了解數據內的高層信息、數據清理、視化數據,到基礎建模、模型優化,分享一個數據分析師的視角與思路。在預測分析的流程中,一步步用詳細的圖文代碼講解使用到的庫,如何正確使用各個庫中的方法和函數,以及在遇到類似的問題時如何套用學過的知識。
本書共8章。第1章對預測分析的流程進行一個高層次的概述。第2章介紹本書需要安裝使用的庫,並講解數據清理步驟的執行。第3章講解基礎建模需考慮的細節,結合第4章的模型選擇,可以搭建一個基礎的預測管道。第5章和第6章分別從模型和數據的角度講解如何優化預測表現。第7章講解時間序列這一特殊數據的預測方法。最後,第8章總結全書學習到的內容,解決一個實戰問題。
本書面向3類讀者。第1類,有編程基礎但毫無數據科學背景,有意入門的讀者;第2類,有數據科學理論基礎,有意進入實操的讀者,如剛畢業沒有業界經驗的學生;第3類,有數據科學理論基礎與實操經驗,但日常工作集中在數據分析管道中的數據分析師。
作者簡介
王沁晨,多倫多大學聖喬治校區計算機專業,曾在加拿大零售企業Loblaw Companies擔任機器學習數據分析師,從公司傳統的大型數據庫中篩選有效信息、清理數據、人工數據挖掘、視化,到基礎建模、模型優化、數據再篩選,再到結合商業需求創造擴展性強的實用管線,讓項目從理論性的頭腦風暴變現為商業價值。
序
筆者在Loblaw Companies任職全棧數據分析師期間,深刻體會到了有時許多校內學習到的理論知識並非即刻適用。這樣的傳統零售業在走向數據驅動模式時,往往不需要使用龐大的深度學習模型,或其他消耗巨大算力的算法。一些可解釋性高,所需數據量較小的模型足以貢獻十分可觀的商業價值。相比起走學術路徑中理論基礎的重要性,在行業實操中更重要的是掌握數據分析的全過程,以及擁有足夠的經驗讓步驟間有節奏地配合,因此筆者決定寫這本書,將預測分析中重點的步驟和其間配合以可著手的方式展現給讀者。
本書的著重點在於預測分析與機器學習的實戰思路,其中加入算法或模型的理論知識介紹,讓讀者在學習如何運用的同時,更加深入地學習為何在該實踐場景下使用該特定算法或模型。書中側重講解實操中常用、回報率高的算法。內容簡單易懂,圖文搭配,借鑒實際例子讓學習過程更具實用感。
本書致力於幫助3類讀者在預測分析與機器學習這條路上有所成長。第1類,有Python編程基礎但缺乏數據科學背景,有意入門的讀者。書中不設置有關數據科學背景的閱讀門檻,每個相關背景都將先介紹再進行引用。另外,因本書偏向實操而非理論,內容對於這一類讀者將更加容易消化,書中的代碼注釋豐富,容易著手跟隨。第2類,有數據科學理論基礎知識,有意進入實操的讀者,例如缺乏業界經驗的學生。這類讀者已經掌握了許多理論背景知識,只是缺少實踐經歷。本書有效地展示理論算法如何在實操中運行,以及各理論知識運用的搭配。第3類,有數據科學理論基礎與實操經驗,但日常工作集中在數據分析管道中的數據分析師。本書可以幫助這類讀者了解在工作中如何與同事配合。在項目經理職位的讀者也可以通過閱讀本書更好地理解隊內成員的工作、難點,以及定位項目突破口。
本書還包含部分理論知識,希望通過介紹算法的運作原理,幫助讀者建立面對問題選擇解決方案的思路。瀏覽目錄便會發現,第4章不到100頁的內容包含了大量機器學習模型及算法,每種算法的介紹從其運作原理講起,到將其運用在一個實際例子中。筆者盡量平衡了理論深度與實踐思路的講解,希望可以在有限的篇幅中幫助本書面對的群體。
機器學習這一領域有著長達數十年的理論研究,其內容包羅萬象。筆者學識有限,書中難免存在疏漏,望得到各位讀者的指正。
王沁晨
2022年2月
主題書展
更多書展今日66折
您曾經瀏覽過的商品
購物須知
大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。
特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。
無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。
為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。
若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。