《大數據架構詳解》讀后感800字
最近,再次認真閱讀了朱潔、羅華霖編著的《大數據架構詳解》這本書的2016年版,感覺收獲頗多。伴隨著互聯網產業以及以云計算為代表的計算、存儲和通信技術的蓬勃發展,大數據應時、應勢而來。其架構紛繁復雜,其以hadoop為代表的技術生態也是越來越龐大。《大數據架構詳解》這本書抽絲剝繭,著重從架構的角度對大數據進行了清晰的闡述。
該書全面、系統的同時很接地氣:既結合具體業務場景(運營商的運維質量管理、客戶體驗提升、市場運維支撐、數據管理平臺等),又結合具體技術實戰(Hive、Stom、Spark、Flume、Kafka、YARN、Shuffle、MapReduce等,機器學習、深度學習、GPU計算等)。很認同書中闡述的觀點——“大數據是一種問題解決思路,是一系列技術的集合”。架構最終是服務于業務的,而大數據就是解決業務問題的一個重要思路。以前技術條件不具備(如計算和網絡傳輸速度、存儲能力等),現在技術上能夠落地了。這個落地需要一組技術的支撐,而大數據架構系統地提供了相對完備、且在日益豐富的技術工具集(覆蓋數據獲取、存儲、處理、技術、交互式分析、機器學習等)。
此外,該書重點對“大數據云化”進行了討論。以虛擬化為基礎、軟件定義資源為主要特征的云計算,已經成為當前最重要的IT基礎設施之一。大數據上云既是必然也是必須。針對集群模式和服務模式兩種大數據云服務的模式,書中分別進行了討論,對理解大數據的實施、部署規劃很有幫助。
《大數據架構詳解》一書中,也對整體同步并行計算模型(Bulk Synchronous Parallel Computing Model,簡稱BSP模型)從基本原理、特點以及實現等進行了全面分析,并于MapReduce進行了對比。并行計算核心目標是為了更快、更強的算力,而大數據與BSP的融合也是大數據進一步發展的重要趨勢。該書還從開發文化的高度展望了大數據的未來發展,并提出了開發與運維組合的觀點(DevOps理念),(最后著重強調了速度的重要性。一切應對措施如果不能在一定時限內完成將失去實質意義,更快分析過去、更快研判現在、更快擁抱未來(變化)將是大數據架構不斷演進的重要目標。
該書從業務到技術,從技術到文化,對大數據架構進行了系統、全面、詳實的討論,并且深入淺出、容易理解。很推薦大數據從業者和關注大數據發展的朋友們閱讀、學習。作者:宇塵埃
|