歡迎來到魔據教育大數據學院,專注大數據工程師培養!
當前位置:首頁 > 學習資料 > 講師博文
發布日期:2018-04-19

首先是這一天,并且是訪問百度的日志中的IP取出來,逐個寫入到一個大文件中。注意到IP是32位的,最多有個2^32個IP。同樣可以采用映射的方法,比如模1000,把整個大文件映射為1000個小文件,再找出每個小文中出現頻率最大的IP(可以采用hash_map進行頻率統計,然后再找出頻率最大的幾個)及相應的頻率。然后再在這1000個最大的IP中,找出那個頻率最大的IP,即為所求。

發布日期:2017-11-28

Hbase理論

發布日期:2017-11-28

Yarn的運行原理

發布日期:2017-11-28

Hive的三種復雜數據類

發布日期:2017-10-23

Kyligence Analytics Platform(KAP)大數據智能分析平臺是基于Apache Kylin的,在超大數據集上提供亞秒級分析能力的企業級數據倉庫產品,為業務用戶、分析師及工程師提供簡便、快捷的大數據分析服務。

發布日期:2017-10-23

今天小哥想和廣大IT發燒友交流一下大數據的數據流轉,現在大數據正如火如荼的發展,其實對于現今來說大數據處理技術早已不再是秘密,甚至很多關鍵的技術都已經做到源碼公開,今天就和大家分享一個大數據中非常重要的組件

發布日期:2017-10-23

Hive是基于Hadoop的一個數據倉庫工具,可以將結構化的數據文件映射為一張數據庫表,并提供類SQL查詢功能。

發布日期:2017-10-23

在開啟hive的時候有很多錯誤信息,其中有一個關鍵信息, Name nodeis in safe mode

發布日期:2017-10-23

hadoop的最基本的5個進程中datanode無法正常啟動,進程在開啟一段時間后莫名其妙掛掉,這篇文章主要分析掛掉的原因以及解決方案

發布日期:2017-08-17

邏輯回歸,區別于線性回歸,最主要的特點就一個:它的因變量是0-1型數據。啥是0-1型數據?就是這個數據有,且僅有兩個可能的取值。數學上為了方便,把其中一個記作是0,另外一個記作是1,所以邏輯回歸通常也被稱為0-1回歸。邏輯回歸的因變量是離散變量,自變量可以是混合變量。

 27    1 2 3 下一頁 尾頁

全國咨詢熱線:400-690-5006,值班手機:18501996998(7*24小時)

在線咨詢:李老師QQ(226594285),陳老師QQ(428683440)

企業合作服務專線:010-82340234-821, 院校合作洽談專線:010-82340234

Copyright 2001-2017 魔據教育 - 北京華育興業科技有限公司 版權所有,京ICP備17018991號-2

免費在線咨詢立即咨詢

免費索取技術資料立即索取

大數據技術交流QQ:226594285

電話咨詢010-82340234

119期两码中特免费公开