大數據

大數據解決方案-(基礎篇)

學大數據分析與應用課程的首要任務,是先了解統計與建模方法和數據挖掘方法所呈現出來的效果,然后依次學習Excel數據處理及編程、MySQL數據庫的簡單操作及Hadoop的基礎知識。從而為進階、提高打好基礎?;A統計與建模方法演示探索性數據分析演示常用概率分布和漸進性演示置信區間和假設檢驗演示線性回歸模型演示廣義線性回歸模型演示數據挖掘方法演示分類預測基本流程演示數據預處理演示分類方法演示聚類分析演示

大數據學習
Hadoop
2019-07-20 16:14

看《長安十二時辰》可以了解哪些算法知識

最近,小吳在追一部古裝劇 ----《長安十二時辰》。故事講得是在上元節前夕,長安城混入可疑人員,身陷囹圄的張小敬臨危受命,與少年天才李必攜手在十二時辰內破除隱患。

五分鐘學算法
數據分析
2019-07-18 17:09

從《長安十二時辰》看企業中臺戰略

DT時代,我們相信中臺戰略是企業數字化升級的必然選擇,而未來的數據中臺一定是「AI驅動的數據中臺」,這個中臺包括「計算平臺+算法模型+智能硬件」,不僅要在端上具備視覺數據的收集和分析能力,還要能通過Face ID,幫助企業去打通業務數據,最終建立線上線下觸達和服務消費者的能力。

StartDT
數據分析
2019-07-12 23:14

美團點評基于 Flink 的實時數倉建設實踐

近些年,企業對數據服務實時化服務需求日益增多。本文整理了常見實時數據組件的性能特點和適用場景,介紹了美團如何通過 Flink 引擎構建實時數據倉庫,從而提供高效、穩健的實時數據服務。此前我們美團技術博客發布過一篇文章《流計算框架 Flink 與 Storm 的性能對比》,對 Flink 和 Storm 兩個引擎的計算性能進行了比較。本文主要闡述使用 Flink 在實際數據生產上的經驗。

美團技術團隊
數據分析
2019-07-08 18:07

干貨 | 每天十億級數據更新,秒出查詢結果,ClickHouse在攜程酒店的應用

攜程酒店每天有上千表,累計十多億數據更新,如何保證數據更新過程中生產應用高可用,每天有將近百萬次數據查詢請求,用戶可以從粗粒度國家省份城市匯總不斷下鉆到酒店,房型粒度的數據,我們往往無法對海量的明細數據做進一步層次的預聚合,大量的關鍵業務數據都是好幾億數據關聯權限,關聯基礎信息,根據用戶場景獲取不同維度的匯總數據;

大數據頻道
數據挖掘
2019-07-05 13:59

分析數據分析的幾大黃金法則

  大數據時代的到來使人類的認識變得更精確系統、更全面廣泛、更快速有效。然而面對各種數據源收集來的海量數據,究竟如何對其進行歸類、計算、建模和解釋,卻需要高超的智慧。因數據本身始終沉默,需要依賴認識主體的賦予?! 槭裁茨愕臄祿治龀晒偸请y以落地?數據分析的價值總是遠遠低于預期?相信看完這篇文章,每個人都能找到一個屬于自己的答案。本人先后在電力、軍工、金融等行業擔任數據分析師,有多年行業經驗。從

大數據小知識
數據分析
2019-07-02 14:19

宜信開源|手把手教你安裝第一個LAIN應用

部署安裝一個LAIN應用。

宜信技術學院
數據分析
2019-07-01 14:53

運營商大規模數據集群治理的實踐指南

數據治理基本上可以理解為工程一的核心目標;大規模集群的治理對應工程二,它需要長期支撐工程一的具體建設任務,并為數據資產管理體系的運營夯實基礎。

技術瑣話
數據分析
2019-06-28 18:26

10分鐘搞懂:億級用戶的分布式數據存儲解決方案!

6月6日晚,林志玲與Akira公布婚訊、徐蔡坤祝福高考同學超常發揮,粉絲們百萬的轉發和點贊造成微博短暫宕機。分布式數據庫和分布式存儲是分布式系統中難度最大、挑戰最大,也是最容易出問題的地方?;ヂ摼W公司只有解決分布式數據存儲的問題,才能支撐更多次億級用戶的涌入。

大數據頻道
數據分析
2019-06-28 11:38

阿里大數據產品Dataphin上線公共云,將助力更多企業構建數據中臺

日前,由阿里數據打造的智能數據構建與管理Dataphin,重磅上線阿里云-公共云,開啟智能研發版本的公共云公測!在此之前,Dataphin以獨立部署方式輸出并服務線下客戶,已助力多家大型客戶高效自動化構建企業數據中臺,不僅大幅度提升大數據研發效率,實現數據資產的標準化管理,更通過數據服務體系讓數據智能驅動業務。智能數據構建與管理Dataphin是企業在建設數據中臺中必不可少的核心組成部分,是阿里巴

代碼派就是我
數據分析
2019-06-26 17:37

做銀行家里的數據專家:ING探索大數據時代下的金融最佳實踐

進入互聯網大數據時代后,ING目標明確的要把自己打造成一家數據驅動型企業,將分析技能作為首要戰略重點,并投資于人工智能、大數據分析,希望能借此優化業務流程。

大數據文摘
數據分析
2019-06-25 17:41

HBase Replication詳解

本文從全局出發,詳細講解了HBase的Replication和Replication Endpoint的用法及實踐。

小米運維
數據分析
2019-06-25 17:33

HDFS 源碼解讀:HadoopRPC 實現細節的探究

HDSF 作為分布式文件系統,常常涉及 DataNode、NameNode、Client 之間的配合、相互調用才能完成完整的流程。為了降低節點之間的耦合性,HDFS 將節點間的調用抽象成不同的接口,其接口主要分為兩類:HadoopRPC 接口和基于 TCP 或 HTTP 的流式接口。流式接口主要用于數據傳輸,HadoopRPC 接口主要用于方法調用。HadoopRPC 框架設計巧妙,本文將結合 hadoop2.7 源碼,對 HadoopRPC 做初步剖析。

滴滴技術
Hadoop
2019-06-23 23:02

如何設計實時數據平臺(技術篇)

本文從技術角度入手,介紹RTDP的技術選型和相關組件,探討適用不同應用場景的相關模式。

宜信技術學院
數據分析
2019-06-21 13:50

【流沙】宜信安全數據平臺實踐

宜信結合自己的實際情況,實現了一套集采集、分析和存儲為一體的安全數據平臺——流沙平臺。本文重點介紹一下流沙平臺的架構,相比于OpenSOC做了哪些優化及改進的地方以及流沙平臺在落地過程中的經驗總結。

宜信技術學院
數據分析
2019-06-14 10:17

157億美元挑戰微軟!全球最大客戶關系服務商Salesforce收購Tableau

美國時間周一,客戶關系管理(CRM) 軟件服務提供商Salesforce.com同意斥資157億美元收購大數據公司Tableau Software,望為其客戶提供更多的數據見解。

大數據文摘
數據分析
2019-06-11 16:01

HDFS短路讀詳解

Hadoop的一個重要思想就是移動計算,而不是移動數據。我們更愿意盡可能將計算移動到數據所在節點。因此,HDFS中經常出現客戶端和數據在一個節點上,當客戶端讀取一個數據塊時,就會出現本地讀取。例如HBase場景,ResionServer寫數據一般在HDFS中都會存儲三備份副本并且肯定會往本地節點寫一備份,當ResionServer讀取該數據時也會優先選擇同一節點的數據進行讀取。

小米運維
Hadoop
2019-06-04 17:18

Elasticsearch如何做到億級數據查詢毫秒級返回?

這個問題說白了,就是看你有沒有實際用過 ES,因為啥?其實 ES 性能并沒有你想象中那么好的。很多時候數據量大了,特別是有幾億條數據的時候,可能你會懵逼的發現,跑個搜索怎么一下 5~10s,坑爹了。第一次搜索的時候,是 5~10s,后面反而就快了,可能就幾百毫秒。

數據和云
數據分析
2019-05-31 16:44

四萬字歌詞分析:那些年,我們一起追的五月天到底在唱什么?

你見過自帶熒光棒、中途大合唱、放完不離場的電影觀眾么?如果你去電影院看了《五月天人生無限公司》,那么,你一定明白文摘菌在說什么。如果你還沒有看過,文摘菌這里弱劇透一下,電影的情節是,呃——5位平均年齡超過四十歲的中年男人,靠唱歌打敗了怪獸。

大數據文摘
數據分析
2019-05-31 16:31

flink 有狀態(stateful)的計算

flink在計算的時候可以將一個狀態保存在計算過程中 在需要的時候來使用

hgs19921112
數據分析
2019-05-24 13:50
 上一頁 1 2 3 4 5 6 7 下一頁
30岁的男人干啥赚钱快赚钱多 福彩3d试机号是多少 山西彩票11选5开奖 辽宁35选7好运4 贵州快3和值号码推荐 山西快乐十分玩法中奖规则 江苏十一选五开奖遗漏号 河北11选5一定牛任5遗漏 快乐赛车是国家福利彩票 配资平台哪个好n配资平台 陕西快乐10分钟开奖结果查询