-
邀請演講您好,感謝您的關注和支持。大數據"殺熟"的實質是平臺方利用所掌握的海量數據對用戶需求做出精準分析,以達到"不同用戶不同定價"的目的,從而使自己的利益最大化。這個過程中,從數據采集、數據存儲、數據處理到數據分析,都涉及到方方面面的前沿技術。數據采集與預處理由于數據經常有著不同的來源,需要對數據做進一步集成處理或整合處理,將來自不同數據集的數據收集、整理、清洗、轉換后,生成到一個新的數據集,為后續查詢和分析處理提供統一的數據視圖。所用工具有Data Flux、Data Stage及Informatica Power Center等。數據存儲與管理傳統的數據存儲和管理以結構化數據為主,而大數據往往是半結構化和非結構化數據為主、結構化數據為輔,需要對不同類型的數據內容檢索、交叉比對、深度挖掘與綜合分析。MPP(Massive Parallel Processing)分布式計算模式可以管理大規模結構化數據,Hadoop則可以實現對半結構化和非結構化數據的處理。大數據計算大數據計算模式,即根據大數據的不同數據特征和計算特征,從多樣性的大數據計算問題和需求中提煉并建立的各種高層抽象(abstraction)或模型(model)。典型的大數據計算模式包括迭代計算、批處理計算、內存計算、流式計算(Spark Streaming)、數據查詢分析計算(Shark)以及圖計算(GraphX)等。大數據分析對大數據的深度分析主要基于大規模的機器學習技術,由于基于機器學習的大數據分析具有迭代性、容錯性、參數收斂的非均勻性等特點,直接應用傳統的分布式計算系統應用于大數據分析,很大比例的資源都浪費在通信、等待、協調等非有效的計算上。研究人員開發了一系列接口簡單容錯性強的分布式計算框架服務于大數據分析算法,以MapReduce、Spark和參數服務器ParameterServer等為代表。大數據可視化可視化通過交互式視覺表現的方式來幫助人們探索和理解復雜的數據。大規模數據的可視化主要是基于并行算法設計的技術,結合多分辨率表示等方法,主要涉及數據流線化、任務并行化、管道并行化和數據并行化4 種基本技術。微軟的大規模機器學習可視化平臺(Azure Machine Learning)、阿里巴巴旗下的大數據分析平臺御膳房都是互動式大數據分析平臺的案例。
-
易鑫集團2023年年報:新能源車融資交易量同比增長206%至11.6萬臺
2月29日,易鑫集團(HK.2858,以下簡稱“易鑫”)披露年報,展現了其在新能源車業務上的高速成長。公告數據顯示,2023年易鑫新能源車融資交易量同比增長206%,至11.6萬臺,融資交易金額達到124億元,同比增長200%。 新能源車已是汽車產業發展重點。根據乘用車市場信息聯席會數據,2023年國內新能源汽車零售銷量為774萬輛,同比增長36%。作為一家專業的汽車金融交易平臺,易鑫數年前即開始前瞻性布局新能源車這一高潛力業務。從去年數據來看,不僅在相關交易量和交易額上取得高速增長,新能源車融資額在其新車業務中的占比亦持續上升,2023年下半年達到33%。

掃一掃
下載《前瞻經濟學人APP》進行提問
與資深行業研究員/經濟學家互動交流讓您成為更懂行業的人