真正的物流大數(shù)據(jù)挖掘思路
物流大數(shù)據(jù),,都是哪些數(shù)據(jù)?
物流大數(shù)據(jù)主要包括運單信息的數(shù)據(jù)和車輛信息的數(shù)據(jù),,然而關于運單信息往往涉及商業(yè)機密,并且信息分布于不同行業(yè)企業(yè)內(nèi)部,不宜公開,。因此當前現(xiàn)實的數(shù)據(jù)條件來看,實業(yè)界和學術界的物流大數(shù)據(jù)主要是關于貨運車輛信息的數(shù)據(jù),。其中包括:車輛id信息,,駕駛員信息,車輛行駛軌跡坐標信息,,車輛停車信息,,車輛速度信息,車輛里程信息,,車輛溫度信息,,車輛油耗信息,車輛其他狀態(tài)信息等,。軌跡數(shù)據(jù)挖掘來源通常是終端設備上產(chǎn)生的位置記錄,,然后位置信息傳回數(shù)據(jù)中心以日志文件形式存放,如下表:
通過定位技術采集到的原始軌跡數(shù)據(jù)只是一系列的經(jīng)緯度,、時間,、速度等信息,通過這些信息無法直接得到物流貨運車的活動行為的特征信息,,例如運送貨物的起始點,、途經(jīng)哪些城市信息,以及更深層次的活動規(guī)律等,。這些原始的北斗/GPS 數(shù)據(jù)必須經(jīng)過一系列的處理步驟,,才能獲取到物流貨運車的送貨規(guī)律等特征信息。
這些數(shù)據(jù)都有哪些特點?
想要從海量數(shù)據(jù)中分析獲取到有價值的知識信息,,首先要了解物流貨運車輛軌跡數(shù)據(jù)的特征,。
數(shù)據(jù)海量性:物流車輛一般以10秒到30秒的間隔向數(shù)據(jù)中心發(fā)送當前位置信息,,這些移動在全國各地路網(wǎng)中的物流車輛每天生成的北斗/GPS 數(shù)據(jù)都達到了GB甚至TB規(guī)模,并且還在不斷增長中,。這既是發(fā)展數(shù)據(jù)挖掘的驅(qū)動力,,同時也是數(shù)據(jù)挖掘面臨的難題。
數(shù)據(jù)稀疏性:雖然軌跡數(shù)據(jù)規(guī)模龐大,,但由于地理因素,、天氣因素、設備故障等原因,,并不能保證每一個路段都有完整的北斗,、GPS信息,甚至有些錯誤的北斗/GPS數(shù)據(jù),。
數(shù)據(jù)復雜性:物流車輛在實際行駛過程中受各方面主客觀因素影響,,難以簡單通過某個模型或者理論來進行評估和預測。其中包括,,每個司機都有自己的駕駛習慣,,即使同一個司機在駕駛過程中也會針對不同客觀條件改變自己的駕駛行為,這些人為的改變無疑增加了軌跡數(shù)據(jù)挖掘的不確定性和復雜性,。
相關新聞:
- 詳解:菜鳥全線布局快遞大數(shù)據(jù)業(yè)務五大動作
- 背靠大數(shù)據(jù)+菜鳥網(wǎng)絡 看天貓超市如何出奇制勝
- 天貓大數(shù)據(jù)指導品牌方銷售策略 促“潛客”成
- 如何抱物流大腿 個性化配送才是亮劍
- 2015年全球七大主流電商市場數(shù)據(jù)盤點
- 天貓與160多個服飾品牌簽署協(xié)議 未來將用大數(shù)
- 跨境電商必須知道的九種數(shù)據(jù)
- 互聯(lián)網(wǎng)+時代商業(yè)銀行“互聯(lián)網(wǎng)改造”金融大數(shù)
- 大數(shù)據(jù):快遞走出紅海的諾亞方舟
- 國家郵政局統(tǒng)計數(shù)據(jù):上半年縣域快遞業(yè)務超出整
0條評論
網(wǎng)友評論