度量數(shù)據(jù)分析涵蓋多種距離度量方法和指標(biāo)。常見的距離度量如歐氏距離,常用于低維數(shù)據(jù)且向量大小重要的情況,但存在非比例不變和高維數(shù)據(jù)適用性差的缺點(diǎn)。余弦相似度常被用于解決高維數(shù)據(jù)中歐氏距離的問題,適用于不關(guān)注向量大小的高維數(shù)據(jù)場景。漢明距離則用于比較相同長度向量間不同值的個(gè)數(shù)。
在數(shù)據(jù)分析中,還包括對數(shù)據(jù)中心資源消耗量、工作流等方面的度量。例如抖音公司實(shí)現(xiàn)了多種資源消耗項(xiàng)的整體評估以及評估對象層級的細(xì)粒度度量;中國銀行提出了一種可應(yīng)用于大數(shù)據(jù)領(lǐng)域或金融領(lǐng)域的工作流距離的度量方法。
此外,在數(shù)據(jù)分析的實(shí)際應(yīng)用中,像 Kylin 這樣的產(chǎn)品通過清晰定義維度(如何對數(shù)據(jù)分類)和度量(對應(yīng)分類下的統(tǒng)計(jì)值),對需要經(jīng)常執(zhí)行的統(tǒng)計(jì)進(jìn)行預(yù)先運(yùn)算并存放,以此加速數(shù)據(jù)的訪問。
等待電視劇的同時(shí),也可以閱讀本站的相關(guān)的精彩內(nèi)容了!