正文

數(shù)據(jù)分析預(yù)測（數(shù)據(jù)分析師）

發(fā)布時(shí)間：2023-03-18 12:50:28 稿源：創(chuàng)意嶺閱讀： 445 問大家

大家好！今天讓創(chuàng)意嶺的小編來大家介紹下關(guān)于數(shù)據(jù)分析預(yù)測的問題，以下是小編對此問題的歸納整理，讓我們一起來看看吧。

開始之前先推薦一個(gè)非常厲害的Ai人工智能工具，一鍵生成原創(chuàng)文章、方案、文案、工作計(jì)劃、工作報(bào)告、論文、代碼、作文、做題和對話答疑等等

只需要輸入關(guān)鍵詞，就能返回你想要的內(nèi)容，越精準(zhǔn)，寫出的就越詳細(xì)，有微信小程序端、在線網(wǎng)頁版、PC客戶端

官網(wǎng)：https://ai.de1919.com

創(chuàng)意嶺作為行業(yè)內(nèi)優(yōu)秀企業(yè)，服務(wù)客戶遍布全國，設(shè)計(jì)相關(guān)業(yè)務(wù)請撥打175-8598-2043，或微信：1454722008

本文目錄:

1、大數(shù)據(jù)預(yù)測分析方法有哪些
2、五分鐘了解什么是預(yù)測數(shù)據(jù)分析
3、如何做數(shù)據(jù)分析
4、數(shù)據(jù)分析包括哪些內(nèi)容?

數(shù)據(jù)分析預(yù)測（數(shù)據(jù)分析師）

一、大數(shù)據(jù)預(yù)測分析方法有哪些

1、可視化分析

大數(shù)據(jù)分析的使用者有大數(shù)據(jù)分析專家，同時(shí)還有普通用戶，但是他們二者對于大數(shù)據(jù)分析最基本的要求就是可視化分析，因?yàn)榭梢暬治瞿軌蛑庇^的呈現(xiàn)大數(shù)據(jù)特點(diǎn)，同時(shí)能夠非常容易被讀者所接受，就如同看圖說話一樣簡單明了。

2、數(shù)據(jù)挖掘算法

大數(shù)據(jù)分析的理論核心就是數(shù)據(jù)挖掘算法，各種數(shù)據(jù)挖掘的算法基于不同的數(shù)據(jù)類型和格式才能更加科學(xué)的呈現(xiàn)出數(shù)據(jù)本身具備的特點(diǎn)，也正是因?yàn)檫@些被全世界統(tǒng)計(jì)學(xué)家所公認(rèn)的各種統(tǒng)計(jì)方法（可以稱之為真理）才能深入數(shù)據(jù)內(nèi)部，挖掘出公認(rèn)的價(jià)值。另外一個(gè)方面也是因?yàn)橛羞@些數(shù)據(jù)挖掘的算法才能更快速的處理大數(shù)據(jù)，如果一個(gè)算法得花上好幾年才能得出結(jié)論，那大數(shù)據(jù)的價(jià)值也就無從說起了。

3、預(yù)測性分析能力

大數(shù)據(jù)分析最終要的應(yīng)用領(lǐng)域之一就是預(yù)測性分析，從大數(shù)據(jù)中挖掘出特點(diǎn)，通過科學(xué)的建立模型，之后便可以通過模型帶入新的數(shù)據(jù)，從而預(yù)測未來的數(shù)據(jù)。

4、數(shù)據(jù)質(zhì)量和數(shù)據(jù)管理

大數(shù)據(jù)分析離不開數(shù)據(jù)質(zhì)量和數(shù)據(jù)管理，高質(zhì)量的數(shù)據(jù)和有效的數(shù)據(jù)管理，無論是在學(xué)術(shù)研究還是在商業(yè)應(yīng)用領(lǐng)域，都能夠保證分析結(jié)果的真實(shí)和有價(jià)值。當(dāng)然更加深入大數(shù)據(jù)分析的話，還有很多很多更加有特點(diǎn)的、更加深入的、更加專業(yè)的大數(shù)據(jù)分析方法。

這是一條來自#加米谷大數(shù)據(jù)-專注大數(shù)據(jù)人才培養(yǎng)#的小尾巴

二、五分鐘了解什么是預(yù)測數(shù)據(jù)分析

數(shù)據(jù)分析比較常用到vlookup函數(shù).當(dāng)然也有其它的

一、用于求平均值的統(tǒng)計(jì)函數(shù)AVERAGE、TRIMMEAN

1、求參數(shù)的算術(shù)平均值函數(shù)AVERAGE

語法形式為AVERAGE(number1,number2, ...)

其中Number1, number2, ...為要計(jì)算平均值的 1～30 個(gè)參數(shù)。這些參數(shù)可以是數(shù)字，或者是涉及數(shù)字的名稱、數(shù)組或引用。如果數(shù)組或單元格引用參數(shù)中有文字、邏輯值或空單元格，則忽略其值。但是，如果單元格包含零值則計(jì)算在內(nèi)。

2、求數(shù)據(jù)集的內(nèi)部平均值TRIMMEAN

函數(shù)TRIMMEAN先從數(shù)據(jù)集的頭部和尾部除去一定百分比的數(shù)據(jù)點(diǎn)，然后再求平均值。當(dāng)希望在分析中剔除一部分?jǐn)?shù)據(jù)的計(jì)算時(shí)，可以使用此函數(shù)。比如，我們在計(jì)算選手平均分?jǐn)?shù)中常用去掉一個(gè)最高分，去掉一個(gè)最低分，XX號選手的最后得分，就可以使用該函數(shù)來計(jì)算。

語法形式為TRIMMEAN(array,percent)

其中Array為需要進(jìn)行篩選并求平均值的數(shù)組或數(shù)據(jù)區(qū)域。Percent為計(jì)算時(shí)所要除去的數(shù)據(jù)點(diǎn)的比例，例如，如果 percent = 0.2，在 20 個(gè)數(shù)據(jù)點(diǎn)的集合中，就要除去 4 個(gè)數(shù)據(jù)點(diǎn)（20 x 0.2），頭部除去 2 個(gè)，尾部除去 2 個(gè)。函數(shù) TRIMMEAN 將除去的數(shù)據(jù)點(diǎn)數(shù)目向下舍為最接近的 2 的倍數(shù)。

3、舉例說明：示例中也列舉了帶A的函數(shù)AVERAGEA的求解方法。

求選手Annie的參賽分?jǐn)?shù)。在這里，我們先假定已經(jīng)將該選手的分?jǐn)?shù)進(jìn)行了從高到底的排序，在后面的介紹中我們將詳細(xì)了解排序的方法。

二、用于求單元格個(gè)數(shù)的統(tǒng)計(jì)函數(shù)COUNT

語法形式為COUNT(value1,value2, ...)

其中Value1, value2, ...為包含或引用各種類型數(shù)據(jù)的參數(shù)（1～30個(gè)），但只有數(shù)字類型的數(shù)據(jù)才被計(jì)數(shù)。函數(shù) COUNT 在計(jì)數(shù)時(shí)，將把數(shù)字、空值、邏輯值、日期或以文字代表的數(shù)計(jì)算進(jìn)去；但是錯(cuò)誤值或其他無法轉(zhuǎn)化成數(shù)字的文字則被忽略。

如果參數(shù)是一個(gè)數(shù)組或引用，那么只統(tǒng)計(jì)數(shù)組或引用中的數(shù)字；數(shù)組中或引用的空單元格、邏輯值、文字或錯(cuò)誤值都將忽略。如果要統(tǒng)計(jì)邏輯值、文字或錯(cuò)誤值，應(yīng)當(dāng)使用函數(shù) COUNTA。

舉例說明COUNT函數(shù)的用途，示例中也列舉了帶A的函數(shù)COUNTA的用途。仍以上例為例，要計(jì)算一共有多少評委參與評分（用函數(shù)COUNTA），以及有幾個(gè)評委給出了有效分?jǐn)?shù)（用函數(shù)COUNT）。

三、求區(qū)域中數(shù)據(jù)的頻率分布FREQUENCY

由于函數(shù) FREQUENCY 返回一個(gè)數(shù)組，必須以數(shù)組公式的形式輸入。

語法形式為FREQUENCY(data_array,bins_array)

其中Data_array為一數(shù)組或?qū)σ唤M數(shù)值的引用，用來計(jì)算頻率。如果 data_array 中不包含任何數(shù)值，函數(shù) FREQUENCY 返回零數(shù)組。Bins_array為一數(shù)組或?qū)?shù)組區(qū)域的引用，設(shè)定對 data_array 進(jìn)行頻率計(jì)算的分段點(diǎn)。如果 bins_array 中不包含任何數(shù)值，函數(shù) FREQUENCY 返回 data_array 元素的數(shù)目。

看起來FREQUENCY的用法蠻復(fù)雜的，但其用處很大。比如可以計(jì)算不同工資段的人員分布，公司員工的年齡分布，學(xué)生成績的分布情況等。這里以具體示例說明其基本的用法。

以計(jì)算某公司的員工年齡分布情況為例說明。在工作表里列出了員工的年齡。這些年齡為 28、25、31、21、44、33、22 和 35，并分別輸入到單元格 C4:C11。這一列年齡就是 data_array。Bins_array 是另一列用來對年齡分組的區(qū)間值。在本例中，bins_array 是指 C13:C16 單元格，分別含有值 25、30、35、和 40。以數(shù)組形式輸入函數(shù) FREQUENCY，就可以計(jì)算出年齡在 25歲以下、26~30歲、31~35歲、36~40歲和40歲以上各區(qū)間中的數(shù)目。本例中選擇了5個(gè)垂直相鄰的單元格后，即以數(shù)組公式輸入下面的公式。返回的數(shù)組中的元素個(gè)數(shù)比 bins_array（數(shù)組）中的元素個(gè)數(shù)多 1。第五個(gè)數(shù)字1表示大于最高間隔 (40) 的數(shù)值（44）的個(gè)數(shù)。函數(shù) FREQUENCY 忽略空白單元格和文本值。

{=FREQUENCY(C4:C11,C13:C16)}等于 {2;2;2;1;1}

四、一組用于求數(shù)據(jù)集的滿足不同要求的數(shù)值的函數(shù)

1、求數(shù)據(jù)集的最大值MAX與最小值MIN

這兩個(gè)函數(shù)MAX、MIN就是用來求解數(shù)據(jù)集的極值（即最大值、最小值）。函數(shù)的用法非常簡單。語法形式為函數(shù)（number1,number2,...），其中Number1,number2,... 為需要找出最大數(shù)值的 1 到 30 個(gè)數(shù)值。如果要計(jì)算數(shù)組或引用中的空白單元格、邏輯值或文本將被忽略。因此如果邏輯值和文本不能忽略，請使用帶A的函數(shù)MAXA或者M(jìn)INA 來代替。

2、求數(shù)據(jù)集中第K個(gè)最大值LARGE與第k個(gè)最小值SMALL

這兩個(gè)函數(shù)LARGE、SMALL與MAX、MIN非常想像，區(qū)別在于它們返回的不是極值，而是第K個(gè)值。語法形式為：函數(shù)(array,k)，其中Array為需要找到第 k 個(gè)最小值的數(shù)組或數(shù)字型數(shù)據(jù)區(qū)域。K為返回的數(shù)據(jù)在數(shù)組或數(shù)據(jù)區(qū)域里的位置（如果是LARGE為從大到小排，若為SMALL函數(shù)則從小到大排）。

3、求數(shù)據(jù)集中的中位數(shù)MEDIAN

MEDIAN函數(shù)返回給定數(shù)值集合的中位數(shù)。所謂中位數(shù)是指在一組數(shù)據(jù)中居于中間的數(shù)，換句話說，在這組數(shù)據(jù)中，有一半的數(shù)據(jù)比它大，有一半的數(shù)據(jù)比它小。

語法形式為MEDIAN(number1,number2, ...)其中Number1, number2,...是需要找出中位數(shù)的 1 到 30 個(gè)數(shù)字參數(shù)。如果數(shù)組或引用參數(shù)中包含有文字、邏輯值或空白單元格，則忽略這些值，但是其值為零的單元格會計(jì)算在內(nèi)。

4、求數(shù)據(jù)集中出現(xiàn)頻率最多的數(shù)MODE

MODE函數(shù)用來返回在某一數(shù)組或數(shù)據(jù)區(qū)域中出現(xiàn)頻率最多的數(shù)值。跟 MEDIAN 一樣，MODE 也是一個(gè)位置測量函數(shù)。

語法形式為MODE(number1,number2, ...)其中Number1, number2, ... 是用于眾數(shù)（眾數(shù)指在一組數(shù)值中出現(xiàn)頻率最高的數(shù)值）計(jì)算的 1 到 30 個(gè)參數(shù)，也可以使用單一數(shù)組（即對數(shù)組區(qū)域的引用）來代替由逗號分隔的參數(shù)。

5、以上函數(shù)的示例

以某單位年終獎金分配表為例說明。在示例中，我們將利用這些函數(shù)求解該單位年終獎金分配中的最高金額、最低金額、平均金額、中間金額、眾數(shù)金額以及第二高金額等。

詳細(xì)的公式寫法可從圖中清楚的看出，在此不再贅述。

五、用來排位的函數(shù)RANK、PERCENTRANK

1、一個(gè)數(shù)值在一組數(shù)值中的排位的函數(shù)RANK

數(shù)值的排位是與數(shù)據(jù)清單中其他數(shù)值的相對大小，當(dāng)然如果數(shù)據(jù)清單已經(jīng)排過序了，則數(shù)值的排位就是它當(dāng)前的位置。數(shù)據(jù)清單的排序可以使用Excel提供的排序功能完成。

語法形式為RANK(number,ref,order) 其中Number為需要找到排位的數(shù)字；Ref 為包含一組數(shù)字的數(shù)組或引用。Order為一數(shù)字用來指明排位的方式。

如果 order 為 0 或省略，則Excel 將 ref 當(dāng)作按降序排列的數(shù)據(jù)清單進(jìn)行排位。

如果 order 不為零，Microsoft Excel 將 ref 當(dāng)作按升序排列的數(shù)據(jù)清單進(jìn)行排位。

需要說明的是，函數(shù) RANK 對重復(fù)數(shù)的排位相同。但重復(fù)數(shù)的存在將影響后續(xù)數(shù)值的排位。

2、求特定數(shù)值在一個(gè)數(shù)據(jù)集中的百分比排位的函數(shù)PERCENTRANK

此PERCENTRANK函數(shù)可用于查看特定數(shù)據(jù)在數(shù)據(jù)集中所處的位置。例如，可以使用函數(shù) PERCENTRANK 計(jì)算某個(gè)特定的能力測試得分在所有的能力測試得分中的位置。

語法形式為PERCENTRANK(array,x,significance) 其中Array為彼此間相對位置確定的數(shù)字?jǐn)?shù)組或數(shù)字區(qū)域。X為數(shù)組中需要得到其排位的值。Significance為可選項(xiàng)，表示返回的百分?jǐn)?shù)值的有效位數(shù)。如果省略，函數(shù) PERCENTRANK 保留 3 位小數(shù)。

3、與排名有關(guān)的示例

仍以某單位的年終獎金分配為例說明，這里以員工Annie的排名為例說明公式的寫法。

獎金排名的公式寫法為：

=RANK(C3,$C$3:$C$12)

百分比排名的公式寫法為：

=PERCENTRANK($C$3:$C$12,C3)

以上我們介紹了Excel統(tǒng)計(jì)函數(shù)中比較常用的幾種函數(shù)，更多的涉及專業(yè)領(lǐng)域的統(tǒng)計(jì)函數(shù)可以參看附表以及各種相關(guān)的統(tǒng)計(jì)學(xué)書籍。

附表：

函數(shù)名稱函數(shù)說明語法形式

AVEDEV 返回一組數(shù)據(jù)與其均值的絕對偏差的平均值，即離散度。 AVEDEV(number1,number2, ...)

AVERAGE 返回參數(shù)算術(shù)平均值。 AVERAGE(number1,number2, ...)

AVERAGEA 計(jì)算參數(shù)清單中數(shù)值的平均值（算數(shù)平均值）。不僅數(shù)字，而且文本和邏輯值（如TRUE 和 FALSE）也將計(jì)算在內(nèi)。 AVERAGEA(value1,value2,...)

BETADIST 返回 Beta 分布累積函數(shù)的函數(shù)值。Beta 分布累積函數(shù)通常用于研究樣本集合中某些事物的發(fā)生和變化情況。 BETADIST(x,alpha,beta,A,B)

BETAINV 返回 beta 分布累積函數(shù)的逆函數(shù)值。即，如果 probability = BETADIST(x,...)，則 BETAINV(probability,...) = x。beta 分布累積函數(shù)可用于項(xiàng)目設(shè)計(jì)，在給定期望的完成時(shí)間和變化參數(shù)后，模擬可能的完成時(shí)間。 BETAINV(probability,alpha,beta,A,B)

BINOMDIST 返回一元二項(xiàng)式分布的概率值。 BINOMDIST(number_s,trials,probability_s,cumulative)

CHIDIST 返回 γ2 分布的單尾概率。γ2 分布與 γ2 檢驗(yàn)相關(guān)。使用 γ2 檢驗(yàn)可以比較觀察值和期望值。 CHIDIST(x,degrees_freedom)

CHIINV 返回 γ2 分布單尾概率的逆函數(shù)。 CHIINV(probability,degrees_freedom)

CHITEST 返回獨(dú)立性檢驗(yàn)值。函數(shù) CHITEST 返回 γ2 分布的統(tǒng)計(jì)值及相應(yīng)的自由度。 CHITEST(actual_range,expected_range)

CONFIDENCE 返回總體平均值的置信區(qū)間。置信區(qū)間是樣本平均值任意一側(cè)的區(qū)域。 CONFIDENCE(alpha,standard_dev,size)

CORREL 返回單元格區(qū)域 array1 和 array2 之間的相關(guān)系數(shù)。使用相關(guān)系數(shù)可以確定兩種屬性之間的關(guān)系。 CORREL(array1,array2)

COUNT 返回參數(shù)的個(gè)數(shù)。利用函數(shù) COUNT 可以計(jì)算數(shù)組或單元格區(qū)域中數(shù)字項(xiàng)的個(gè)數(shù)。 COUNT(value1,value2, ...)

COUNTA 返回參數(shù)組中非空值的數(shù)目。利用函數(shù)COUNTA 可以計(jì)算數(shù)組或單元格區(qū)域中數(shù)據(jù)項(xiàng)的個(gè)數(shù)。 COUNTA(value1,value2, ...)

COVAR 返回協(xié)方差，即每對數(shù)據(jù)點(diǎn)的偏差乘積的平均數(shù)，利用協(xié)方差可以決定兩個(gè)數(shù)據(jù)集之間的關(guān)系。 COVAR(array1,array2)

CRITBINOM 返回使累積二項(xiàng)式分布大于等于臨界值的最小值。此函數(shù)可以用于質(zhì)量檢驗(yàn)。 CRITBINOM(trials,probability_s,alpha)

DEVSQ 返回?cái)?shù)據(jù)點(diǎn)與各自樣本均值偏差的平方和。 DEVSQ(number1,number2,...)

EXPONDIST 返回指數(shù)分布。使用函數(shù) EXPONDIST 可以建立事件之間的時(shí)間間隔模型。 EXPONDIST(x,lambda,cumulative)

FDIST 返回 F 概率分布。使用此函數(shù)可以確定兩個(gè)數(shù)據(jù)系列是否存在變化程度上的不同。 FDIST(x,degrees_freedom1,degrees_freedom2)

FINV 返回 F 概率分布的逆函數(shù)值。 FINV(probability,degrees_freedom1,degrees_freedom2)

FISHER 返回點(diǎn) x 的 Fisher 變換。該變換生成一個(gè)近似正態(tài)分布而非偏斜的函數(shù)。 FISHER(x)

FISHERINV 返回 Fisher 變換的逆函數(shù)值。使用此變換可以分析數(shù)據(jù)區(qū)域或數(shù)組之間的相關(guān)性。 FISHERINV(y)

FORECAST 根據(jù)給定的數(shù)據(jù)計(jì)算或預(yù)測未來值。 FORECAST(x,known_y's,known_x's)

FREQUENCY 以一列垂直數(shù)組返回某個(gè)區(qū)域中數(shù)據(jù)的頻率分布。 FREQUENCY(data_array,bins_array)

FTEST 返回 F 檢驗(yàn)的結(jié)果。F 檢驗(yàn)返回的是當(dāng)數(shù)組 1 和數(shù)組 2 的方差無明顯差異時(shí)的單尾概率?？梢允褂么撕瘮?shù)來判斷兩個(gè)樣本的方差是否不同。 FTEST(array1,array2)

GAMMADIST 返回伽瑪分布?？梢允褂么撕瘮?shù)來研究具有偏態(tài)分布的變量。伽瑪分布通常用于排隊(duì)分析。 GAMMADIST(x,alpha,beta,cumulative)

GAMMAINV 返回伽瑪分布的累積函數(shù)的逆函數(shù)。 GAMMAINV(probability,alpha,beta)

GAMMALN 返回伽瑪函數(shù)的自然對數(shù)，Γ(x)。 GAMMALN(x)

GEOMEAN 返回正數(shù)數(shù)組或數(shù)據(jù)區(qū)域的幾何平均值。 GEOMEAN(number1,number2, ...)

GROWTH 根據(jù)給定的數(shù)據(jù)預(yù)測指數(shù)增長值。 GROWTH(known_y's,known_x's,new_x's,const)

HARMEAN 返回?cái)?shù)據(jù)集合的調(diào)和平均值。調(diào)和平均值與倒數(shù)的算術(shù)平均值互為倒數(shù)。 HARMEAN(number1,number2, ...)

HYPGEOMDIST 返回超幾何分布。 HYPGEOMDIST(sample_s,number_sample,

population_s,number_population)

INTERCEPT 利用已知的 x 值與 y 值計(jì)算直線與 y 軸的截距。 INTERCEPT(known_y's,known_x's)

KURT 返回?cái)?shù)據(jù)集的峰值。 KURT(number1,number2, ...)

LARGE 返回?cái)?shù)據(jù)集里第 k 個(gè)最大值。使用此函數(shù)可以根據(jù)相對標(biāo)準(zhǔn)來選擇數(shù)值。 LARGE(array,k)

LINEST 使用最小二乘法計(jì)算對已知數(shù)據(jù)進(jìn)行最佳直線擬合，并返回描述此直線的數(shù)組。 LINEST(known_y's,known_x's,const,stats)

LOGEST 在回歸分析中，計(jì)算最符合觀測數(shù)據(jù)組的指數(shù)回歸擬合曲線，并返回描述該曲線的數(shù)組。 LOGEST(known_y's,known_x's,const,stats)

LOGINV 返回 x 的對數(shù)正態(tài)分布累積函數(shù)的逆函數(shù)。 LOGINV(probability,mean,standard_dev)

LOGNORMDIST 返回 x 的對數(shù)正態(tài)分布的累積函數(shù)。 LOGNORMDIST(x,mean,standard_dev)

MAX 返回?cái)?shù)據(jù)集中的最大數(shù)值。 MAX(number1,number2,...)

MAXA 返回參數(shù)清單中的最大數(shù)值。 MAXA(value1,value2,...)

MEDIAN 返回給定數(shù)值集合的中位數(shù)。中位數(shù)是在一組數(shù)據(jù)中居于中間的數(shù)。 MEDIAN(number1,number2, ...)

MIN 返回給定參數(shù)表中的最小值。 MIN(number1,number2, ...)

MINA 返回參數(shù)清單中的最小數(shù)值。 MINA(value1,value2,...)

MODE 返回在某一數(shù)組或數(shù)據(jù)區(qū)域中出現(xiàn)頻率最多的數(shù)值。 MODE(number1,number2, ...)

NEGBINOMDIST 返回負(fù)二項(xiàng)式分布。 NEGBINOMDIST(number_f,number_s,probability_s)

NORMDIST 返回給定平均值和標(biāo)準(zhǔn)偏差的正態(tài)分布的累積函數(shù)。 NORMDIST(x,mean,standard_dev,cumulative)

NORMINV 返回給定平均值和標(biāo)準(zhǔn)偏差的正態(tài)分布的累積函數(shù)的逆函數(shù)。 NORMINV(probability,mean,standard_dev)

NORMSDIST 返回標(biāo)準(zhǔn)正態(tài)分布的累積函數(shù)，該分布的平均值為 0，標(biāo)準(zhǔn)偏差為 1。 NORMSDIST(z)

NORMSINV 返回標(biāo)準(zhǔn)正態(tài)分布累積函數(shù)的逆函數(shù)。該分布的平均值為 0，標(biāo)準(zhǔn)偏差為 1。 NORMSINV(probability)

PEARSON 返回 Pearson（皮爾生）乘積矩相關(guān)系數(shù)，r，這是一個(gè)范圍在 -1.0 到 1.0 之間（包括 -1.0 和 1.0 在內(nèi)）的無量綱指數(shù)，反映了兩個(gè)數(shù)據(jù)集合之間的線性相關(guān)程度。 PEARSON(array1,array2)

PERCENTILE 返回?cái)?shù)值區(qū)域的 K 百分比數(shù)值點(diǎn)。可以使用此函數(shù)來建立接受閥值。例如，可以確定得分排名在 90 個(gè)百分點(diǎn)以上的檢測侯選人。 PERCENTILE(array,k)

PERCENTRANK 返回特定數(shù)值在一個(gè)數(shù)據(jù)集中的百分比排位。此函數(shù)可用于查看特定數(shù)據(jù)在數(shù)據(jù)集中所處的位置。例如，可以使用函數(shù) PERCENTRANK 計(jì)算某個(gè)特定的能力測試得分在所有的能力測試得分中的位置。 PERCENTRANK(array,x,significance)

PERMUT 返回從給定數(shù)目的對象集合中選取的若干對象的排列數(shù)。排列可以為有內(nèi)部順序的對象或?yàn)槭录娜我饧匣蜃蛹?。排列與組合不同，組合的內(nèi)部順序無意義。此函數(shù)可用于彩票計(jì)算中的概率。 PERMUT(number,number_chosen)

POISSON 返回泊松分布。泊松分布通常用于預(yù)測一段時(shí)間內(nèi)事件發(fā)生的次數(shù)，比如一分鐘內(nèi)通過收費(fèi)站的轎車的數(shù)量。 POISSON(x,mean,cumulative)

PROB 返回一概率事件組中落在指定區(qū)域內(nèi)的事件所對應(yīng)的概率之和。如果沒有給出 upper_limit，則返回 x _range 內(nèi)值等于 lower_limit 的概率。 PROB(x_range,prob_range,lower_limit,upper_limit)

QUARTILE 返回?cái)?shù)據(jù)集的四分位數(shù)。四分位數(shù)通常用于在銷售額和測量值數(shù)據(jù)集中對總體進(jìn)行分組。例如，可以使用函數(shù) QUARTILE 求得總體中前 25% 的收入值。 QUARTILE(array,quart)

RANK 返回一個(gè)數(shù)值在一組數(shù)值中的排位。數(shù)值的排位是與數(shù)據(jù)清單中其他數(shù)值的相對大小（如果數(shù)據(jù)清單已經(jīng)排過序了，則數(shù)值的排位就是它當(dāng)前的位置）。 RANK(number,ref,order)

RSQ 返回根據(jù) known_y's 和 known_x's 中數(shù)據(jù)點(diǎn)計(jì)算得出的 Pearson 乘積矩相關(guān)系數(shù)的平方。有關(guān)詳細(xì)信息，請參閱函數(shù) REARSON。R 平方值可以解釋為 y 方差與 x 方差的比例。 RSQ(known_y's,known_x's)

SKEW 返回分布的偏斜度。偏斜度反映以平均值為中心的分布的不對稱程度。正偏斜度表示不對稱邊的分布更趨向正值。負(fù)偏斜度表示不對稱邊的分布更趨向負(fù)值。 SKEW(number1,number2,...)

SLOPE 返回根據(jù) known_y's 和 known_x's 中的數(shù)據(jù)點(diǎn)擬合的線性回歸直線的斜率。斜率為直線上任意兩點(diǎn)的重直距離與水平距離的比值，也就是回歸直線的變化率。 SLOPE(known_y's,known_x's)

SMALL 返回?cái)?shù)據(jù)集中第 k 個(gè)最小值。使用此函數(shù)可以返回?cái)?shù)據(jù)集中特定位置上的數(shù)值。 SMALL(array,k)

STANDARDIZE 返回以 mean 為平均值，以 standard-dev 為標(biāo)準(zhǔn)偏差的分布的正態(tài)化數(shù)值。 STANDARDIZE(x,mean,standard_dev)

STDEV 估算樣本的標(biāo)準(zhǔn)偏差。標(biāo)準(zhǔn)偏差反映相對于平均值（mean）的離散程度。 STDEV(number1,number2,...)

STDEVA 估算基于給定樣本的標(biāo)準(zhǔn)偏差。標(biāo)準(zhǔn)偏差反映數(shù)值相對于平均值（mean）的離散程度。文本值和邏輯值（如 TRUE 或 FALSE）也將計(jì)算在內(nèi)。 STDEVA(value1,value2,...)

STDEVP 返回以參數(shù)形式給出的整個(gè)樣本總體的標(biāo)準(zhǔn)偏差。標(biāo)準(zhǔn)偏差反映相對于平均值（mean）的離散程度。 STDEVP(number1,number2,...)

STDEVPA 計(jì)算樣本總體的標(biāo)準(zhǔn)偏差。標(biāo)準(zhǔn)偏差反映數(shù)值相對于平均值（mean）的離散程度。 STDEVPA(value1,value2,...)

STEYX 返回通過線性回歸法計(jì)算 y 預(yù)測值時(shí)所產(chǎn)生的標(biāo)準(zhǔn)誤差。標(biāo)準(zhǔn)誤差用來度量根據(jù)單個(gè) x 變量計(jì)算出的 y 預(yù)測值的誤差量。 STEYX(known_y's,known_x's)

TDIST 返回學(xué)生 t- 分布的百分點(diǎn)（概率），t 分布中數(shù)值 (x) 是 t 的計(jì)算值（將計(jì)算其百分點(diǎn)）。t 分布用于小樣本數(shù)據(jù)集合的假設(shè)檢驗(yàn)。使用此函數(shù)可以代替 t 分布的臨界值表。 TDIST(x,degrees_freedom,tails)

TINV 返回作為概率和自由度函數(shù)的學(xué)生 t 分布的 t 值。 TINV(probability,degrees_freedom)

TREND 返回一條線性回歸擬合線的一組縱坐標(biāo)值（y 值）。即找到適合給定的數(shù)組 known_y's 和 known_x's 的直線（用最小二乘法），并返回指定數(shù)組 new_x's 值在直線上對應(yīng)的 y 值。 TREND(known_y's,known_x's,new_x's,const)

TRIMMEAN 返回?cái)?shù)據(jù)集的內(nèi)部平均值。函數(shù) TRIMMEAN 先從數(shù)據(jù)集的頭部和尾部除去一定百分比的數(shù)據(jù)點(diǎn)，然后再求平均值。當(dāng)希望在分析中剔除一部分?jǐn)?shù)據(jù)的計(jì)算時(shí)，可以使用此函數(shù)。 TRIMMEAN(array,percent)

TTEST 返回與學(xué)生氏- t 檢驗(yàn)相關(guān)的概率。可以使用函數(shù) TTEST 判斷兩個(gè)樣本是否可能來自兩個(gè)具有相同均值的總體。 TTEST(array1,array2,tails,type)

VAR 估算樣本方差。 VAR(number1,number2,...)

VARA 估算基于給定樣本的方差。不僅數(shù)字，文本值和邏輯值（如 TRUE 和 FALSE）也將計(jì)算在內(nèi)。 VARA(value1,value2,...)

VARP 計(jì)算樣本總體的方差。 VARP(number1,number2,...)

VARPA 計(jì)算樣本總體的方差。不僅數(shù)字，文本值和邏輯值（如 TRUE 和 FALSE）也將計(jì)算在內(nèi)。 VARPA(value1,value2,...)

WEIBULL 返回韋伯分布。使用此函數(shù)可以進(jìn)行可靠性分析，比如計(jì)算設(shè)備的平均故障時(shí)間。 WEIBULL(x,alpha,beta,cumulative)

ZTEST 返回 z 檢驗(yàn)的雙尾 P 值。Z 檢驗(yàn)根據(jù)數(shù)據(jù)集或數(shù)組生成 x 的標(biāo)準(zhǔn)得分，并返回正態(tài)分布的雙尾概率。可以使用此函數(shù)返回從某總體中抽取特定觀測值的似然估計(jì)。

三、如何做數(shù)據(jù)分析

數(shù)據(jù)分析有：分類分析，矩陣分析，漏斗分析，相關(guān)分析，邏輯樹分析，趨勢分析，行為軌跡分析，等等。我用HR的工作來舉例，說明上面這些分析要怎么做，才能得出洞見。

01）分類分析

比如分成不同部門、不同崗位層級、不同年齡段，來分析人才流失率。比如發(fā)現(xiàn)某個(gè)部門流失率特別高，那么就可以去分析。

02）矩陣分析

比如公司有價(jià)值觀和能力的考核，那么可以把考核結(jié)果做出矩陣圖，能力強(qiáng)價(jià)值匹配的員工、能力強(qiáng)價(jià)值不匹配的員工、能力弱價(jià)值匹配的員工、能力弱價(jià)值不匹配的員工各占多少比例，從而發(fā)現(xiàn)公司的人才健康度。

03）漏斗分析

比如記錄招聘數(shù)據(jù)，投遞簡歷、通過初篩、通過一面、通過二面、通過終面、接下Offer、成功入職、通過試用期，這就是一個(gè)完整的招聘漏斗，從數(shù)據(jù)中，可以看到哪個(gè)環(huán)節(jié)還可以優(yōu)化。

04）相關(guān)分析

比如公司各個(gè)分店的人才流失率差異較大，那么可以把各個(gè)分店的員工流失率，跟分店的一些特性（地理位置、薪酬水平、福利水平、員工年齡、管理人員年齡等）要素進(jìn)行相關(guān)性分析，找到最能夠挽留員工的關(guān)鍵因素。

05）邏輯樹分析

比如近期發(fā)現(xiàn)員工的滿意度有所降低，那么就進(jìn)行拆解，滿意度跟薪酬、福利、職業(yè)發(fā)展、工作氛圍有關(guān)，然后薪酬分為基本薪資和獎金，這樣層層拆解，找出滿意度各個(gè)影響因素里面的變化因素，從而得出洞見。

06）趨勢分析

比如人才流失率過去12個(gè)月的變化趨勢。

07）行為軌跡分析

比如跟蹤一個(gè)銷售人員的行為軌跡，從入職、到開始產(chǎn)生業(yè)績、到業(yè)績快速增長、到疲憊期、到逐漸穩(wěn)定。

通過面向企業(yè)業(yè)務(wù)場景提供一站式大數(shù)據(jù)分析解決方案，能夠?yàn)槠髽I(yè)在增收益、降成本、提效率、控成本等四個(gè)角度帶來價(jià)值貢獻(xiàn)。

1、增收益

最直觀的應(yīng)用，即利用數(shù)據(jù)分析實(shí)現(xiàn)數(shù)字化精準(zhǔn)營銷。通過深度分析用戶購買行為、消費(fèi)習(xí)慣等，刻畫用戶畫像，將數(shù)據(jù)分析結(jié)果轉(zhuǎn)化為可操作執(zhí)行的客戶管理策略，以最佳的方式觸及更多的客戶，以實(shí)現(xiàn)銷售收入的增長。

下圖為推廣收支測算分析，為廣告投放提供決策依據(jù)。

下圖為渠道銷量分析，為渠道支持提供數(shù)據(jù)支撐。

2、降成本

例如通過數(shù)據(jù)分析實(shí)現(xiàn)對財(cái)務(wù)和人力的管理，從而控制各項(xiàng)成本、費(fèi)用的支出，實(shí)現(xiàn)降低成本的作用。

下圖為生產(chǎn)成本分析，了解成本構(gòu)成情況。

下圖為期間費(fèi)用預(yù)實(shí)對比分析，把控費(fèi)用情況。

3、提效率

每個(gè)企業(yè)都會出具相關(guān)報(bào)表，利用數(shù)據(jù)分析工具，不懂技術(shù)的業(yè)務(wù)人員也能夠通過簡單的拖拉拽實(shí)現(xiàn)敏捷自助分析，無需業(yè)務(wù)人員提需求、IT人員做報(bào)表，大大提高報(bào)表的及時(shí)性，提高了報(bào)表的使用效率。

通過數(shù)據(jù)分析工具，能夠在PC端展示，也支持移動看板，隨時(shí)隨地透視經(jīng)營，提高決策效率。

4、控風(fēng)險(xiǎn)

預(yù)算是否超支？債務(wù)是否逾期？是否缺貨了、斷貨了？客戶的回款率怎么樣？設(shè)備的運(yùn)行是否正常？哪種產(chǎn)品是否需要加速生產(chǎn)以實(shí)現(xiàn)產(chǎn)銷平衡？...其實(shí)，幾乎每個(gè)企業(yè)都會遇到各種各樣的風(fēng)險(xiǎn)問題。通過數(shù)據(jù)分析，能夠幫助企業(yè)進(jìn)行實(shí)時(shí)監(jiān)測，對偏離了預(yù)算的部分、對偏離了正常范圍的數(shù)值能夠進(jìn)行主動預(yù)警，降低企業(yè)風(fēng)險(xiǎn)。

下圖為稅負(fù)率指標(biāo)，當(dāng)綜合稅負(fù)率過高，可以實(shí)現(xiàn)提示和預(yù)警。

下圖為重要指標(biāo)預(yù)警，重點(diǎn)監(jiān)控項(xiàng)目的毛利率。

四、數(shù)據(jù)分析包括哪些內(nèi)容?

1.數(shù)據(jù)獲取

數(shù)據(jù)獲取看似簡單，但是需要把握對問題的商業(yè)理解，轉(zhuǎn)化成數(shù)據(jù)問題來解決，直白點(diǎn)講就是需要哪些數(shù)據(jù)，從哪些角度來分析，界定問題后，再進(jìn)行數(shù)據(jù)采集。此環(huán)節(jié)，需要數(shù)據(jù)分析師具備結(jié)構(gòu)化的邏輯思維。

2.數(shù)據(jù)處理

數(shù)據(jù)的處理需要掌握有效率的工具：Excel基礎(chǔ)、常用函數(shù)和公式、數(shù)據(jù)透視表、VBA程序開發(fā)等式必備的;其次是Oracle和SQL sever，這是企業(yè)大數(shù)據(jù)分析不可缺少的技能;還有Hadoop之類的分布式數(shù)據(jù)庫，也要掌握。

3.分析數(shù)據(jù)

分析數(shù)據(jù)往往需要各類統(tǒng)計(jì)分析模型，如關(guān)聯(lián)規(guī)則、聚類、分類、預(yù)測模型等等。SPSS、SAS、Python、R等工具，多多益善。

4.數(shù)據(jù)呈現(xiàn)

可視化工具，有開源的Tableau可用，也有一些商業(yè)BI軟件，根據(jù)實(shí)際情況掌握即可。

以上就是關(guān)于數(shù)據(jù)分析預(yù)測相關(guān)問題的回答。希望能幫到你，如有更多相關(guān)問題，您也可以聯(lián)系我們的客服進(jìn)行咨詢，客服也會為您講解更多精彩的知識和內(nèi)容。