-
當(dāng)前位置:首頁 > 創(chuàng)意學(xué)院 > 技術(shù) > 專題列表 > 正文
數(shù)據(jù)分析預(yù)測(cè)(數(shù)據(jù)分析師)
大家好!今天讓創(chuàng)意嶺的小編來大家介紹下關(guān)于數(shù)據(jù)分析預(yù)測(cè)的問題,以下是小編對(duì)此問題的歸納整理,讓我們一起來看看吧。
開始之前先推薦一個(gè)非常厲害的Ai人工智能工具,一鍵生成原創(chuàng)文章、方案、文案、工作計(jì)劃、工作報(bào)告、論文、代碼、作文、做題和對(duì)話答疑等等
只需要輸入關(guān)鍵詞,就能返回你想要的內(nèi)容,越精準(zhǔn),寫出的就越詳細(xì),有微信小程序端、在線網(wǎng)頁版、PC客戶端
官網(wǎng):https://ai.de1919.com
創(chuàng)意嶺作為行業(yè)內(nèi)優(yōu)秀企業(yè),服務(wù)客戶遍布全國(guó),設(shè)計(jì)相關(guān)業(yè)務(wù)請(qǐng)撥打175-8598-2043,或微信:1454722008
本文目錄:
一、大數(shù)據(jù)預(yù)測(cè)分析方法有哪些
1、可視化分析
大數(shù)據(jù)分析的使用者有大數(shù)據(jù)分析專家,同時(shí)還有普通用戶,但是他們二者對(duì)于大數(shù)據(jù)分析最基本的要求就是可視化分析,因?yàn)榭梢暬治瞿軌蛑庇^的呈現(xiàn)大數(shù)據(jù)特點(diǎn),同時(shí)能夠非常容易被讀者所接受,就如同看圖說話一樣簡(jiǎn)單明了。
2、數(shù)據(jù)挖掘算法
大數(shù)據(jù)分析的理論核心就是數(shù)據(jù)挖掘算法,各種數(shù)據(jù)挖掘的算法基于不同的數(shù)據(jù)類型和格式才能更加科學(xué)的呈現(xiàn)出數(shù)據(jù)本身具備的特點(diǎn),也正是因?yàn)檫@些被全世界統(tǒng)計(jì)學(xué)家所公認(rèn)的各種統(tǒng)計(jì)方法(可以稱之為真理)才能深入數(shù)據(jù)內(nèi)部,挖掘出公認(rèn)的價(jià)值。另外一個(gè)方面也是因?yàn)橛羞@些數(shù)據(jù)挖掘的算法才能更快速的處理大數(shù)據(jù),如果一個(gè)算法得花上好幾年才能得出結(jié)論,那大數(shù)據(jù)的價(jià)值也就無從說起了。
3、預(yù)測(cè)性分析能力
大數(shù)據(jù)分析最終要的應(yīng)用領(lǐng)域之一就是預(yù)測(cè)性分析,從大數(shù)據(jù)中挖掘出特點(diǎn),通過科學(xué)的建立模型,之后便可以通過模型帶入新的數(shù)據(jù),從而預(yù)測(cè)未來的數(shù)據(jù)。
4、數(shù)據(jù)質(zhì)量和數(shù)據(jù)管理
大數(shù)據(jù)分析離不開數(shù)據(jù)質(zhì)量和數(shù)據(jù)管理,高質(zhì)量的數(shù)據(jù)和有效的數(shù)據(jù)管理,無論是在學(xué)術(shù)研究還是在商業(yè)應(yīng)用領(lǐng)域,都能夠保證分析結(jié)果的真實(shí)和有價(jià)值。 當(dāng)然更加深入大數(shù)據(jù)分析的話,還有很多很多更加有特點(diǎn)的、更加深入的、更加專業(yè)的大數(shù)據(jù)分析方法。
這是一條來自#加米谷大數(shù)據(jù)-專注大數(shù)據(jù)人才培養(yǎng)#的小尾巴
二、五分鐘了解什么是預(yù)測(cè)數(shù)據(jù)分析
數(shù)據(jù)分析比較常用到vlookup函數(shù).當(dāng)然也有其它的
一、用于求平均值的統(tǒng)計(jì)函數(shù)AVERAGE、TRIMMEAN
1、求參數(shù)的算術(shù)平均值函數(shù)AVERAGE
語法形式為AVERAGE(number1,number2, ...)
其中Number1, number2, ...為要計(jì)算平均值的 1~30 個(gè)參數(shù)。這些參數(shù)可以是數(shù)字,或者是涉及數(shù)字的名稱、數(shù)組或引用。如果數(shù)組或單元格引用參數(shù)中有文字、邏輯值或空單元格,則忽略其值。但是,如果單元格包含零值則計(jì)算在內(nèi)。
2、求數(shù)據(jù)集的內(nèi)部平均值TRIMMEAN
函數(shù)TRIMMEAN先從數(shù)據(jù)集的頭部和尾部除去一定百分比的數(shù)據(jù)點(diǎn),然后再求平均值。當(dāng)希望在分析中剔除一部分?jǐn)?shù)據(jù)的計(jì)算時(shí),可以使用此函數(shù)。比如,我們?cè)谟?jì)算選手平均分?jǐn)?shù)中常用去掉一個(gè)最高分,去掉一個(gè)最低分,XX號(hào)選手的最后得分,就可以使用該函數(shù)來計(jì)算。
語法形式為TRIMMEAN(array,percent)
其中Array為需要進(jìn)行篩選并求平均值的數(shù)組或數(shù)據(jù)區(qū)域。Percent為計(jì)算時(shí)所要除去的數(shù)據(jù)點(diǎn)的比例,例如,如果 percent = 0.2,在 20 個(gè)數(shù)據(jù)點(diǎn)的集合中,就要除去 4 個(gè)數(shù)據(jù)點(diǎn)(20 x 0.2),頭部除去 2 個(gè),尾部除去 2 個(gè)。函數(shù) TRIMMEAN 將除去的數(shù)據(jù)點(diǎn)數(shù)目向下舍為最接近的 2 的倍數(shù)。
3、舉例說明:示例中也列舉了帶A的函數(shù)AVERAGEA的求解方法。
求選手Annie的參賽分?jǐn)?shù)。在這里,我們先假定已經(jīng)將該選手的分?jǐn)?shù)進(jìn)行了從高到底的排序,在后面的介紹中我們將詳細(xì)了解排序的方法。
二、用于求單元格個(gè)數(shù)的統(tǒng)計(jì)函數(shù)COUNT
語法形式為COUNT(value1,value2, ...)
其中Value1, value2, ...為包含或引用各種類型數(shù)據(jù)的參數(shù)(1~30個(gè)),但只有數(shù)字類型的數(shù)據(jù)才被計(jì)數(shù)。函數(shù) COUNT 在計(jì)數(shù)時(shí),將把數(shù)字、空值、邏輯值、日期或以文字代表的數(shù)計(jì)算進(jìn)去;但是錯(cuò)誤值或其他無法轉(zhuǎn)化成數(shù)字的文字則被忽略。
如果參數(shù)是一個(gè)數(shù)組或引用,那么只統(tǒng)計(jì)數(shù)組或引用中的數(shù)字;數(shù)組中或引用的空單元格、邏輯值、文字或錯(cuò)誤值都將忽略。如果要統(tǒng)計(jì)邏輯值、文字或錯(cuò)誤值,應(yīng)當(dāng)使用函數(shù) COUNTA。
舉例說明COUNT函數(shù)的用途,示例中也列舉了帶A的函數(shù)COUNTA的用途。仍以上例為例,要計(jì)算一共有多少評(píng)委參與評(píng)分(用函數(shù)COUNTA),以及有幾個(gè)評(píng)委給出了有效分?jǐn)?shù)(用函數(shù)COUNT)。
三、求區(qū)域中數(shù)據(jù)的頻率分布FREQUENCY
由于函數(shù) FREQUENCY 返回一個(gè)數(shù)組,必須以數(shù)組公式的形式輸入。
語法形式為FREQUENCY(data_array,bins_array)
其中Data_array為一數(shù)組或?qū)σ唤M數(shù)值的引用,用來計(jì)算頻率。如果 data_array 中不包含任何數(shù)值,函數(shù) FREQUENCY 返回零數(shù)組。Bins_array為一數(shù)組或?qū)?shù)組區(qū)域的引用,設(shè)定對(duì) data_array 進(jìn)行頻率計(jì)算的分段點(diǎn)。如果 bins_array 中不包含任何數(shù)值,函數(shù) FREQUENCY 返回 data_array 元素的數(shù)目。
看起來FREQUENCY的用法蠻復(fù)雜的,但其用處很大。比如可以計(jì)算不同工資段的人員分布,公司員工的年齡分布,學(xué)生成績(jī)的分布情況等。這里以具體示例說明其基本的用法。
以計(jì)算某公司的員工年齡分布情況為例說明。在工作表里列出了員工的年齡。這些年齡為 28、25、31、21、44、33、22 和 35,并分別輸入到單元格 C4:C11。這一列年齡就是 data_array。Bins_array 是另一列用來對(duì)年齡分組的區(qū)間值。在本例中,bins_array 是指 C13:C16 單元格,分別含有值 25、30、35、和 40。以數(shù)組形式輸入函數(shù) FREQUENCY,就可以計(jì)算出年齡在 25歲以下、26~30歲、31~35歲、36~40歲和40歲以上各區(qū)間中的數(shù)目。本例中選擇了5個(gè)垂直相鄰的單元格后,即以數(shù)組公式輸入下面的公式。返回的數(shù)組中的元素個(gè)數(shù)比 bins_array(數(shù)組)中的元素個(gè)數(shù)多 1。第五個(gè)數(shù)字1表示大于最高間隔 (40) 的數(shù)值(44)的個(gè)數(shù)。函數(shù) FREQUENCY 忽略空白單元格和文本值。
{=FREQUENCY(C4:C11,C13:C16)}等于 {2;2;2;1;1}
四、一組用于求數(shù)據(jù)集的滿足不同要求的數(shù)值的函數(shù)
1、求數(shù)據(jù)集的最大值MAX與最小值MIN
這兩個(gè)函數(shù)MAX、MIN就是用來求解數(shù)據(jù)集的極值(即最大值、最小值)。函數(shù)的用法非常簡(jiǎn)單。語法形式為 函數(shù)(number1,number2,...),其中Number1,number2,... 為需要找出最大數(shù)值的 1 到 30 個(gè)數(shù)值。如果要計(jì)算數(shù)組或引用中的空白單元格、邏輯值或文本將被忽略。因此如果邏輯值和文本不能忽略,請(qǐng)使用帶A的函數(shù)MAXA或者M(jìn)INA 來代替。
2、求數(shù)據(jù)集中第K個(gè)最大值LARGE與第k個(gè)最小值SMALL
這兩個(gè)函數(shù)LARGE、SMALL與MAX、MIN非常想像,區(qū)別在于它們返回的不是極值,而是第K個(gè)值。語法形式為:函數(shù)(array,k),其中Array為需要找到第 k 個(gè)最小值的數(shù)組或數(shù)字型數(shù)據(jù)區(qū)域。K為返回的數(shù)據(jù)在數(shù)組或數(shù)據(jù)區(qū)域里的位置(如果是LARGE為從大到小排,若為SMALL函數(shù)則從小到大排)。
3、 求數(shù)據(jù)集中的中位數(shù)MEDIAN
MEDIAN函數(shù)返回給定數(shù)值集合的中位數(shù)。所謂中位數(shù)是指在一組數(shù)據(jù)中居于中間的數(shù),換句話說,在這組數(shù)據(jù)中,有一半的數(shù)據(jù)比它大,有一半的數(shù)據(jù)比它小。
語法形式為MEDIAN(number1,number2, ...)其中Number1, number2,...是需要找出中位數(shù)的 1 到 30 個(gè)數(shù)字參數(shù)。如果數(shù)組或引用參數(shù)中包含有文字、邏輯值或空白單元格,則忽略這些值,但是其值為零的單元格會(huì)計(jì)算在內(nèi)。
4、 求數(shù)據(jù)集中出現(xiàn)頻率最多的數(shù)MODE
MODE函數(shù)用來返回在某一數(shù)組或數(shù)據(jù)區(qū)域中出現(xiàn)頻率最多的數(shù)值。跟 MEDIAN 一樣,MODE 也是一個(gè)位置測(cè)量函數(shù)。
語法形式為MODE(number1,number2, ...)其中Number1, number2, ... 是用于眾數(shù)(眾數(shù)指在一組數(shù)值中出現(xiàn)頻率最高的數(shù)值)計(jì)算的 1 到 30 個(gè)參數(shù),也可以使用單一數(shù)組(即對(duì)數(shù)組區(qū)域的引用)來代替由逗號(hào)分隔的參數(shù)。
5、 以上函數(shù)的示例
以某單位年終獎(jiǎng)金分配表為例說明。在示例中,我們將利用這些函數(shù)求解該單位年終獎(jiǎng)金分配中的最高金額、最低金額、平均金額、中間金額、眾數(shù)金額以及第二高金額等。
詳細(xì)的公式寫法可從圖中清楚的看出,在此不再贅述。
五、用來排位的函數(shù)RANK、PERCENTRANK
1、一個(gè)數(shù)值在一組數(shù)值中的排位的函數(shù)RANK
數(shù)值的排位是與數(shù)據(jù)清單中其他數(shù)值的相對(duì)大小,當(dāng)然如果數(shù)據(jù)清單已經(jīng)排過序了,則數(shù)值的排位就是它當(dāng)前的位置。數(shù)據(jù)清單的排序可以使用Excel提供的排序功能完成。
語法形式為RANK(number,ref,order) 其中Number為需要找到排位的數(shù)字;Ref 為包含一組數(shù)字的數(shù)組或引用。Order為一數(shù)字用來指明排位的方式。
如果 order 為 0 或省略,則Excel 將 ref 當(dāng)作按降序排列的數(shù)據(jù)清單進(jìn)行排位。
如果 order 不為零,Microsoft Excel 將 ref 當(dāng)作按升序排列的數(shù)據(jù)清單進(jìn)行排位。
需要說明的是,函數(shù) RANK 對(duì)重復(fù)數(shù)的排位相同。但重復(fù)數(shù)的存在將影響后續(xù)數(shù)值的排位。
2、求特定數(shù)值在一個(gè)數(shù)據(jù)集中的百分比排位的函數(shù)PERCENTRANK
此PERCENTRANK函數(shù)可用于查看特定數(shù)據(jù)在數(shù)據(jù)集中所處的位置。例如,可以使用函數(shù) PERCENTRANK 計(jì)算某個(gè)特定的能力測(cè)試得分在所有的能力測(cè)試得分中的位置。
語法形式為PERCENTRANK(array,x,significance) 其中Array為彼此間相對(duì)位置確定的數(shù)字?jǐn)?shù)組或數(shù)字區(qū)域。X為數(shù)組中需要得到其排位的值。Significance為可選項(xiàng),表示返回的百分?jǐn)?shù)值的有效位數(shù)。如果省略,函數(shù) PERCENTRANK 保留 3 位小數(shù)。
3、與排名有關(guān)的示例
仍以某單位的年終獎(jiǎng)金分配為例說明,這里以員工Annie的排名為例說明公式的寫法。
獎(jiǎng)金排名的公式寫法為:
=RANK(C3,$C$3:$C$12)
百分比排名的公式寫法為:
=PERCENTRANK($C$3:$C$12,C3)
以上我們介紹了Excel統(tǒng)計(jì)函數(shù)中比較常用的幾種函數(shù),更多的涉及專業(yè)領(lǐng)域的統(tǒng)計(jì)函數(shù)可以參看附表以及各種相關(guān)的統(tǒng)計(jì)學(xué)書籍。
附表:
函數(shù)名稱 函數(shù)說明 語法形式
AVEDEV 返回一組數(shù)據(jù)與其均值的絕對(duì)偏差的平均值,即離散度。 AVEDEV(number1,number2, ...)
AVERAGE 返回參數(shù)算術(shù)平均值。 AVERAGE(number1,number2, ...)
AVERAGEA 計(jì)算參數(shù)清單中數(shù)值的平均值(算數(shù)平均值)。不僅數(shù)字,而且文本和邏輯值(如TRUE 和 FALSE)也將計(jì)算在內(nèi)。 AVERAGEA(value1,value2,...)
BETADIST 返回 Beta 分布累積函數(shù)的函數(shù)值。Beta 分布累積函數(shù)通常用于研究樣本集合中某些事物的發(fā)生和變化情況。 BETADIST(x,alpha,beta,A,B)
BETAINV 返回 beta 分布累積函數(shù)的逆函數(shù)值。即,如果 probability = BETADIST(x,...),則 BETAINV(probability,...) = x。beta 分布累積函數(shù)可用于項(xiàng)目設(shè)計(jì),在給定期望的完成時(shí)間和變化參數(shù)后,模擬可能的完成時(shí)間。 BETAINV(probability,alpha,beta,A,B)
BINOMDIST 返回一元二項(xiàng)式分布的概率值。 BINOMDIST(number_s,trials,probability_s,cumulative)
CHIDIST 返回 γ2 分布的單尾概率。γ2 分布與 γ2 檢驗(yàn)相關(guān)。使用 γ2 檢驗(yàn)可以比較觀察值和期望值。 CHIDIST(x,degrees_freedom)
CHIINV 返回 γ2 分布單尾概率的逆函數(shù)。 CHIINV(probability,degrees_freedom)
CHITEST 返回獨(dú)立性檢驗(yàn)值。函數(shù) CHITEST 返回 γ2 分布的統(tǒng)計(jì)值及相應(yīng)的自由度。 CHITEST(actual_range,expected_range)
CONFIDENCE 返回總體平均值的置信區(qū)間。置信區(qū)間是樣本平均值任意一側(cè)的區(qū)域。 CONFIDENCE(alpha,standard_dev,size)
CORREL 返回單元格區(qū)域 array1 和 array2 之間的相關(guān)系數(shù)。使用相關(guān)系數(shù)可以確定兩種屬性之間的關(guān)系。 CORREL(array1,array2)
COUNT 返回參數(shù)的個(gè)數(shù)。利用函數(shù) COUNT 可以計(jì)算數(shù)組或單元格區(qū)域中數(shù)字項(xiàng)的個(gè)數(shù)。 COUNT(value1,value2, ...)
COUNTA 返回參數(shù)組中非空值的數(shù)目。利用函數(shù)COUNTA 可以計(jì)算數(shù)組或單元格區(qū)域中數(shù)據(jù)項(xiàng)的個(gè)數(shù)。 COUNTA(value1,value2, ...)
COVAR 返回協(xié)方差,即每對(duì)數(shù)據(jù)點(diǎn)的偏差乘積的平均數(shù),利用協(xié)方差可以決定兩個(gè)數(shù)據(jù)集之間的關(guān)系。 COVAR(array1,array2)
CRITBINOM 返回使累積二項(xiàng)式分布大于等于臨界值的最小值。此函數(shù)可以用于質(zhì)量檢驗(yàn)。 CRITBINOM(trials,probability_s,alpha)
DEVSQ 返回?cái)?shù)據(jù)點(diǎn)與各自樣本均值偏差的平方和。 DEVSQ(number1,number2,...)
EXPONDIST 返回指數(shù)分布。使用函數(shù) EXPONDIST 可以建立事件之間的時(shí)間間隔模型。 EXPONDIST(x,lambda,cumulative)
FDIST 返回 F 概率分布。使用此函數(shù)可以確定兩個(gè)數(shù)據(jù)系列是否存在變化程度上的不同。 FDIST(x,degrees_freedom1,degrees_freedom2)
FINV 返回 F 概率分布的逆函數(shù)值。 FINV(probability,degrees_freedom1,degrees_freedom2)
FISHER 返回點(diǎn) x 的 Fisher 變換。該變換生成一個(gè)近似正態(tài)分布而非偏斜的函數(shù)。 FISHER(x)
FISHERINV 返回 Fisher 變換的逆函數(shù)值。使用此變換可以分析數(shù)據(jù)區(qū)域或數(shù)組之間的相關(guān)性。 FISHERINV(y)
FORECAST 根據(jù)給定的數(shù)據(jù)計(jì)算或預(yù)測(cè)未來值。 FORECAST(x,known_y's,known_x's)
FREQUENCY 以一列垂直數(shù)組返回某個(gè)區(qū)域中數(shù)據(jù)的頻率分布。 FREQUENCY(data_array,bins_array)
FTEST 返回 F 檢驗(yàn)的結(jié)果。F 檢驗(yàn)返回的是當(dāng)數(shù)組 1 和數(shù)組 2 的方差無明顯差異時(shí)的單尾概率。可以使用此函數(shù)來判斷兩個(gè)樣本的方差是否不同。 FTEST(array1,array2)
GAMMADIST 返回伽瑪分布??梢允褂么撕瘮?shù)來研究具有偏態(tài)分布的變量。伽瑪分布通常用于排隊(duì)分析。 GAMMADIST(x,alpha,beta,cumulative)
GAMMAINV 返回伽瑪分布的累積函數(shù)的逆函數(shù)。 GAMMAINV(probability,alpha,beta)
GAMMALN 返回伽瑪函數(shù)的自然對(duì)數(shù),Γ(x)。 GAMMALN(x)
GEOMEAN 返回正數(shù)數(shù)組或數(shù)據(jù)區(qū)域的幾何平均值。 GEOMEAN(number1,number2, ...)
GROWTH 根據(jù)給定的數(shù)據(jù)預(yù)測(cè)指數(shù)增長(zhǎng)值。 GROWTH(known_y's,known_x's,new_x's,const)
HARMEAN 返回?cái)?shù)據(jù)集合的調(diào)和平均值。調(diào)和平均值與倒數(shù)的算術(shù)平均值互為倒數(shù)。 HARMEAN(number1,number2, ...)
HYPGEOMDIST 返回超幾何分布。 HYPGEOMDIST(sample_s,number_sample,
population_s,number_population)
INTERCEPT 利用已知的 x 值與 y 值計(jì)算直線與 y 軸的截距。 INTERCEPT(known_y's,known_x's)
KURT 返回?cái)?shù)據(jù)集的峰值。 KURT(number1,number2, ...)
LARGE 返回?cái)?shù)據(jù)集里第 k 個(gè)最大值。使用此函數(shù)可以根據(jù)相對(duì)標(biāo)準(zhǔn)來選擇數(shù)值。 LARGE(array,k)
LINEST 使用最小二乘法計(jì)算對(duì)已知數(shù)據(jù)進(jìn)行最佳直線擬合,并返回描述此直線的數(shù)組。 LINEST(known_y's,known_x's,const,stats)
LOGEST 在回歸分析中,計(jì)算最符合觀測(cè)數(shù)據(jù)組的指數(shù)回歸擬合曲線,并返回描述該曲線的數(shù)組。 LOGEST(known_y's,known_x's,const,stats)
LOGINV 返回 x 的對(duì)數(shù)正態(tài)分布累積函數(shù)的逆函數(shù)。 LOGINV(probability,mean,standard_dev)
LOGNORMDIST 返回 x 的對(duì)數(shù)正態(tài)分布的累積函數(shù)。 LOGNORMDIST(x,mean,standard_dev)
MAX 返回?cái)?shù)據(jù)集中的最大數(shù)值。 MAX(number1,number2,...)
MAXA 返回參數(shù)清單中的最大數(shù)值。 MAXA(value1,value2,...)
MEDIAN 返回給定數(shù)值集合的中位數(shù)。中位數(shù)是在一組數(shù)據(jù)中居于中間的數(shù)。 MEDIAN(number1,number2, ...)
MIN 返回給定參數(shù)表中的最小值。 MIN(number1,number2, ...)
MINA 返回參數(shù)清單中的最小數(shù)值。 MINA(value1,value2,...)
MODE 返回在某一數(shù)組或數(shù)據(jù)區(qū)域中出現(xiàn)頻率最多的數(shù)值。 MODE(number1,number2, ...)
NEGBINOMDIST 返回負(fù)二項(xiàng)式分布。 NEGBINOMDIST(number_f,number_s,probability_s)
NORMDIST 返回給定平均值和標(biāo)準(zhǔn)偏差的正態(tài)分布的累積函數(shù)。 NORMDIST(x,mean,standard_dev,cumulative)
NORMINV 返回給定平均值和標(biāo)準(zhǔn)偏差的正態(tài)分布的累積函數(shù)的逆函數(shù)。 NORMINV(probability,mean,standard_dev)
NORMSDIST 返回標(biāo)準(zhǔn)正態(tài)分布的累積函數(shù),該分布的平均值為 0,標(biāo)準(zhǔn)偏差為 1。 NORMSDIST(z)
NORMSINV 返回標(biāo)準(zhǔn)正態(tài)分布累積函數(shù)的逆函數(shù)。該分布的平均值為 0,標(biāo)準(zhǔn)偏差為 1。 NORMSINV(probability)
PEARSON 返回 Pearson(皮爾生)乘積矩相關(guān)系數(shù),r,這是一個(gè)范圍在 -1.0 到 1.0 之間(包括 -1.0 和 1.0 在內(nèi))的無量綱指數(shù),反映了兩個(gè)數(shù)據(jù)集合之間的線性相關(guān)程度。 PEARSON(array1,array2)
PERCENTILE 返回?cái)?shù)值區(qū)域的 K 百分比數(shù)值點(diǎn)??梢允褂么撕瘮?shù)來建立接受閥值。例如,可以確定得分排名在 90 個(gè)百分點(diǎn)以上的檢測(cè)侯選人。 PERCENTILE(array,k)
PERCENTRANK 返回特定數(shù)值在一個(gè)數(shù)據(jù)集中的百分比排位。此函數(shù)可用于查看特定數(shù)據(jù)在數(shù)據(jù)集中所處的位置。例如,可以使用函數(shù) PERCENTRANK 計(jì)算某個(gè)特定的能力測(cè)試得分在所有的能力測(cè)試得分中的位置。 PERCENTRANK(array,x,significance)
PERMUT 返回從給定數(shù)目的對(duì)象集合中選取的若干對(duì)象的排列數(shù)。排列可以為有內(nèi)部順序的對(duì)象或?yàn)槭录娜我饧匣蜃蛹E帕信c組合不同,組合的內(nèi)部順序無意義。此函數(shù)可用于彩票計(jì)算中的概率。 PERMUT(number,number_chosen)
POISSON 返回泊松分布。泊松分布通常用于預(yù)測(cè)一段時(shí)間內(nèi)事件發(fā)生的次數(shù),比如一分鐘內(nèi)通過收費(fèi)站的轎車的數(shù)量。 POISSON(x,mean,cumulative)
PROB 返回一概率事件組中落在指定區(qū)域內(nèi)的事件所對(duì)應(yīng)的概率之和。如果沒有給出 upper_limit,則返回 x _range 內(nèi)值等于 lower_limit 的概率。 PROB(x_range,prob_range,lower_limit,upper_limit)
QUARTILE 返回?cái)?shù)據(jù)集的四分位數(shù)。四分位數(shù)通常用于在銷售額和測(cè)量值數(shù)據(jù)集中對(duì)總體進(jìn)行分組。例如,可以使用函數(shù) QUARTILE 求得總體中前 25% 的收入值。 QUARTILE(array,quart)
RANK 返回一個(gè)數(shù)值在一組數(shù)值中的排位。數(shù)值的排位是與數(shù)據(jù)清單中其他數(shù)值的相對(duì)大?。ㄈ绻麛?shù)據(jù)清單已經(jīng)排過序了,則數(shù)值的排位就是它當(dāng)前的位置)。 RANK(number,ref,order)
RSQ 返回根據(jù) known_y's 和 known_x's 中數(shù)據(jù)點(diǎn)計(jì)算得出的 Pearson 乘積矩相關(guān)系數(shù)的平方。有關(guān)詳細(xì)信息,請(qǐng)參閱函數(shù) REARSON。R 平方值可以解釋為 y 方差與 x 方差的比例。 RSQ(known_y's,known_x's)
SKEW 返回分布的偏斜度。偏斜度反映以平均值為中心的分布的不對(duì)稱程度。正偏斜度表示不對(duì)稱邊的分布更趨向正值。負(fù)偏斜度表示不對(duì)稱邊的分布更趨向負(fù)值。 SKEW(number1,number2,...)
SLOPE 返回根據(jù) known_y's 和 known_x's 中的數(shù)據(jù)點(diǎn)擬合的線性回歸直線的斜率。斜率為直線上任意兩點(diǎn)的重直距離與水平距離的比值,也就是回歸直線的變化率。 SLOPE(known_y's,known_x's)
SMALL 返回?cái)?shù)據(jù)集中第 k 個(gè)最小值。使用此函數(shù)可以返回?cái)?shù)據(jù)集中特定位置上的數(shù)值。 SMALL(array,k)
STANDARDIZE 返回以 mean 為平均值,以 standard-dev 為標(biāo)準(zhǔn)偏差的分布的正態(tài)化數(shù)值。 STANDARDIZE(x,mean,standard_dev)
STDEV 估算樣本的標(biāo)準(zhǔn)偏差。標(biāo)準(zhǔn)偏差反映相對(duì)于平均值(mean)的離散程度。 STDEV(number1,number2,...)
STDEVA 估算基于給定樣本的標(biāo)準(zhǔn)偏差。標(biāo)準(zhǔn)偏差反映數(shù)值相對(duì)于平均值(mean)的離散程度。文本值和邏輯值(如 TRUE 或 FALSE)也將計(jì)算在內(nèi)。 STDEVA(value1,value2,...)
STDEVP 返回以參數(shù)形式給出的整個(gè)樣本總體的標(biāo)準(zhǔn)偏差。標(biāo)準(zhǔn)偏差反映相對(duì)于平均值(mean)的離散程度。 STDEVP(number1,number2,...)
STDEVPA 計(jì)算樣本總體的標(biāo)準(zhǔn)偏差。標(biāo)準(zhǔn)偏差反映數(shù)值相對(duì)于平均值(mean)的離散程度。 STDEVPA(value1,value2,...)
STEYX 返回通過線性回歸法計(jì)算 y 預(yù)測(cè)值時(shí)所產(chǎn)生的標(biāo)準(zhǔn)誤差。標(biāo)準(zhǔn)誤差用來度量根據(jù)單個(gè) x 變量計(jì)算出的 y 預(yù)測(cè)值的誤差量。 STEYX(known_y's,known_x's)
TDIST 返回學(xué)生 t- 分布的百分點(diǎn)(概率),t 分布中數(shù)值 (x) 是 t 的計(jì)算值(將計(jì)算其百分點(diǎn))。t 分布用于小樣本數(shù)據(jù)集合的假設(shè)檢驗(yàn)。使用此函數(shù)可以代替 t 分布的臨界值表。 TDIST(x,degrees_freedom,tails)
TINV 返回作為概率和自由度函數(shù)的學(xué)生 t 分布的 t 值。 TINV(probability,degrees_freedom)
TREND 返回一條線性回歸擬合線的一組縱坐標(biāo)值(y 值)。即找到適合給定的數(shù)組 known_y's 和 known_x's 的直線(用最小二乘法),并返回指定數(shù)組 new_x's 值在直線上對(duì)應(yīng)的 y 值。 TREND(known_y's,known_x's,new_x's,const)
TRIMMEAN 返回?cái)?shù)據(jù)集的內(nèi)部平均值。函數(shù) TRIMMEAN 先從數(shù)據(jù)集的頭部和尾部除去一定百分比的數(shù)據(jù)點(diǎn),然后再求平均值。當(dāng)希望在分析中剔除一部分?jǐn)?shù)據(jù)的計(jì)算時(shí),可以使用此函數(shù)。 TRIMMEAN(array,percent)
TTEST 返回與學(xué)生氏- t 檢驗(yàn)相關(guān)的概率??梢允褂煤瘮?shù) TTEST 判斷兩個(gè)樣本是否可能來自兩個(gè)具有相同均值的總體。 TTEST(array1,array2,tails,type)
VAR 估算樣本方差。 VAR(number1,number2,...)
VARA 估算基于給定樣本的方差。不僅數(shù)字,文本值和邏輯值(如 TRUE 和 FALSE)也將計(jì)算在內(nèi)。 VARA(value1,value2,...)
VARP 計(jì)算樣本總體的方差。 VARP(number1,number2,...)
VARPA 計(jì)算樣本總體的方差。不僅數(shù)字,文本值和邏輯值(如 TRUE 和 FALSE)也將計(jì)算在內(nèi)。 VARPA(value1,value2,...)
WEIBULL 返回韋伯分布。使用此函數(shù)可以進(jìn)行可靠性分析,比如計(jì)算設(shè)備的平均故障時(shí)間。 WEIBULL(x,alpha,beta,cumulative)
ZTEST 返回 z 檢驗(yàn)的雙尾 P 值。Z 檢驗(yàn)根據(jù)數(shù)據(jù)集或數(shù)組生成 x 的標(biāo)準(zhǔn)得分,并返回正態(tài)分布的雙尾概率??梢允褂么撕瘮?shù)返回從某總體中抽取特定觀測(cè)值的似然估計(jì)。
三、如何做數(shù)據(jù)分析
數(shù)據(jù)分析有:分類分析,矩陣分析,漏斗分析,相關(guān)分析,邏輯樹分析,趨勢(shì)分析,行為軌跡分析,等等。 我用HR的工作來舉例,說明上面這些分析要怎么做,才能得出洞見。
01) 分類分析
比如分成不同部門、不同崗位層級(jí)、不同年齡段,來分析人才流失率。比如發(fā)現(xiàn)某個(gè)部門流失率特別高,那么就可以去分析。
02) 矩陣分析
比如公司有價(jià)值觀和能力的考核,那么可以把考核結(jié)果做出矩陣圖,能力強(qiáng)價(jià)值匹配的員工、能力強(qiáng)價(jià)值不匹配的員工、能力弱價(jià)值匹配的員工、能力弱價(jià)值不匹配的員工各占多少比例,從而發(fā)現(xiàn)公司的人才健康度。
03) 漏斗分析
比如記錄招聘數(shù)據(jù),投遞簡(jiǎn)歷、通過初篩、通過一面、通過二面、通過終面、接下Offer、成功入職、通過試用期,這就是一個(gè)完整的招聘漏斗,從數(shù)據(jù)中,可以看到哪個(gè)環(huán)節(jié)還可以優(yōu)化。
04) 相關(guān)分析
比如公司各個(gè)分店的人才流失率差異較大,那么可以把各個(gè)分店的員工流失率,跟分店的一些特性(地理位置、薪酬水平、福利水平、員工年齡、管理人員年齡等)要素進(jìn)行相關(guān)性分析,找到最能夠挽留員工的關(guān)鍵因素。
05) 邏輯樹分析
比如近期發(fā)現(xiàn)員工的滿意度有所降低,那么就進(jìn)行拆解,滿意度跟薪酬、福利、職業(yè)發(fā)展、工作氛圍有關(guān),然后薪酬分為基本薪資和獎(jiǎng)金,這樣層層拆解,找出滿意度各個(gè)影響因素里面的變化因素,從而得出洞見。
06) 趨勢(shì)分析
比如人才流失率過去12個(gè)月的變化趨勢(shì)。
07)行為軌跡分析
比如跟蹤一個(gè)銷售人員的行為軌跡,從入職、到開始產(chǎn)生業(yè)績(jī)、到業(yè)績(jī)快速增長(zhǎng)、到疲憊期、到逐漸穩(wěn)定。
通過面向企業(yè)業(yè)務(wù)場(chǎng)景提供一站式大數(shù)據(jù)分析解決方案,能夠?yàn)槠髽I(yè)在增收益、降成本、提效率、控成本等四個(gè)角度帶來價(jià)值貢獻(xiàn)。
1、增收益
最直觀的應(yīng)用,即利用數(shù)據(jù)分析實(shí)現(xiàn)數(shù)字化精準(zhǔn)營(yíng)銷。通過深度分析用戶購買行為、消費(fèi)習(xí)慣等,刻畫用戶畫像,將數(shù)據(jù)分析結(jié)果轉(zhuǎn)化為可操作執(zhí)行的客戶管理策略,以最佳的方式觸及更多的客戶,以實(shí)現(xiàn)銷售收入的增長(zhǎng)。
下圖為推廣收支測(cè)算分析,為廣告投放提供決策依據(jù)。
下圖為渠道銷量分析,為渠道支持提供數(shù)據(jù)支撐。
2、降成本
例如通過數(shù)據(jù)分析實(shí)現(xiàn)對(duì)財(cái)務(wù)和人力的管理,從而控制各項(xiàng)成本、費(fèi)用的支出,實(shí)現(xiàn)降低成本的作用。
下圖為生產(chǎn)成本分析,了解成本構(gòu)成情況。
下圖為期間費(fèi)用預(yù)實(shí)對(duì)比分析,把控費(fèi)用情況。
3、提效率
每個(gè)企業(yè)都會(huì)出具相關(guān)報(bào)表,利用數(shù)據(jù)分析工具,不懂技術(shù)的業(yè)務(wù)人員也能夠通過簡(jiǎn)單的拖拉拽實(shí)現(xiàn)敏捷自助分析,無需業(yè)務(wù)人員提需求、IT人員做報(bào)表,大大提高報(bào)表的及時(shí)性,提高了報(bào)表的使用效率。
通過數(shù)據(jù)分析工具,能夠在PC端展示,也支持移動(dòng)看板,隨時(shí)隨地透視經(jīng)營(yíng),提高決策效率。
4、控風(fēng)險(xiǎn)
預(yù)算是否超支?債務(wù)是否逾期?是否缺貨了、斷貨了?客戶的回款率怎么樣?設(shè)備的運(yùn)行是否正常?哪種產(chǎn)品是否需要加速生產(chǎn)以實(shí)現(xiàn)產(chǎn)銷平衡?...其實(shí),幾乎每個(gè)企業(yè)都會(huì)遇到各種各樣的風(fēng)險(xiǎn)問題。通過數(shù)據(jù)分析,能夠幫助企業(yè)進(jìn)行實(shí)時(shí)監(jiān)測(cè),對(duì)偏離了預(yù)算的部分、對(duì)偏離了正常范圍的數(shù)值能夠進(jìn)行主動(dòng)預(yù)警,降低企業(yè)風(fēng)險(xiǎn)。
下圖為稅負(fù)率指標(biāo),當(dāng)綜合稅負(fù)率過高,可以實(shí)現(xiàn)提示和預(yù)警。
下圖為重要指標(biāo)預(yù)警,重點(diǎn)監(jiān)控項(xiàng)目的毛利率。
四、數(shù)據(jù)分析包括哪些內(nèi)容?
1.數(shù)據(jù)獲取
數(shù)據(jù)獲取看似簡(jiǎn)單,但是需要把握對(duì)問題的商業(yè)理解,轉(zhuǎn)化成數(shù)據(jù)問題來解決,直白點(diǎn)講就是需要哪些數(shù)據(jù),從哪些角度來分析,界定問題后,再進(jìn)行數(shù)據(jù)采集。此環(huán)節(jié),需要數(shù)據(jù)分析師具備結(jié)構(gòu)化的邏輯思維。
2.數(shù)據(jù)處理
數(shù)據(jù)的處理需要掌握有效率的工具:Excel基礎(chǔ)、常用函數(shù)和公式、數(shù)據(jù)透視表、VBA程序開發(fā)等式必備的;其次是Oracle和SQL sever,這是企業(yè)大數(shù)據(jù)分析不可缺少的技能;還有Hadoop之類的分布式數(shù)據(jù)庫,也要掌握。
3.分析數(shù)據(jù)
分析數(shù)據(jù)往往需要各類統(tǒng)計(jì)分析模型,如關(guān)聯(lián)規(guī)則、聚類、分類、預(yù)測(cè)模型等等。SPSS、SAS、Python、R等工具,多多益善。
4.數(shù)據(jù)呈現(xiàn)
可視化工具,有開源的Tableau可用,也有一些商業(yè)BI軟件,根據(jù)實(shí)際情況掌握即可。
以上就是關(guān)于數(shù)據(jù)分析預(yù)測(cè)相關(guān)問題的回答。希望能幫到你,如有更多相關(guān)問題,您也可以聯(lián)系我們的客服進(jìn)行咨詢,客服也會(huì)為您講解更多精彩的知識(shí)和內(nèi)容。
推薦閱讀:
app顯示數(shù)據(jù)異常是什么意思?。╝pp顯示數(shù)據(jù)異常是什么意思啊蘋果)
快手?jǐn)?shù)據(jù)修改器app(快手?jǐn)?shù)據(jù)修改器網(wǎng)盤)
調(diào)查問卷怎么刷數(shù)據(jù)(如何刷調(diào)查問卷的數(shù)量)
常州居住區(qū)景觀設(shè)計(jì)作品(常州居住區(qū)景觀設(shè)計(jì)作品有哪些)
roⅡer一skating怎么讀(goⅰce-skating怎么讀)