-
當(dāng)前位置:首頁(yè) > 創(chuàng)意學(xué)院 > 技術(shù) > 專題列表 > 正文
r語(yǔ)言數(shù)據(jù)分析圖(r語(yǔ)言數(shù)據(jù)分析圖形化)
大家好!今天讓創(chuàng)意嶺的小編來(lái)大家介紹下關(guān)于r語(yǔ)言數(shù)據(jù)分析圖的問(wèn)題,以下是小編對(duì)此問(wèn)題的歸納整理,讓我們一起來(lái)看看吧。
開(kāi)始之前先推薦一個(gè)非常厲害的Ai人工智能工具,一鍵生成原創(chuàng)文章、方案、文案、工作計(jì)劃、工作報(bào)告、論文、代碼、作文、做題和對(duì)話答疑等等
只需要輸入關(guān)鍵詞,就能返回你想要的內(nèi)容,越精準(zhǔn),寫(xiě)出的就越詳細(xì),有微信小程序端、在線網(wǎng)頁(yè)版、PC客戶端
官網(wǎng):https://ai.de1919.com。
創(chuàng)意嶺作為行業(yè)內(nèi)優(yōu)秀的企業(yè),服務(wù)客戶遍布全球各地,如需了解SEO相關(guān)業(yè)務(wù)請(qǐng)撥打電話175-8598-2043,或添加微信:1454722008
本文目錄:
一、【數(shù)據(jù)分析與挖掘】R語(yǔ)言矩陣Matrix與數(shù)組Array
之前我們講了向量,向量就仿佛一個(gè)一維數(shù)組一樣
那么我們接下來(lái)就講講二維數(shù)組
創(chuàng)建一個(gè)matrix需要用到matrix函數(shù)
martix(參數(shù)1,nrow=行數(shù),ncol=列數(shù),byrow=布爾值)
參數(shù)1:matrix初始化的值,如果給出的值不夠matrix長(zhǎng)度將重復(fù)賦值,如果給出的值溢出將會(huì)報(bào)錯(cuò)。
參數(shù)byrow:這是一個(gè)布爾值如果給定TRUE,初始數(shù)據(jù)按行順序推進(jìn),反之按列順序推進(jìn)。
這里說(shuō)一下R語(yǔ)言中 ' . ' 并沒(méi)有特殊的意義,只是變量名的一部分
讀取矩陣我們用到:矩陣名[行,列]
這里的行和列可以接收單個(gè)數(shù)組也可以接收一個(gè)向量
當(dāng)然如果是負(fù)數(shù)和向量一樣就是排除掉對(duì)應(yīng)索引指向的值
test.m[2, ] #取第二行,我們注意這里把列的地方空出來(lái)就是顯示所有列
test.m[ ,2] #取第二列
test.m[2,2] #取第二行第二個(gè)
我們也可以給索引一個(gè)向量 比如3:4或者c(1,4)之類的,如上圖所示,索引值也可以不連續(xù)
我們知道在二維表中 我們通常給每一行每一列取一個(gè)名字
矩陣中我們也可以這樣做
首先我們給每一行每一列取一個(gè)名字,用向量保存
之后我們使用rownames(矩陣名)<-存有名字的向量給每行取名,給列取名同理見(jiàn)上圖
取名之后我們可以用名稱代替下標(biāo)訪問(wèn),例如:test.m['2nd','二']
看到這里,我真的覺(jué)得數(shù)據(jù)分析相關(guān)專業(yè)十分的艱難,需要用一些稀奇古怪的東西來(lái)進(jìn)行數(shù)據(jù)分析
因?yàn)楸救耸怯?jì)科專業(yè)的,平時(shí)用的數(shù)組就是單純的數(shù)組,R語(yǔ)言的數(shù)組我一開(kāi)始是令我懷疑人生的。
創(chuàng)建一個(gè)數(shù)組我們需要用到array函數(shù)
array(data=數(shù)組中的數(shù)據(jù)從1維平鋪, dim=給定一個(gè)數(shù)值型向量, dimnames=list(包含一維名稱的向量,二維名稱....))
其中data參數(shù)用來(lái)給出數(shù)組的數(shù)據(jù)從第一維第一個(gè)開(kāi)始順序向后平鋪
dim給定數(shù)組的緯度和每緯的寬度
dimnames給每個(gè)緯度的每格的名字 #這個(gè)參數(shù)可以忽略
至于如何讀取數(shù)組中的數(shù)據(jù)和矩陣一致這里不再敘述,只不過(guò)把二維改成多維的情況。
我截完圖發(fā)現(xiàn)arr[2,2,2]這個(gè)例子并不好,如果我們查看arr[3,2,1]將會(huì)顯示6。
二、R語(yǔ)言 | 差異表達(dá)基因分析(DEGs)| 原始數(shù)據(jù)處理&火山圖繪制
[1]Anders S, Huber W. Differential expression analysis for sequence count data. Genome Biol . 2010;11(10):R106. doi:10.1186/gb-2010-11-10-r106
三、R語(yǔ)言對(duì)應(yīng)分析
@[toc]
Q型分析:樣本之間的關(guān)系(聚類算法等)
R型分析:變量之間的關(guān)系(主成分分析、因子分析等)。
有時(shí)候我們不僅要弄清樣本之間和變量之間的關(guān)系,還要弄清 樣本與變量之間的關(guān)系 ,而對(duì)應(yīng)分析就是這樣一種分析方法。(變量就是指特征)
對(duì)應(yīng)分析為我們可以提供三個(gè)方面的信息
上述三方面信息都可以通過(guò)二維圖呈現(xiàn)出來(lái)
當(dāng)對(duì)兩個(gè)分類變量進(jìn)行的對(duì)應(yīng)分析稱為 簡(jiǎn)單對(duì)應(yīng)分析 ;
對(duì)兩個(gè)以上的分類變量進(jìn)行的對(duì)應(yīng)分析稱為 多重對(duì)應(yīng)分析 。
對(duì)應(yīng)分析將變量及變量之間的聯(lián)系同時(shí)反映在一張二維或三維的散點(diǎn)圖上,并使聯(lián)系密切的類別點(diǎn)較集中,聯(lián)系疏遠(yuǎn)的類別點(diǎn)較分散;通過(guò)觀察對(duì)應(yīng)分布圖就能直觀地把握變量類別之間的聯(lián)系。
對(duì)于該方法,在減少維度方面與因子分析相似,在作分布圖方面與多維尺度方法相似。
在對(duì)數(shù)據(jù)作對(duì)應(yīng)分析之前,需要先了解因素間是否獨(dú)立。如果因素之間相互獨(dú)立,則沒(méi)有必要進(jìn)行對(duì)應(yīng)分析,當(dāng)因素間在統(tǒng)計(jì)學(xué)上具有顯著的關(guān)聯(lián)性時(shí),在此基礎(chǔ)上使用對(duì)應(yīng)分析方法,其分析結(jié)果才具有意義。
p-value < 0.001,兩組變量顯著不獨(dú)立,說(shuō)明具有相關(guān)性。
四、用r語(yǔ)言做數(shù)據(jù)分析好學(xué)嗎?
非常好學(xué)。輸入幾行代碼,即可得到結(jié)果。
R不但數(shù)據(jù)分析好用,而且作圖能力極好,推薦你用。
下面是R數(shù)據(jù)分析的一些代碼,包括數(shù)據(jù)導(dǎo)入、方差分析、卡方測(cè)驗(yàn)、線性模型及其誤差分析。希望可以幫到你:
1.1導(dǎo)入數(shù)據(jù)
install.packages('xslx')
library(xlsx)
Sys.setlocale("LC_ALL", "zh_cn.utf-8")
a=read.xlsx2('d:/1.xlsx',1,header=F)
head(a)顯示前六行
class(a$y)/str(a)查看列/全集數(shù)據(jù)類型
a$y=as.numeric(a$y)轉(zhuǎn)換數(shù)據(jù)類型
1.2方差分析(F test)
with(a,tapply(liqi,tan,shapiro.test))正態(tài)性檢驗(yàn)
library(car)leveneTest(liqi~tan,a)方差齊性檢驗(yàn)
q=aov(liqi~tan*chong,a)方差分析(正態(tài)型)
summary(q)
TukeyHSD(q)多重比較
1.3卡方測(cè)驗(yàn)(Pearson Chisq)
a1=summarySE(a,measurevar='y', groupvars=c('x1','x2'))卡方檢驗(yàn)(邏輯型/計(jì)數(shù)型)
aa=a1$y
aaa=matrix(a2,ncol=2)
aaa= as.table(rbind(c(56,44), c(36,64), c(48,52),c(58,42)))
dimnames(aaa)= list(group=c("不添加抗性","不添加敏感","添加抗性","添加敏感"),effect=c("存活","死亡"))
aaa=xtabs(data=a,~x+y)
chisq.test(a)誤差分析(卡方測(cè)驗(yàn),Pearson法)
install.packages("rcompanion")
library(rcompanion)
pairwiseNominalIndependence(a)多重比較
1.4線性模型及其誤差分析(Wald Chisq)
q=lm(data=a,y~x1*x2)一般線性模型(正態(tài)性)
summary(q)
q=glm(data=a,y~x1*x2,family = gaussian(link='identity'))廣義線性模型(正態(tài)性)
summary(q)
q=glm(data=a,y~x1*x2,family = binomial(link='logit'))廣義線性模型(邏輯型,二項(xiàng)分布)
summary(q)
q=glm(data=a,y~x1*x2,family = poisson(link='log'))廣義線性模型(計(jì)數(shù)型,泊松分布)
summary(q)
install.packages('lmerTest')一般線性混合效應(yīng)模型(正態(tài)性)
library(lmerTest)
install packages(‘lme4’)
library(lme4)
q=lmer(data=a,y~x1*(1|x2))
q=lmer(data=a,y~x1*(1|x2),family = gaussian(link='identity'))廣義線性混合效應(yīng)模型(正態(tài)性)
q=glmer(data=a,y~x1*(1|x2),family = binomial(link='logit'))廣義線性混合效應(yīng)模型(邏輯型,二項(xiàng)分布)
q=glmer(data=a,y~x1*(1|x2),family = poisson(link='log'))廣義線性混合效應(yīng)模型(計(jì)數(shù)型,泊松分布)
summary(q)
install.packages('car')
install.packages('openxlsx')
library(car)
install.packages('nlme')
library(nlme)
Anova(q,test='Chisq')線性模型的誤差分析(似然比卡方測(cè)驗(yàn),Wald法)
lsmeans(q,pairwise~chuli,adjust = "tukey")線性模型的多重比較(tukey法)
以上就是關(guān)于r語(yǔ)言數(shù)據(jù)分析圖相關(guān)問(wèn)題的回答。希望能幫到你,如有更多相關(guān)問(wèn)題,您也可以聯(lián)系我們的客服進(jìn)行咨詢,客服也會(huì)為您講解更多精彩的知識(shí)和內(nèi)容。
推薦閱讀:
R語(yǔ)言基礎(chǔ)知識(shí)(r語(yǔ)言基礎(chǔ)知識(shí)代碼)
r語(yǔ)言數(shù)據(jù)分析圖(r語(yǔ)言數(shù)據(jù)分析圖形化)
r語(yǔ)言讀不了csv文件(r語(yǔ)言讀取csv文件為什么報(bào)錯(cuò))
百度關(guān)鍵詞怎么添加(百度關(guān)鍵詞怎么添加圖片)
全國(guó)客機(jī)十大排名表(中國(guó)客機(jī)品牌大全)
猜你喜歡
沈陽(yáng)seo關(guān)鍵詞優(yōu)化排名(沈陽(yáng)seo網(wǎng)站排名優(yōu)化)
國(guó)內(nèi)chrome怎么登錄(國(guó)內(nèi)chrome怎么登錄手機(jī))
日常網(wǎng)抑云是什么意思(日常網(wǎng)抑云是什么意思呀)
HTML5網(wǎng)頁(yè)設(shè)計(jì)(html5網(wǎng)頁(yè)設(shè)計(jì)與制作)
關(guān)鍵詞運(yùn)用技巧(關(guān)鍵詞運(yùn)用技巧和方法)
網(wǎng)站快照出現(xiàn)其它內(nèi)容(網(wǎng)站快照出現(xiàn)其它內(nèi)容怎么解決)