溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點(diǎn)擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

R語言數(shù)據(jù)可視化tidyr與ggplot2多個變量分層展示的實(shí)現(xiàn)方法是什么

發(fā)布時間:2021-11-06 13:33:39 來源:億速云 閱讀:157 作者:iii 欄目:開發(fā)技術(shù)

本篇內(nèi)容主要講解“R語言數(shù)據(jù)可視化tidyr與ggplot2多個變量分層展示的實(shí)現(xiàn)方法是什么”,感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷,實(shí)用性強(qiáng)。下面就讓小編來帶大家學(xué)習(xí)“R語言數(shù)據(jù)可視化tidyr與ggplot2多個變量分層展示的實(shí)現(xiàn)方法是什么”吧!

在R語言普通的繪圖中,使用par()參數(shù)可以在一張圖上實(shí)現(xiàn)不同變量的子圖。如果我們想要用ggplot2實(shí)現(xiàn),則需要整理我們的原始數(shù)據(jù),這通常是非常麻煩的,這時就需要用到我們的tidyr來幫助我們繪圖。

可能說上面一段話不是很容易理解,下面我們來舉個栗子。

每個變量的密度分布情況

y1 <- rnorm(20)
y2 <- rnorm(20)
dat <- data.frame(y1, y2)

現(xiàn)有的數(shù)據(jù)集:

y1          y2
1  -0.12781723 -2.39376880
2   0.50074083  0.72555237
3  -0.02419456  0.94721701
4  -0.26366759 -0.60006759
5   1.13042618 -0.07591046
6   0.04313160  1.18677742
7   0.01180343  0.17627700
8   0.15208821 -0.12472391
9  -0.72690758 -1.92233170
10  1.04903577 -0.66208974
11  0.89689082  0.16331929
12  0.28471495  2.00629127
13 -0.26956768 -0.11897779
14 -0.81699454 -1.05575302
15 -0.65923768  1.20971004
16  0.18237270  1.55745467
17 -0.52359358 -0.74253496
18  1.36949647  1.07759474
19 -0.39882438  0.83915414
20  0.92084949 -1.04859906

思考

我們要如何利用ggplot達(dá)到上圖的效果?

需要用數(shù)據(jù)集,將y1與y2分別整理到一個新的變量上,叫做var

里面所有的值也變成一個新的變量,叫做value;

如果只有兩個變量整理起來還比較簡單,但如果變量一旦增多,整理起來相對就較為繁瑣。所以這里推薦使用tidyr包來進(jìn)行整理。

其用起來也非常簡單。

tidyr

使用如下代碼,我們就可以整理成想要的結(jié)果:

dat %>%
  gather(y1, y2, key = "var", value = "value")

解釋一下上述代碼的含義:y1, y2表示原本數(shù)據(jù)中的變量;key = "var" 表示轉(zhuǎn)換之后,變量所在的那一列的名稱為var;value = "value"表示轉(zhuǎn)換之后,原本的值所在的那一列的名稱為value

輸出結(jié)果如下:

   var       value
1   y1 -0.12781723
2   y1  0.50074083
3   y1 -0.02419456
4   y1 -0.26366759
5   y1  1.13042618
6   y1  0.04313160
7   y1  0.01180343
8   y1  0.15208821
9   y1 -0.72690758
10  y1  1.04903577
11  y1  0.89689082
12  y1  0.28471495
13  y1 -0.26956768
14  y1 -0.81699454
15  y1 -0.65923768
16  y1  0.18237270
17  y1 -0.52359358
18  y1  1.36949647
19  y1 -0.39882438
20  y1  0.92084949
21  y2 -2.39376880
22  y2  0.72555237
23  y2  0.94721701
24  y2 -0.60006759
25  y2 -0.07591046
26  y2  1.18677742
27  y2  0.17627700
28  y2 -0.12472391
29  y2 -1.92233170
30  y2 -0.66208974
31  y2  0.16331929
32  y2  2.00629127
33  y2 -0.11897779
34  y2 -1.05575302
35  y2  1.20971004
36  y2  1.55745467
37  y2 -0.74253496
38  y2  1.07759474
39  y2  0.83915414
40  y2 -1.04859906

用了上述結(jié)果,就可以非常簡單地使用ggplot2進(jìn)行畫圖了。

ggplot2進(jìn)行繪圖

我們可以直接使用管道數(shù)據(jù)的處理方式進(jìn)行繪圖,簡便快捷:

dat %>%
  gather(y1, y2, key = "var", value = "value") %>%
  ggplot(aes(x = value)) + 
  geom_histogram(aes(fill = factor(var), y = ..density..),
                 alpha = 0.3, colour = 'black') +
  stat_density(geom = 'line', position = 'identity', size = 1.5,
               aes(colour = factor(var))) +
  facet_wrap(~ var, ncol = 2) + 
  labs(y = '直方圖與密度曲線', x = '值',
       title = '標(biāo)題', fill = '變量') +
  theme(plot.title = element_text(hjust = 0.5)) +
  guides(color = FALSE)

這里基本都是前面的博客:R語言學(xué)習(xí)ggplot2繪制統(tǒng)計圖形包全面詳解 里面有提及到。

只有一個就是guides(color = FALSE),表示隱藏線顏色的圖例,因?yàn)榫€的顏色我們是用color =來指定的。同理如果要隱藏柱狀圖顏色的圖例則使用 guides(fill = FALSE)即可。

到此,相信大家對“R語言數(shù)據(jù)可視化tidyr與ggplot2多個變量分層展示的實(shí)現(xiàn)方法是什么”有了更深的了解,不妨來實(shí)際操作一番吧!這里是億速云網(wǎng)站,更多相關(guān)內(nèi)容可以進(jìn)入相關(guān)頻道進(jìn)行查詢,關(guān)注我們,繼續(xù)學(xué)習(xí)!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報,并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI