溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

如何進(jìn)行R語言探索約基奇數(shù)據(jù)的分析

發(fā)布時間:2021-11-22 14:21:31 來源:億速云 閱讀:160 作者:柒染 欄目:大數(shù)據(jù)

本篇文章為大家展示了如何進(jìn)行R語言探索約基奇數(shù)據(jù)的分析,內(nèi)容簡明扼要并且容易理解,絕對能使你眼前一亮,通過這篇文章的詳細(xì)介紹希望你能有所收獲。


掘金又贏了,硬生生把系列賽從3比1打成了3:3,于是大家都來調(diào)侃說 

我 約基奇(約G7)的名號可不是白叫的!哈哈哈哈

那作為一個喜歡籃球的R語言初學(xué)者,當(dāng)然不能只看比賽了,還要把約基奇的常規(guī)數(shù)據(jù)探索學(xué)起來!

數(shù)據(jù)來源

https://www.statmuse.com/nba/player/nikola-jokic-9226/career-stats

 加載可能用到的包
library(xml2)
library(rvest)
library(reshape2)
library(ggplot2)
library(dplyr)
     讀取數(shù)據(jù)

打開數(shù)據(jù)來源的鏈接,鼠標(biāo)點擊右鍵檢查,將內(nèi)容復(fù)制到文本文件中,我這里命名為new1.txt

page<-read_html("new1.txt")
Jokic<-html_table(page,fill=T)
Jokic[[9]]
list(Jokic)
df1<-Jokic[[9]]
colnames(df1)
     首先看一看約基奇5個賽季常規(guī)賽的首發(fā)出場次數(shù)、場均出場時間、場均出手次數(shù)、命中率的變化趨勢

散點圖加折線圖

df1_1<-df1[1:5,]%>%
  select(Season,GS,MIN,FGA,"FG%")
df1_1
df1_1<-melt(df1_1)
head(df1_1)
ggplot(df1_1,aes(x=Season,y=value,color=variable))+
  geom_point(size=5)+
  geom_line(aes(group=1))+
  facet_wrap(~variable,scales = "free")+
  theme_bw()+
  theme(legend.position = "none")+
  labs(x="",y="")
 
如何進(jìn)行R語言探索約基奇數(shù)據(jù)的分析
Rplot.png

從上圖我們可以看到約基奇的命中率在17-18賽季最低,最近兩個賽季在穩(wěn)步上升,出手次數(shù)在19-20賽季略有下降,但出手次數(shù)整體是上升趨勢,側(cè)面反映約基奇從一個二輪秀到逐漸成為掘金隊進(jìn)攻核心的過程。場均出場時間17-18賽季達(dá)到最大值,恰好也是命中率最低的一個賽季,那我們可以合理猜測一下,要想最大效率的發(fā)揮約基奇的作用,應(yīng)該合理安排他的出場時間。畢竟這桶行走的百歲山體力問題可能是一個較大的困擾。

 接下來看一下得分、助攻、籃板、搶斷、失誤的數(shù)據(jù)
df1_2<-df1[1:5,]%>%
  select(Season,PTS,REB,AST,TOV,BLK)
df1_2<-melt(df1_2)
ggplot(df1_2,aes(x=Season,y=value,color=variable))+
  geom_point(size=5)+
  geom_line(aes(group=1))+
  facet_wrap(~variable,scales = "free",ncol=3,nrow=2)+
  theme_bw()+
  theme(legend.position = "none",
        axis.text.x = element_text(angle=60,vjust=0.5))+
  labs(x="",y="")
 
如何進(jìn)行R語言探索約基奇數(shù)據(jù)的分析
Rplot01.png

從上圖我們可以看到約基奇的得分、籃板、助攻數(shù)據(jù)在18-19賽季達(dá)到最大值,19-20賽季略呈下降趨勢??赡艿脑蛴泻芏?,這里我猜可能是休賽季參加世界杯沒有得到充足的休息導(dǎo)致的。

 我們知道約基奇在場上的作用是組織核心,接下來看看在19-20賽季季后賽中約基奇的得分、助攻與比賽勝負(fù)的關(guān)系

數(shù)據(jù)來源是 https://www.basketball-reference.com/players/j/jokicni01/gamelog-playoffs/

df2<-read.csv("new2.txt",header=F,
              stringsAsFactors = F)
df2_1<-df2%>%
  select(V3,V9,V11,V13,V14,V24,V29)
colnames(df2_1)<-c("Game","w_or_l","MIN","FGA","FG%","AST","PTS")
head(df2_1)
df2_1$w_or_l<-stringr::str_sub(df2_1$w_or_l,1,1)
df2_1$MIN<-stringr::str_sub(df2_1$MIN,1,2)
df2_1$MIN<-as.numeric(df2_1$MIN)
head(df2_1)
df2_1<-melt(df2_1,ids=c("Game",'w_or_l'))
head(df2_1)
ggplot(df2_1,aes(x=Game,y=value,color=w_or_l))+
  geom_point(size=5)+
  geom_line(aes(group=1))+
  facet_grid(variable~.,scales = "free")+
  theme_bw()+
  theme(
        legend.title = element_blank(),
        axis.text.x = element_text(angle=60,vjust=0.5))+
  labs(x="",y="")
 
如何進(jìn)行R語言探索約基奇數(shù)據(jù)的分析
Rplot03.png

比賽的勝負(fù)是諸多因素共同作用的結(jié)果,單純從得分、及助攻等數(shù)據(jù)很難看出對比賽勝負(fù)的影響,除非你的隊中有一位叫做波普的運動員。

 最后看一看約基奇19-20賽季季后賽和常規(guī)賽的數(shù)據(jù)對比
list(Jokic)
df3<-Jokic[[7]]
df3
colnames(df3)[1]<-"Game"
colnames(df3)
df3_1<-df3[1:2,]%>%
  select(Game,MPG,PPG,RPG,APG,BPG,TPG,"FG%","3P%","FT%")
df3_2<-melt(df3_1)
df3_2
df3_2$Game<-stringr::str_replace(df3_2$Game,"2019-20 ","")
ggplot(df3_2,aes(x=Game,y=value,fill=Game))+
  geom_bar(stat="identity",width=0.5)+
  facet_wrap(~variable,scales = "free")+
  theme_minimal()+labs(x="",y="")+
  theme(legend.position = "top",
        legend.title = element_blank())
 
如何進(jìn)行R語言探索約基奇數(shù)據(jù)的分析
Rplot04.png

從上圖可以看到 場均上場時間(MPG),場均得分(PPG)、場均蓋帽(BPG)、三分命中率(3P%)季后賽的表現(xiàn)均高于常規(guī)賽。場均助攻數(shù)(APG)略少于常規(guī)賽,場均失誤(TPG)也略多于常規(guī)賽。

上述內(nèi)容就是如何進(jìn)行R語言探索約基奇數(shù)據(jù)的分析,你們學(xué)到知識或技能了嗎?如果還想學(xué)到更多技能或者豐富自己的知識儲備,歡迎關(guān)注億速云行業(yè)資訊頻道。

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI