溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點(diǎn)擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

Python如何繪制全球疫情變化地圖

發(fā)布時(shí)間:2020-08-01 14:40:08 來源:億速云 閱讀:224 作者:小豬 欄目:開發(fā)技術(shù)

這篇文章主要講解了Python如何繪制全球疫情變化地圖,內(nèi)容清晰明了,對此有興趣的小伙伴可以學(xué)習(xí)一下,相信大家閱讀完之后會有幫助。

目前全球疫情仍然比較嚴(yán)重,為了能清晰地看到疫情爆發(fā)以來至現(xiàn)在全球疫情的變化趨勢,我繪制了一張疫情變化地圖 廢話不多說,先上圖

Python如何繪制全球疫情變化地圖

下面就來重點(diǎn)介紹下上面這張圖的繪制過程,主要分為以下三個(gè)步驟:

  • 數(shù)據(jù)收集
  • 數(shù)據(jù)處理
  • 畫圖

下面一個(gè)一個(gè)來說。

數(shù)據(jù)收集

這是萬里長城的第一步,俗話說“巧婦難為無米之炊”,既然是變化圖,當(dāng)然需要每個(gè)國家、每天的現(xiàn)有確診病例數(shù)。好在現(xiàn)在各大網(wǎng)站都有疫情相關(guān)的專題頁,我們可以直接抓數(shù)據(jù)。以網(wǎng)易為例

Python如何繪制全球疫情變化地圖

我們選擇 XHR,重新刷新下網(wǎng)頁可以看到有幾個(gè)接口,其中 list-total 接口是獲取當(dāng)前所有有疫情的國家,以及對應(yīng)的國家id。另外,我們看到還有一個(gè) list-by-area-code 接口,它是獲取每個(gè)國家歷史上每天的疫情數(shù)據(jù),請求這個(gè)接口需要帶 areaCode 參數(shù),這個(gè)參數(shù)就是我們剛剛說的國家id。所以對我們來說這兩個(gè)接口是最重要的。下面我們就看看請求 list-total 接口的代碼

def get_and_save_all_countries():
 """
 獲取所有的國家名以及對應(yīng)的id,保存為文件
 """

 url = 'https://c.m.163.com/ug/api/wuhan/app/data/list-total?t=317452696323'
 list_total_req = requests.get(url, headers=headers)
 if list_total_req.status_code == 200:
 area_tree = list_total_req.json()['data']['areaTree']

 area_dict = {}
 for area in area_tree:
  country_id = area['id']
  name = area['name']
  area_dict[country_id] = name

 area_json = json.dumps(area_dict, ensure_ascii=False) # ensure_ascii=False 防止json編碼后中文編程\u開頭的字符
 write_file('./config/countries_id2name.json', area_json)

這里將請求下來的數(shù)據(jù)臨時(shí)存放在文件里。有了所有的疫情國家的id,我們就可以請求 list-by-area-code 接口來獲取每個(gè)國家的疫情數(shù)據(jù)了。代碼與上面的類似,不同的是將請求結(jié)果存在了 mongodb 而不是文件,目的是為了方便增刪改查。當(dāng)然為了大家方便使用,我將mongodb中的數(shù)據(jù)導(dǎo)入了文件 counties_daily.json 中,大家可以在源碼根目錄找到它。

數(shù)據(jù)處理

這一步的處理主要是為第三步畫圖做準(zhǔn)備的。因?yàn)槲覀儺媹D用的是pyecharts框架,它繪制世界地圖需要輸入的國家名是英文的,而我們收集的國家名是中文的,所以要將中文國家名對應(yīng)到英文國家名。最終的效果如下

Python如何繪制全球疫情變化地圖

網(wǎng)上能找到這樣的對應(yīng)關(guān)系,但想要用起來還需要解決兩個(gè)問題。第一,兩邊中文名統(tǒng)一,比如:我們收集的國家名是中非共和國,而對應(yīng)關(guān)系里是中非,那還是對應(yīng)不上。第二,需要自己增加映射關(guān)系,網(wǎng)上找的一般都不全,我們需要根據(jù)收集的數(shù)據(jù)自行增加。經(jīng)過上面兩個(gè)步驟處理后,我們就可以將大部分國家名對應(yīng)到pyechars能識別的英文名了。相關(guān)代碼如下

def get_cy_properties():
 # 獲取配置文件信息
 countries_id2name = read_file('./config/countries_id2name.json')
 cy_id2name_dict = json.loads(countries_id2name)
 cy_ch3en = {v: k for k, v in countries_dict.items()}

 # 調(diào)整國家的名字與配置文件一致
 cy_id2name_dict['879'] = '波斯尼亞和黑塞哥維那'
 cy_id2name_dict['8102'] = '多哥'
 cy_id2name_dict['8143'] = '剛果民主共和國'
 cy_id2name_dict['95983'] = '剛果'
 cy_id2name_dict['8144'] = '中非'
 cy_id2name_dict['95000011'] = '多米尼加'

 cy_props = {}
 for key in cy_id2name_dict:
 cy_name = cy_id2name_dict[key]
 if cy_name in cy_ch3en:
  cy_props[cy_name] = {}
  cy_props[cy_name]['id'] = key
  cy_props[cy_name]['en_name'] = cy_ch3en[cy_name]

 return cy_props

畫圖

這一步涉及到兩個(gè)核心過程——構(gòu)造數(shù)據(jù)結(jié)構(gòu)和畫圖。首先,我構(gòu)造了3個(gè)數(shù)據(jù)結(jié)構(gòu),分別是date_list、cy_name_list 和 ncov_data。date_list存放的是日期列表,因?yàn)槲覀儺媱訄D,所以需要一段時(shí)間;cy_name_list 存放收集的所有國家列表(英文名);ncov_data是一個(gè)字典,key是日期,value是數(shù)組,存放各個(gè)國家當(dāng)天的確診病例數(shù)。生成這三個(gè)數(shù)據(jù)結(jié)構(gòu)的代碼如下

def parse_ncov_data(start_date, end_date, records):
 if not records:
  return

 date_list = get_date_range(start_date, end_date)
 cy_name_list = []
 res = {}
 # 獲取各國每天現(xiàn)有確認(rèn)病例
 for i, record in enumerate(records):
  cy_name = record['cy_en_name']
  cy_name_list.append(cy_name)

  # 解析每天數(shù)據(jù)并計(jì)算現(xiàn)有確認(rèn)病例
  existing_case_dict = {}
  for ncov_daily in record['data']['list']:
   date_str = ncov_daily['date']
   confirm = ncov_daily['total']['confirm'] # 累計(jì)確診
   heal = ncov_daily['total']['heal'] # 累計(jì)確診
   dead = ncov_daily['total']['dead'] # 累計(jì)死亡

   existing_case = confirm - heal - dead
   existing_case_dict[date_str] = existing_case

  last_existing_case = 0
  # 將每天確診病例數(shù)合并到res中
  for date_str in date_list:
   if date_str not in res: # 初始化
    res[date_str] = []

   existing_case = existing_case_dict.get(date_str)
   if existing_case is None:
    existing_case = last_existing_case
   res[date_str].append(existing_case)

   last_existing_case = existing_case

 return date_list, cy_name_list, res

參數(shù) records 是一個(gè)數(shù)組,數(shù)組每個(gè)元素代表一個(gè)國家,內(nèi)容便是我們在第一步請求 list-by-area-code 接口的數(shù)據(jù)。最后,用 pyecharts 來畫圖,直接上代碼

def render_map(date_list, cy_name_list, ncov_data):
 tl = Timeline() # 創(chuàng)建時(shí)間線輪播多圖,可以讓圖形按照輸入的時(shí)間動起來
 # is_auto_play:自動播放
 # play_interval:播放時(shí)間間隔,單位:毫秒
 # is_loop_play:是否循環(huán)播放
 tl.add_schema(is_auto_play=True, play_interval=50, is_loop_play=False)

 for date_str in date_list: # 遍歷時(shí)間列表
  map0 = (
   Map() # 創(chuàng)建地圖圖表
   # 將國家名 cy_name_list 以及各國當(dāng)天確診病例 ncov_data[date_str] 加入地圖中
   .add("全球疫情趨勢", [list(z) for z in zip(cy_name_list, ncov_data[date_str])], 
    "world", is_map_symbol_show=False)
   .set_series_opts(label_opts=opts.LabelOpts(is_show=False)) # 不顯示國家名
   .set_global_opts(
    title_opts=opts.TitleOpts(title="%s日" % date_str), # 圖表標(biāo)題
    visualmap_opts=opts.VisualMapOpts(max_=80), # 當(dāng)確診病例大于80 ,地圖顏色是紅色
   )
  )
  tl.add(map0, "%s" % date_str) # 將當(dāng)天的地圖狀態(tài)加入時(shí)間線中

 tl.render() # 生成最終輪播多圖,會在當(dāng)前目錄創(chuàng)建 render.html 文件

代碼里加了注釋,這里就不再贅述了。
運(yùn)行 render_map 函數(shù)會在當(dāng)前目錄生成 render.html 文件,打開后便自動播放疫情變化趨勢,如文章開頭 gif。另外,有些朋友可能會問,能不能直接輸出 gif。這一點(diǎn)我也嘗試過,百度、谷歌、GitHub上的教程基本上都試了一遍,比較遺憾沒有找到靠譜的方法。所以勸大家還是放棄這條路,曲線救國,錄制一個(gè)視頻轉(zhuǎn)成 gif 即可,方便快捷。畢竟人生苦短,Python 為我們節(jié)省下的時(shí)間不能再被這些無謂的坑再填回去。這樣整個(gè)過程就介紹完了,雖然思路不復(fù)雜,但局部細(xì)節(jié)上還是需要花一些時(shí)間處理的。

最近國內(nèi)某些地方出現(xiàn)了反彈的跡象,希望大家無論是在工作還是生活上都能繼續(xù)保持警惕。希望這次疫情早點(diǎn)過去,等待全球地圖變白的那一天。

看完上述內(nèi)容,是不是對Python如何繪制全球疫情變化地圖有進(jìn)一步的了解,如果還想學(xué)習(xí)更多內(nèi)容,歡迎關(guān)注億速云行業(yè)資訊頻道。

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI