溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

數(shù)據(jù)分析環(huán)境準備

發(fā)布時間:2020-07-02 01:03:25 來源:網(wǎng)絡(luò) 閱讀:206 作者:Tobey_51 欄目:大數(shù)據(jù)

Python版本

Python 2 or Python 3

  • Python 2.x 是早期版本,Python 3.x是當前版本
  • Python 2.7 (2.x的最終版)于2010年發(fā)布后很少有大的更新
  • Python 2.x 比 Python3.x 擁有更多的工具庫
  • 大多數(shù)Linux系統(tǒng)默認安裝的仍是 Python 2.x
  • 版本選擇取決于要解決的問題

建議選擇 Python 2.x 的情況:

  • 部署環(huán)境不可控,Python版本不能自行選擇
  • 某些工具庫還沒有提供支持 Python 3.x。
  • 如果選擇使用 Python 3.x,需要確定要用的工具庫支持新版本。

    注意:本課程將會使用Python 3.x 版本

Python環(huán)境及IDE

Python環(huán)境

Anaconda(水蟒) :是一個科學(xué)計算軟件發(fā)行版,集成了大量常用擴展包的環(huán)境,包含了 conda、Python 等 180 多個科學(xué)計算包及其依賴項,并且支持所有操作系統(tǒng)平臺。下載地址:https://www.continuum.io/downloads

安裝包: pip install xxx,conda install xxx

卸載包:pip uninstall xxx,conda uninstall xxx

升級包:pip install upgrade xxx,conda update xxx

IDE

Jupyter Notebook:

命令:jupyter notebook

    1. Anaconda自帶,無需單獨安裝
    1. 實時查看運行過程
    1. 基本的web編輯器(本地)
    1. .ipynb 文件分享
    1. 可交互式
    1. 記錄歷史運行結(jié)果

IPython:

命令:ipython

    1. Anaconda自帶,無需單獨安裝
    1. Python的交互式命令行 Shell
    1. 可交互式
    1. 記錄歷史運行結(jié)果
    1. 及時驗證想法

Spyder:

命令:spyder

    1. Anaconda自帶,無需單獨安裝
    1. 完全免費,適合熟悉Matlab的用戶
    1. 功能強大,使用簡單的圖形界面開發(fā)環(huán)境

PyCharm:

    1. 需要自行安裝:https://www.jetbrains.com/pycharm/download
    1. PyCharm,JetBrains的精品,全平臺支持,不多解釋了。

Python3.x 常用的新特性

  • print() 是函數(shù),不是一個語句
  • raw_input()輸入函數(shù),改為 input()
  • Python 3 對文本和二進制數(shù)據(jù)做了更為清晰的區(qū)分。
    1. 文本由unicode表示,為str類型
    2. 二進制數(shù)據(jù)由bytes (字節(jié)包)表示,為bytes類型
  • 新增數(shù)據(jù)類型 bytes (字節(jié)包),代表二進制數(shù)據(jù)以及被編碼的文本字符串前有個前綴b
  • Python3中 bytes 與 str 轉(zhuǎn)換
    1. str 可以編碼(encode)成 bytes
      2.bytes 可以解碼(decode)成 str
  • 字符串格式化輸出方式:新增format()方式
  • dict類型變化

之前的 iterkeys(), itervalues(), iteritems(),改為現(xiàn)在的 keys(), values(), items()

字符串編碼格式回顧:

  • ASCII:早期計算機保存英文字符的編碼方式
  • GB2312:對ASCII的中文擴展
  • GBK/GB18030:包括了GB2312的所有內(nèi)容,同時又增加了近20000個新的漢字和符號
  • Unicode:包括了全球的符號和編碼。每個字符用3~4個字節(jié)表示,浪費空間
  • UTF-8:可變長的編碼方式,在互聯(lián)網(wǎng)上使用最廣泛的一種Unicode的實現(xiàn)方式,根據(jù)語種決定字符長度,如一個漢字3個字節(jié),一個字母1個字節(jié),也是Linux環(huán)境下默認編碼格式。
向AI問一下細節(jié)

免責聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI