您好,登錄后才能下訂單哦!
這篇文章給大家分享的是有關(guān)CDSW1.6的新功能是什么的內(nèi)容。小編覺得挺實(shí)用的,因此分享給大家做個參考,一起跟隨小編過來看看吧。
1.Bring Your Own Editor
你現(xiàn)在可以利用CDSW的所有好處,同時使用你熟悉的編輯器。這個功能支持在你本地電腦上運(yùn)行第三方的IDE比如PyCharm,或者基于瀏覽器的IDE像Juypter。Base Image v8預(yù)打包了Juypter,你可以在Start Session菜單中選擇它。
2.Multiple Cloudera Data Science Workbench Deployments
你現(xiàn)在可以通過一個Cloudera Manager部署多個CDSW。
3.Audits
CDSW會記錄特定的事件,比如用戶登錄和分享,你可以通過查詢數(shù)據(jù)庫而查看這些事件。
4.Expanded Support for Distributed Machine Learning
CDSW1.6(或更高)允許你使用TensorFlowOnSpark, H2O, XGBoost等這種框架,運(yùn)行分布式工作負(fù)載。這跟你在HDP/CDH集群中已經(jīng)實(shí)現(xiàn)的Spark工作負(fù)載是一樣的。
5.cdswctl CLI Client
cdwctl客戶端提供一種額外的方法來與CDSW進(jìn)行交互,以執(zhí)行某些操作。例如,你可以使用cdswctl客戶端在你本地電腦上啟動一個SSH端點(diǎn),然后將一個本地的IDE,比如PyCharm連接到CDSW。
你可以在CDSW的Web UI上下載cdswctl,然后在你的本地電腦中使用它。注意這個客戶端不像cdsw命令行工具比如cdsw status。
6.Status and Validate Commands
Cloudera Manager中的CDSW服務(wù)現(xiàn)在包含兩個新命令,可以用來顯示CDSW的部署狀態(tài):Status和Validate。在Cloudera Manager中看到的CDSW服務(wù)狀態(tài),與你在命令行執(zhí)行cdsw status和cdsw validate命令等價。
7.Experiments
如果你的集群配備了GPU,現(xiàn)在你可以在experiment中使用GPU對模型進(jìn)行訓(xùn)練。
跟蹤實(shí)驗(yàn)文件現(xiàn)在會刷新并自動出現(xiàn)在Overview頁面,用于運(yùn)行一個實(shí)驗(yàn)。以前,當(dāng)一個實(shí)驗(yàn)結(jié)束后,你需要手動刷新頁面。
8.Command Line Interface (CLI) Changes - RPM Deployments only
刪掉了cdsw reset命令,取而代之的是cdsw stop。
刪掉了cdsw init命令,取而代之的是cdsw start。
9.Kubernetes and Weave
Kubernetes升級到1.11.7版本,Weave Net升級到2.5.1版本。
10.Logs
Staging Directory
你現(xiàn)在可以配置一個臨時目錄,用于保存當(dāng)CDSW搜集診斷包時的階段日志。當(dāng)收集一個新的診斷包時,或者當(dāng)日志大小大于10 MB時,將刪除目錄中的舊日志。
Logs tab
運(yùn)行的的會話現(xiàn)在會顯示一個Logs選項(xiàng)卡,這個選項(xiàng)卡會顯示engine的日志,如果存在也會顯示Spark的日志。之前,如果你想訪問這些日志,你需要登錄到CDSW主機(jī)和Spark服務(wù)器上才查看這兩部分日志。
11.Operating System
CDSW1.6支持RHEL和CentOS7.6
12.Workload Scheduling Changes
從1.6版本開始,CDSW允許你指定一個被標(biāo)記為Auxiliary Nodes的CDSW gateway主機(jī)列表。這些主機(jī)將在工作負(fù)載調(diào)度期間被剝奪。也就是說,他們將被選中來運(yùn)行不能在任何其他主機(jī)上調(diào)度的工作負(fù)載。例如,使用非常大的資源請求的會話,或者當(dāng)其他主機(jī)被充分利用時。
Reserve Master Host
CDSW1.4.3引入了一個新的特性,允許在CDSW Master主機(jī)上只運(yùn)行內(nèi)部的應(yīng)用程序,即不會作為Worker節(jié)點(diǎn)。從1.6版本開始,如果是基于CSD的部署,在CM中可以直接配置Reserve Master Host屬性,而不需要在Safety valves中進(jìn)行配置。
13.Security
FreeIPA Support
除了MIT Kerberos和Active Directory,CDSW現(xiàn)在也支持FreeIPA作為身份管理系統(tǒng)。
New User Role - Operator
1.6版本包括一個新的訪問角色稱為Operator。當(dāng)一個用戶被分配為一個項(xiàng)目的Operator角色,他就可以啟動和停止已有的作業(yè),并且可以訪問項(xiàng)目代碼,數(shù)據(jù)和結(jié)果,但只有查看權(quán)限。
Restricting User-Controlled Kubernetes Pods
CDSW1.6包括三個新屬性,允許你控制授予用戶控制(user-controlled)的Kubernetes pod的權(quán)限。一個用戶控制的pod的例子是引擎pod,它為會話、作業(yè)等提供了環(huán)境。這些pod在每個用戶的Kubernetes名稱空間中啟動。由于這些用戶有能力啟動任意的pod,這些設(shè)置主要是為了限制這些pod可以做什么。
LDAP/SAML Configuration Changes
之前,如果你想將site administrator角色授予給LDAP/SAML組的用戶,則該組必須在2個屬性下被列出:LDAP/SAML Full Administrator Groups和LDAP/SAML User Groups。如果一個組只是在LDAP/SAML Full Administrator Groups下被列出,而在LDAP/SAML User Groups下則沒有,這個組的用戶將不能登錄到CDSW。
在1.6版本中,你不需要在這2個屬性下列出admin組,在LDAP/SAML Full Administrator Groups中列出的用戶能夠登錄CDSW,并且擁有site administrator權(quán)限,并按預(yù)期訪問CDSW。
Project and Team Creation
Site administrators可以在Settings頁面上限制用戶創(chuàng)建項(xiàng)目或team,通過以下2個屬性:
Allow users to create projects
Allow users to create teams
Session Tokens
CDSW Web UI會話令牌的存儲方法已得到加強(qiáng)。升級到版本1.6.0后,用戶必須注銷Cloudera Data Science Workbench Web UI,然后重新登錄。
Sharing
Site administrator現(xiàn)在可以控制是否共享控制臺,通過設(shè)置Admin > Security頁面的Allow console output sharing屬性。禁用此屬性可從項(xiàng)目工作區(qū)和workbench UI中刪除Share按鈕,并禁用對整個部署中所有共享控制臺輸出的訪問。請注意,重新啟用此屬性不會自動將訪問權(quán)限授予以前共享的控制臺。您將需要再次手動共享每個控制臺。
TLS/SSL
CDSW現(xiàn)在默認(rèn)使用TLS1.2。默認(rèn)的cipher suites也升級到了Mozilla的Modern cipher suites。
14.Spark UI
現(xiàn)在,在使用Spark的運(yùn)行會話中,Spark UI是其中一個選項(xiàng)卡,你可以直接點(diǎn)擊查看Spark UI。
1.1 引擎升級
CDSW1.6開始打包的基礎(chǔ)engine鏡像包括的R和Python的版本為(version 8):
R - 3.5.1
Python - 2.7.11, 3.6.1
Engine 8中預(yù)安裝的軟件包 - 參考:
https://docs.cloudera.com/documentation/data-science-workbench/1-6-x/topics/cdsw_engines_packaging.html#engine_8
(僅用于升級)將現(xiàn)有項(xiàng)目升級到最新的Base Engine Images
Base Image v8修復(fù)了很多bug,確保對現(xiàn)有項(xiàng)目進(jìn)行測試并升級到Base Image v8 (Project Settings > Engine),這樣做有以下兩個原因:
Container Security
安全最佳實(shí)踐表明引擎容器不應(yīng)以root用戶身份運(yùn)行。引擎(v7和更低版本)短暫地以root用戶身份初始化,然后以cdsw用戶身份運(yùn)行?,F(xiàn)在,引擎v8(及更高版本)遵循最佳做法,并且僅以cdsw用戶身份運(yùn)行。
CDH 6 Compatibility
你使用的base engine image必須與正在運(yùn)行的CDH版本兼容。如果你在Spark上運(yùn)行工作負(fù)載,這尤其重要。較舊的base engine(v6和更低版本)不能支持最新版本的CDH6。如果要在CDH 6上運(yùn)行Spark工作負(fù)載,則必須將項(xiàng)目升級到base engine v7(或更高版本)。
CDSW1.6不再支持SLES12 SP2,SP3
因?yàn)镾LES12 SP2和SP3,SUSE也將停止支持,所有CDSW1.6或以后的版本將不再支持SLES12 SP2和SP3。
GPU設(shè)置更改
不再支持nvidia-docker1
NVIDIA Library Path屬性不再可用。
CDSW1.6默認(rèn)打包安裝nvidia-docker2,啟用GPU后,也會自動設(shè)置NVIDIA庫卷的路徑。
CDSW_PUBLIC_PORT環(huán)境變量已被棄用,并將在以后的版本中刪除。改用CDSW_APP_PORT或CDSW_READONLY_PORT環(huán)境變量
1.修復(fù)了如果列太多,則必須包含pd.options.display.html.table_schema = True才能顯示Pandas Dataframe的水平滾動條的問題?,F(xiàn)在你不需要額外設(shè)置該屬性。
Cloudera Issue: DSE-3562
2.修復(fù)了內(nèi)置Workbench編輯器無法正確識別使用制表符(tab)而不是空格的導(dǎo)入代碼的問題。這也解決了在使用制表符(tab)導(dǎo)入代碼時在編輯器中發(fā)生的導(dǎo)航問題。
Cloudera Issue: DSE-2976, DSE-3221
3.修復(fù)了如果附件超過4 MB,帶有由作業(yè)觸發(fā)的包含附件的Email無法發(fā)送的問題。
Cloudera Issue: DSE-5980, DSE-6003
4.修復(fù)了在內(nèi)置Workbench編輯器中運(yùn)行大型R腳本時hang住的問題。
Cloudera Issue: DSE-2817
5.修復(fù)了Markdown中未呈現(xiàn).md文件的問題。 以前,只有README.md可以正確呈現(xiàn)。
Cloudera Issue: DSE-3315
6.修復(fù)了Python模板項(xiàng)目中的模型訓(xùn)練腳本predict.py的問題。
Cloudera Issue: DSE-5314
7.修復(fù)了當(dāng)生成CDSW診斷包時占用/var/log/cdsw目錄太多空間的問題,現(xiàn)在生成的診斷包大小已減小,現(xiàn)在你也可以配置診斷包生成后的臨時保存目錄。
Cloudera Issue: DSE-5921
8.在模型和實(shí)驗(yàn)中運(yùn)行的cdsw-build.sh腳本,是以cdsw用戶執(zhí)行的。
Cloudera Issue: DSE-4340
9.解決了當(dāng)機(jī)器重啟后,CDSW無法自動檢測GPU的問題。
Cloudera Issue: DSE-2847
10.修復(fù)了由于版本1.4.x中添加的新HTTP安全header而無法在工作臺中呈現(xiàn)iFrame可視化效果的問題。
Cloudera Issue: DSE-5274
感謝各位的閱讀!關(guān)于“CDSW1.6的新功能是什么”這篇文章就分享到這里了,希望以上內(nèi)容可以對大家有一定的幫助,讓大家可以學(xué)到更多知識,如果覺得文章不錯,可以把它分享出去讓更多的人看到吧!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。