您好,登錄后才能下訂單哦!
架構(gòu)師小組交流會:每期選擇一個時下最熱門的技術(shù)話題進行實踐經(jīng)驗分享。
邀請到了 Polarr 聯(lián)合創(chuàng)始人宮恩浩、搜狗大數(shù)據(jù)總監(jiān)高君、七牛云 AI 實驗室負(fù)責(zé)人彭垚,對深度學(xué)習(xí)框架選型、未來趨勢展開了交流。
自由交流
Polarr 宮恩浩
我是宮恩浩,現(xiàn)在在斯坦福在讀,主要做深度學(xué)習(xí)研究,特別是醫(yī)學(xué)影像相關(guān)的研究。同時也在一家創(chuàng)業(yè)公司,國內(nèi)叫潑辣修圖,在美國是 Polarr,做圖片的大數(shù)據(jù),有云端的,也有手機端的,PC 端的。我們的 App 收集數(shù)據(jù),建立優(yōu)化的算法,我們在云端提供圖片整理、圖片選擇、圖片信息的識別,把識別的模型通過壓縮手段,把整個深度學(xué)習(xí)放在手機的 App,實現(xiàn)圖片裁定、識別、選擇、渲染,國內(nèi)可能叫霹靂相冊吧。我主要負(fù)責(zé)所有的 AI 的部分。
搜狗高君
我是高君, 目前在搜狗負(fù)責(zé)精準(zhǔn)廣告的算法研究和大數(shù)據(jù)相關(guān)的技術(shù)研發(fā)工作。搜狗從用戶端的產(chǎn)品來講,有兩個產(chǎn)品與深度學(xué)習(xí)有較強關(guān)系,一個是語音識別,應(yīng)用在輸入法,用于語音輸入轉(zhuǎn)文本,另一個是圖像搜索。在我的團隊中,深度學(xué)習(xí)主要是用在廣告領(lǐng)域中,如 CTR 預(yù)估、廣告檢索,廣告相關(guān)性的評估上。未來,我們希望在 NLU 上面做一些有價值的工作,也希望在網(wǎng)絡(luò)壓縮方向取得一些成績。
七牛彭垚
我是七牛云 AI 實驗室的負(fù)責(zé)人彭垚,七牛是一個以云存儲起家的公司,在我們云平臺上面有廣泛的圖像、視頻、音頻的數(shù)據(jù),富媒體客戶非常多,所以我們 AI 實驗室的主要職責(zé)是對大量的富媒體數(shù)據(jù)去做分析,并做一些內(nèi)容審核,識別等相關(guān)領(lǐng)域的應(yīng)用,以服務(wù)我們平臺上面的客戶。
話題交流
Q
關(guān)于網(wǎng)絡(luò)壓縮方面的分享一下?
Polarr 宮恩浩:網(wǎng)絡(luò)壓縮有幾部分。
一部分首先找一個最適合的架構(gòu),這部分我個人覺得還得根據(jù)具體的應(yīng)用、性能要求來定。
第二個部分是網(wǎng)絡(luò)壓縮,在不改變模型效果前提下盡量減少模型參數(shù)。我一個同學(xué)在做這方面工作叫 Deep Compression,然后我也和這個同學(xué)一起參與一些新的深度學(xué)習(xí)算法研究,基于在 Deep Compression 來進一步優(yōu)化模型。最近一些研究發(fā)現(xiàn)一個深度模型可以壓縮甚至壓縮到幾十倍幾百倍,那說明整個有很大的冗余性,基于這個我們能不能選擇一些適當(dāng)?shù)哪P?nbsp;trade off,在保持模型體積基礎(chǔ)上性能比原來顯著提升,比如它本身網(wǎng)絡(luò)是 Dense Network,壓縮到 Sparse Network,然后再長成 Dense Network 可以一步步進行優(yōu)化。可以想像這個 Network 一會胖,一會瘦,最終達到一個體積和性能更好的狀態(tài),我個人主要在做的是這個方法的統(tǒng)計分析。
第三個部分是模型編碼。我們公司有在做想把圖像識別的 Network 放在手機上,那么首先基于模型壓縮。具體實現(xiàn)的方法是:每步迭代的時候,一部分把小的部分變成零,然后不斷迭代優(yōu)化,最終模型還有一些優(yōu)化,會小很多。然后同時還可以在手機上 Network 優(yōu)化編碼,我實驗的時候權(quán)重也可以從原來的 32 位 float,變成 16 位,就是少了一半,或者是變成 8 位的話做了 encoding 就會小很多,基于這些(優(yōu)化模型結(jié)構(gòu),閾值讓模型稀疏,編碼來減少存儲)就可以不斷進行壓縮。但是主要還是看需求,比如在云端的話可能就不一定非要壓特別深,但我們遷往移動端就需要壓得比較大,要不可能 App 就太大,同時你壓縮完了,還得做解壓的工作,需要花費一定的時間。
搜狗高君:今年看到有 paper 在說 teach student 這種網(wǎng)絡(luò),然后我有這么一個假設(shè),因為廣告領(lǐng)域涉及到的特征空間非常大,用 teach student 的這種思路,能否把一個千萬量級以上的網(wǎng)絡(luò),想辦法讓它降到百萬量級,同時讓它的 performance 還是能維持在不錯的性能。
Polarr 宮恩浩:我說一下,首先我覺得并不是模型越小它就越快,這可能跟架構(gòu)有關(guān)。我覺得可以拿一些簡單的例子試一下。可以先看一下別人已經(jīng)被驗證過更小更快的模型。看一下基于那個做會不會合理,是否能達到你的需求。然后不行的話,犧牲一些精度,還得看你的具體精度各方面性能大概多少可以用。
Q
宮博士你們現(xiàn)在是做模型壓縮,主要是應(yīng)用在手機上吧。那壓縮了以后,在一定的精準(zhǔn)度情況下,你的運算能耗能下降嗎?
Polarr 宮恩浩:運算能耗的話,如果你直接用它的 Framework 的話,其實是一樣的。但是你可以再 hack 一些東西他就能提高。比如可以用低精度的乘法。
我覺得 iOS 的 Metal 很好。比如 AlexNet 大概能手機上,能 30 到 42 fps,然后 inception 模型,大概是 10 fps。同時他們出一些剛剛優(yōu)化,所以我覺得未來移動端的深度學(xué)習(xí),會有很多的公司用移動端解決問題,很有前景。
Q
你們是用的是哪個 framework?
Polarr 宮恩浩:其實用挺多的,iOS 上肯定用它的 Metal Framework。然后其他的就是后端,很多都會去用,Caffe,Tensorflow 都有過一些接觸。
Q
搜狗的廣告推薦是以推薦結(jié)構(gòu)化數(shù)據(jù)為主,還是以推薦非結(jié)構(gòu)化數(shù)據(jù)為主?
搜狗高君:兩種都有,有搜索類的廣告問題,還有展示類的廣告問題,對于搜索廣告來講,它是有一個明確的查詢詞,你可以理解為是一個結(jié)構(gòu)化。假設(shè)把文本理解為結(jié)構(gòu)化,那么對于展示類的廣告就很復(fù)雜了,為了提高線上的 CTR,你需要明確用戶的興趣,那么處理用戶興趣的過程中,它的數(shù)據(jù)差異非常大,你肯定會用到搜索,但是你也會用到它站內(nèi)的一些瀏覽的行為,比方說我們拿到客戶站內(nèi)所有的數(shù)據(jù),它整個數(shù)據(jù)的來源很復(fù)雜。所以對于展示類廣告來講,可以認(rèn)為所有的處理的數(shù)據(jù)基本都是異構(gòu)的,可以理解為是個非結(jié)構(gòu)化的問題。
Q
廣告領(lǐng)域,深度學(xué)習(xí)的應(yīng)用是什么樣的呢?
搜狗高君:其實這個領(lǐng)域里邊的工作跟圖像差異蠻大的,很大的原因在于學(xué)術(shù)界是不關(guān)注廣告的。其中還一個很重要的原因是廣告數(shù)據(jù)也沒有那么多,那么很難看到有一些 paper,會專門關(guān)注于廣告領(lǐng)域里邊的深度學(xué)習(xí)的應(yīng)用,所以業(yè)內(nèi)的做法都在摸著石頭過河。我這邊的情況來講,深度學(xué)習(xí),至少在排序問題,會比我們現(xiàn)有的策略基礎(chǔ)至少高 10 個點。深度學(xué)習(xí),在廣告領(lǐng)域,百度用的相對早一點。現(xiàn)在阿里發(fā)展很快,在商品推薦領(lǐng)域有不少應(yīng)用。所以從應(yīng)用的角度來講,我感覺是有收益,但是投入跟收益目前不成正比。
在廣告領(lǐng)域里邊,我們看到的就是 GPU 機器在加速比沒有呈現(xiàn)過優(yōu)勢,可能是由于我們在廣告領(lǐng)域,不像圖像領(lǐng)域會有大量的 CNN。在廣告領(lǐng)域,我小范圍的比過一些加速比的問題,GPU 的機器沒有優(yōu)勢,所以我一直心里邊有一個問題,到底為什么在圖像和語音,大家都會考慮用 GPU 的機器,難道是由于卷積網(wǎng)絡(luò)的原因嗎?就完全不考慮 CPU 的任何的問題。
主持人:最核心的是里面的這些函數(shù),這些解方程,大量的矩陣計算,所以說矩陣計算 CPU 肯定是沒有優(yōu)勢的,GPU 因為可以同時多個核算一個數(shù)據(jù),所以它的優(yōu)勢很明顯。所以在圖像語音,包括 NLP 處理,GPU 優(yōu)勢是很明顯的,基本上 CPU 的計算貢獻非常小,然后像廣告很多不是矩陣計算,所以導(dǎo)致加速比不高是很正常的事情,可能還沒有 CPU 運算的快。
七牛彭垚:其實我這邊也有用過 CPU 跑過一些測試的。之前在有客戶也用過我們的鑒黃系統(tǒng),一開始他們說采購不了 GPU 機器,我就用 CPU 給他們測了一輪,他那個效率就很低,大概單個 GPU 和 CPU 比的話,就 20 倍了。
搜狗高君:我還有一個小問題,不知道大家在多機并行做深度學(xué)習(xí)會處理到多大的集群問題。至少我們在做一些多機并行的時候,是從 Tensor 遷到了 MXNet 上,然后我們發(fā)現(xiàn) Tensor 的效率似乎有點問題,我不知道業(yè)內(nèi)在多機多卡這件事上,有沒有更好的,能有效地提升加速的問題。宮博士,在美國那邊,在并行問題上,你了解到有沒有一些新的進展?
Polarr 宮恩浩:我之前有看到一個基于 Spark 的在 CPU 集群上的深度學(xué)習(xí) caffe franework 變種,但后來沒太關(guān)注,我覺得有可能是可行的,Spark 在數(shù)據(jù)處理上用的比較多一點。但是我個人暫時沒有涉及到多機多卡。但我覺得既然 Amazon 那么推 mxnet,他們肯定會推出來更好的多機多卡的東西。
七牛彭垚:之前有去調(diào)研過多機多卡,包括 Tensorflow、Caffe。Tensorflow 它本身并沒有提供好的 paramter server 設(shè)計??蚣芴峁┠愀鶕?jù)應(yīng)用情況更好的去設(shè)計參數(shù)服務(wù)器。倒是覺得 Caffe poseidon 提供了一好 Paramter server 的設(shè)計,包括它矩陣同步的時候,怎么去傳輸,把矩陣就是做變換變小,能夠更高效的去做同步。
有沒有覺得用 Tensorflow 訓(xùn)練的時候,比 MXNet 和 Caffe 慢很多,有沒有碰到過這樣的問題?
搜狗高君:遇到過,而且在多機上面差距非常大,所以我們還把傳統(tǒng)里邊一部分,涉及到多級并行策略的做了一小部分修改,改的地方不多,但是在 CPU 的基礎(chǔ)上,我們當(dāng)時看了一下,效果還不錯。
七牛彭垚:有沒有人用過 Torch,因為我聽一些朋友說 Torch 在跑同樣的數(shù)據(jù)集和網(wǎng)絡(luò)情況下,和 Caffe 比,收斂率和準(zhǔn)確率都要好一點,可能是他在底層算法上有一些 tricky 的地方。
Polarr 宮恩浩:我之前做 DSD 研究,就用了 Torch,是基于 resnet 的 Torch。對 Torch 的感覺,首先是太麻煩了,因為用的人太少了,有什么問題也不太好問。但是他有一些好處,比如說我想改一些 regularization 和迭代過程中修改 weights,在 Torch上改,它就相對方便很多,因為它很多底層的操作更 expose 一些,比在 Caffe 改更方便一些。比如我們想每一步做一個調(diào)整,和獲得最新的調(diào)整,我們就可以通過 Torch。相對來說和 Python 類似,是比較好實現(xiàn)的,這是一個感受。
Q
大家怎么看深度學(xué)習(xí)在應(yīng)用領(lǐng)域的發(fā)展?
七牛彭垚:內(nèi)容的審核,就比方說鑒黃,就是鑒別×××視頻這種,大量簡化了鑒黃師的工作。有一些內(nèi)容標(biāo)簽,特別是對社交網(wǎng)站,我們會給社交網(wǎng)站,直播,短視頻,打一些標(biāo)簽,幫助客戶理解圖像視頻的內(nèi)容。
搜狗高君:我問個小問題,您剛才有提到有為社交網(wǎng)站去做一些工作,是做一些視頻理解的方向的一些東西嗎?
七牛彭垚:舉個例子,根據(jù)客戶的需求,我們做了一個人臉檢測,審核上傳的照片到底有沒有頭像。如果他上傳的照片里一個頭像都沒有,那這個用戶其實是一個 bad user。在比如,我們把某個社交網(wǎng)站的圖片收集起來,實際上這些圖片是雜亂無章的,那么我們做一個應(yīng)用,幫所有的圖片打上標(biāo)簽,還包括做了人臉的聚類、場景的識別,社交客戶就可以根據(jù)我們的標(biāo)簽應(yīng)用做相冊歸類,這樣就可以做一些數(shù)據(jù)分析,分析網(wǎng)站上每個用戶的自拍的數(shù)量等。就是從圖像方面做一些人群分析。
搜狗高君:我今年聽過的一個比較有意思的深度學(xué)習(xí)應(yīng)用,就是應(yīng)用在視頻推薦,傳統(tǒng)的視頻推薦使用文本去處理的??焓掷锸呛苌傥淖中畔⒌模耆怯脩羯蟼饕曨l,所以他們今年用了深度學(xué)習(xí),去理解視頻的內(nèi)容,然后再做推薦,也做的蠻有意思的。
七牛彭垚:我覺得這塊就相當(dāng)于是幫客戶的一些非結(jié)構(gòu)化的一些數(shù)據(jù),打上標(biāo)簽。然后打上標(biāo)簽以后,其實能做的事情就非常多,就可以做分類、搜索、推薦,能做的事情就很多,我甚至可以對每一個切片,比方說每 10 秒鐘的一個視頻的切片打標(biāo),然后你就能做很多事情了。比方說新聞片的剪輯,就是對新聞片的每個地方,它會去打一些標(biāo)簽。比方說我這一段新聞,我有我的主持人出現(xiàn),然后他會去檢測下面的主題的那個文字,把文字在 OCR 出來,他就會把那些新聞一段一段的打上標(biāo)簽,這樣能夠方便做剪輯、后期處理等。
搜狗高君:七牛的 AI 是主要是做 to B 服務(wù),就是幫助一些企業(yè)去解決他們內(nèi)部的需求,用機器學(xué)習(xí)處理問題嗎?
七牛彭垚:我們最開始是做鑒黃的內(nèi)容審核系統(tǒng),后面才去做各種標(biāo)簽系統(tǒng),和定制化識別應(yīng)用等。
搜狗高君:七牛 AI 的這種模式下邊,你們會把這種商業(yè)模式,當(dāng)做一個長期的商業(yè)模式去運作嗎,因為我在北京接觸過一些公司,甚至是大公司,比如說招行這個量級的公司,我目前還沒有看到很強的付費能力,他們內(nèi)部很難提出這種需要用機器學(xué)習(xí)的方法去解決問題,他們也很難形成一個估值,就是估價。我一直對這件事挺好奇,這種模式真的是可以做出一個真正的盈利的模式嗎?
七牛彭垚:要看客戶的群體的,像鑒黃是幫客戶節(jié)省了很多成本,原來他們需要很多基礎(chǔ)的人力,人力成本非常高的,所以它其實是很樂意做這個事情,而且鑒黃師這個事情特別難做,他都要熟練工,然后那種人他又干個半年一年他就不干了,其實用工成本就很高。還有其他應(yīng)用,我們都致力于大量節(jié)省人力成本的應(yīng)用。
Q
七牛是否有一些 AI 方面的戰(zhàn)略?
七牛彭垚:我們后期主要會在視頻方向做一些文章,包括像視頻分析之類的,包括一些視頻通用檢測的一些事情,我們會致力于解決我們平臺上客戶的實際問題來投入這方面的研究,主要是視頻分析領(lǐng)域,因為我們存儲上面視頻非常多,視頻的細(xì)粒度檢測也是其中的一個重點方向。
Q
大家對深度學(xué)習(xí)有何展望?
搜狗高君:我問一個小的開放性的問題,由于深度學(xué)習(xí)出來以后,亞馬遜做了 echo 的那件事情。會不會在五年以后,真的會出現(xiàn)一個像鋼鐵俠里的家庭秘書一樣,就像原來蘋果手機把手機全搞了一遍,會不會五年以后也出現(xiàn)這樣一件事情?大家是怎么看這件事兒。
亞馬遜的 echo 現(xiàn)在提供了非常充分的 API,將家庭的一些設(shè)備等等,或者說你一些App 上的功能做對接。那么我自己就是在想,如果未來真是有這樣一種趨勢的話,那很有可能就會變成家庭必備的設(shè)備了。那如果這種場景下,它可以衍生出很多服務(wù),比如說它可以對接攝像頭,它本身也有語音,它可以變成無所不能的事。就是我們現(xiàn)在可能做的所有的這個事,都能被它給干掉。因為它能完全改變生活,所以我一直在想這件事會不會發(fā)生。
主持人:我覺得這個事情,如果只是一個智能家居,我覺得應(yīng)該可以。如果你是特別極客,在家里放一些燈,或者機器人在家里,我覺得沒有問題。但是很多人可能對隱私保護比較在意,他不一定會樂意放機器人在家里面。這個問題,我覺得小范圍推應(yīng)該沒有問題,大范圍我覺得還是會有問題。
Polarr 宮恩浩:我覺得 echo 最近比較火,但是我覺得以后每個人手機都可以有這種服務(wù)吧,其實就是更直接一些,而現(xiàn)在好像有很多 startup 搞個人助理,他們主打的想法是變成 AI 的助理,比如說幫我叫個車,就不用麻煩再自己打車了,手機助理可以和互聯(lián)網(wǎng)服務(wù)通過 AI 連接。我覺得這都是不久將來可以實現(xiàn)。
搜狗高君:在美國那邊做這個方向創(chuàng)業(yè)的公司多嗎?
Polarr 宮恩浩:最近就看見過一些,包括國內(nèi),我之前有同學(xué)回國做個人助理,最終肯定是想做,就是語音識別的,就是人工智能,現(xiàn)在可能就一開始都是人手人工實現(xiàn)服務(wù),我覺得還是一個剛開始的方向吧,都想往 AI 上做。
搜狗高君:記得國內(nèi)也有類似的團隊,跟亞馬遜 echo 很像。甚至有做車載的后視鏡的,好像也在往這個方向打。
我是平常用微軟的小冰,有時候會用它來調(diào)一些程序,做一點小東西。
主持人:個人習(xí)慣吧,從普通大眾來說,有多少人會用這些東西,我覺得可能用的也不多。
Polarr 宮恩浩:我覺得主要是有幾點問題,這就是識別準(zhǔn)確率,另外是說他就和其他的,比如在微信里給發(fā)啥,他無法實現(xiàn)這個功能,比如說著目前是很計費一個東西。
主持人:我覺得聊天機器人大家可以探討一下,現(xiàn)在覺得還沒有一個特別好的應(yīng)用,算法上可能還沒有特別成熟。
搜狗高君:之前有朋友跟我說過聊天機器人,他跟我提到語料是一個非常麻煩的事兒,我不知道你們那邊怎么處理的。
主持人:最核心的就是知識圖譜的構(gòu)建。在聊天機器人上,技術(shù)上不是問題,其實就是生產(chǎn)資料的問題,就是你怎樣去構(gòu)建專業(yè)領(lǐng)域的聊天知識圖譜,這是目前聊天機器人做的好不好的差異化。怎么樣去跟行業(yè)深度應(yīng)用,這是一個未來的趨勢。技術(shù)是沒有門檻的,隨便幾個人,可以創(chuàng)建一家機器人聊天公司。
搜狗高君:如果做一個垂直領(lǐng)域的自動問答,有一個領(lǐng)域級的知識庫,可能對這些問題的解決幫助會很大。那比如說做小冰這種很寬泛的,我一直很好奇有個問題,比如說像電影和電視劇里邊有大量的對白,那么在這個場景里邊真的用這種對白有沒有價值能幫助這個聊天機器人的算法會變得更好?如果只是從這種 QA 的角度來講,要搜集這種配對關(guān)系,這個耗費的人力非常大的。但有的時候聊天機器人可能只是想讓大家感覺到它像一個人。所以這樣為什么不能從電視劇和電影里邊去拿到大量的對白。
七牛彭垚:我覺得其實客服機器人是相對好做的,反而把它做得像人,我覺得是比較難。我之前就接觸到一個例子,是讓機器人去學(xué)習(xí)大家平時的聊天內(nèi)容。比方說“我生病了,我今天不舒服”,然后去做人工去打標(biāo),比方說 5 個回答,它這里面就有一個回答就是“怎么了”。結(jié)果它搞了好幾組人打標(biāo),選“怎么了”的人最多,其實“怎么了”這種說法你在任何場景都是通用的,這個機器人它什么都給你回怎么了。實際上,它還是沒有到融匯上下文,能夠理解所有東西的地步。
Q
大家可以探索一些新的領(lǐng)域。
Polarr 宮恩浩:除了公司這邊,我個人科研主要做醫(yī)學(xué)影像,算比較新的一些應(yīng)用,比如說用深度學(xué)習(xí)來幫助醫(yī)生做一些診斷,或者看到一些人看不到的診斷,就是其提供圖片的質(zhì)量,其實就是跟凸顯相關(guān),同時我覺得 NLP 也可以用在這種就是醫(yī)學(xué)診斷方面,最近好像有些人來用就用各種這種非結(jié)構(gòu)化的數(shù)據(jù)來預(yù)測,這就是說我個人比較感興趣,可能在做一些比較小的嘗試。
搜狗高君:我讀博期間的實驗室是一個 cv 的實驗室,我很多的師兄師弟在做一些圖像相關(guān)的創(chuàng)業(yè)。剛才宮博士提到的醫(yī)學(xué)影像是我目前在關(guān)注的一件事情,確實很感興趣,因為國內(nèi)目前也有幾個小的創(chuàng)業(yè)公司,比如說 deep care,然后他們也貌似在做類似的工作,好像好多人在學(xué)的 IBM 那個 Watson,好像是那個方法,國內(nèi)有這樣一批的公司正在做,還有另外一批公司確實有在用 NLP 的方法在做病癥判斷和分診的問題,醫(yī)學(xué)上這兩個方向。我感覺現(xiàn)在創(chuàng)業(yè)公司比較多,但是目前在制藥這件事上我沒有聽到,所以我平常在廣告這件事完了以后,關(guān)注的最多的就是醫(yī)學(xué)影像,我會找這行的師兄師弟們聊聊天,聽聽他們的一些想法,因為我覺得這件事似乎商業(yè)價值蠻大的。
七牛彭垚:這種項目一般都非常大,對于這種,其實是解決一些非常通用性的問題,你只要解決一個科室的一些,比方說醫(yī)學(xué)影像,那其實就解決了這個非常通用的問題。
搜狗高君:不過我目前不看好國內(nèi)做這件事情,因為我的一個基本判斷是,你想讓醫(yī)院把正兒八經(jīng)有用的數(shù)據(jù)拎出來就不太靠譜,因為他們跟我說過這么一件事兒,他們拿到過幾萬份的病例,然后就是相關(guān)的數(shù)據(jù),刪完了以后,大概能用的數(shù)據(jù)是千條,我當(dāng)時的感受,就是這個行業(yè)別說用深度學(xué)習(xí)了,你拿個邏輯回歸都搞不起來,數(shù)據(jù)量太小。國內(nèi)其實很難有這么大的時間,能讓你搞這個,所以可能在美國很少做,但我覺得國內(nèi)應(yīng)該長期會有一個機會。
Polarr 宮恩浩:國內(nèi)其實這種病例還是多,主要是醫(yī)院和學(xué)校也可以合作,比如清華就有很多這方面資源,將來如果再想做這事的話,就是從每一個病人開始做起,就現(xiàn)在國內(nèi)基本上一周多的病人,就跟美國一個月一年的病人的數(shù)目差不多那種感覺。
七牛彭垚:對,像清華浙大交大這種醫(yī)學(xué)院研究院,有很多附屬醫(yī)院,數(shù)據(jù)還是非常多。剛才宮博士也說,是給到某些大學(xué),而大學(xué)里面這些影像中心可以流出去,所以這一塊其實有很多機會的。問題倒是以哪些病為突破口,這個倒是可以再探索。
Polarr 宮恩浩:最近基于 CNN 的 segmentation 發(fā)展有一定進展,就可以做一些很多醫(yī)療方面的應(yīng)用。
搜狗高君:但是有一點像醫(yī)學(xué)影像,即使就目前來看,就算能拿到很好的數(shù)據(jù),它也不太可能變成一個主要的手段吧?我是這么想,畢竟它是有錯誤率的,如果讓一個機器去做主要建議的話,一旦出了事故會比較麻煩,我是這樣感覺的。所以我覺得這種工具在未來,也僅僅是給醫(yī)生做一個參考的作用。我不知道大家會對這件事有更大的期待嗎?
Polarr 宮恩浩:這些醫(yī)學(xué)倫理和管理方面問題,主要是你不管做的再好,目前你不可能一個機器來給你做這做那,都是最后簽字是有人來負(fù)責(zé),但是對于醫(yī)生來說,比如他需要看很多層的圖片,很多個不同的層的片,那如果能告訴他,你就看這一層,就是主要的一層,這種減少他的工作量,從實質(zhì)上來說,非常非常好。前幾天我跟一個醫(yī)學(xué)院的老師聊這事,他覺得就需要這方面的東西。
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。