您好,登錄后才能下訂單哦!
不知不覺(jué)間,AI已經(jīng)滲透到了生活的方方面面,甚至包括我們所熟知的餐飲外賣(mài)。
從商家的菜單錄入、招牌識(shí)別、到促銷(xiāo)時(shí)AI自動(dòng)生成的廣告首圖優(yōu)選、外賣(mài)騎手的身份驗(yàn)證……美團(tuán)的AI視覺(jué)能力已經(jīng)滲透到其業(yè)務(wù)的方方面面。
▲美團(tuán)視覺(jué)圖像中心圖像視頻組負(fù)責(zé)人魏曉明
近日,智東西來(lái)到美團(tuán)北京總部,與美團(tuán)視覺(jué)圖像中心圖像視頻組負(fù)責(zé)人魏曉明進(jìn)行了一次深度對(duì)話,全面地解讀了美團(tuán)的視覺(jué)AI能力、美團(tuán)視覺(jué)AI平臺(tái)發(fā)展歷程、與美團(tuán)視覺(jué)AI背后的“發(fā)電廠”。
魏曉明說(shuō),與其他很多企業(yè)不同,美團(tuán)的AI技術(shù)有著強(qiáng)烈的業(yè)務(wù)導(dǎo)向特色。
當(dāng)前,美團(tuán)的AI技術(shù)主要分為四大類(lèi),分別為:基于AI的語(yǔ)音/語(yǔ)義理解技術(shù)、基于AI的視覺(jué)處理技術(shù)、基于運(yùn)籌學(xué)為主的配送調(diào)度優(yōu)化、以及基于自動(dòng)駕駛相關(guān)的無(wú)人配送技術(shù)。
▲美團(tuán)AI視覺(jué)布局
魏曉明是美團(tuán)視覺(jué)圖像中心圖像視頻組負(fù)責(zé)人,有著超過(guò)9年視覺(jué)領(lǐng)域研發(fā)和技術(shù)管理經(jīng)驗(yàn),此前曾經(jīng)就職于佳能研究院和三星研究院。
魏曉明2015年加入美團(tuán)后,主導(dǎo)了超過(guò)50個(gè)AI視覺(jué)項(xiàng)目。在采訪中,魏曉明分別從商戶、騎手、用戶、平臺(tái)四個(gè)角度,對(duì)于美團(tuán)的典型AI視覺(jué)應(yīng)用場(chǎng)景進(jìn)行了介紹。
▲AI菜單拍照錄入
對(duì)于商戶而言,美團(tuán)AI能夠讓其通過(guò)拍照錄入菜單,通過(guò)文字檢測(cè)、語(yǔ)義分割、視覺(jué)關(guān)系學(xué)習(xí)等技術(shù)抽取紙質(zhì)菜單上的結(jié)構(gòu)化信息,讓商戶菜單錄入的時(shí)間由小時(shí)級(jí)降至一分鐘以內(nèi)。
▲AI招牌識(shí)別
隨著OCR技術(shù)的不斷發(fā)展,菜單識(shí)別、招牌識(shí)別等細(xì)分場(chǎng)景成為了當(dāng)前OCR領(lǐng)域的研究熱點(diǎn)。在今年的 ICDAR 2019 上,美團(tuán)主辦了業(yè)界首個(gè)中文門(mén)臉招牌文字識(shí)別比賽(ICDAR 2019 Robust Reading Challenge on Reading Chinese Text on Signboards),并公開(kāi)的業(yè)界首個(gè)真實(shí)場(chǎng)景招牌圖像數(shù)據(jù)集。
此外,商戶的證件資質(zhì)認(rèn)證、騎手的刷臉認(rèn)證、用戶所使用的AI菜品識(shí)別小程序、廣告首圖優(yōu)選、騎手抽檢等等應(yīng)用背后,都有著美團(tuán)AI視覺(jué)的加持。
魏曉明說(shuō),當(dāng)前,美團(tuán)的技術(shù)人員有上萬(wàn)人,美團(tuán)AI視覺(jué)中心也有幾十名員工,并且團(tuán)隊(duì)規(guī)模仍在不斷擴(kuò)展當(dāng)中。
二、GPU計(jì)算平臺(tái)全面升級(jí),效率提高百倍
美團(tuán)的AI視覺(jué)團(tuán)隊(duì)從2015年開(kāi)始建立,為美團(tuán)各項(xiàng)業(yè)務(wù)提供AI視覺(jué)能力(比如圖像審核、智能選圖等),2015-2016年可以看作是美團(tuán)AI視覺(jué)平臺(tái)的第一個(gè)發(fā)展階段。
隨著集團(tuán)內(nèi)部對(duì)于AI算力的需求飆升,2017年,美團(tuán)進(jìn)行了企業(yè)層面的計(jì)算平臺(tái)全面升級(jí),將從CPU為主的計(jì)算平臺(tái)升級(jí)為以英偉達(dá)GPU為主的集群化AI計(jì)算平臺(tái),2017-2018年可以看作是美團(tuán)AI視覺(jué)平臺(tái)的第二個(gè)發(fā)展階段。
在升級(jí)為以英偉達(dá)Tesla V100 GPU為主的集群化AI計(jì)算平臺(tái)后,美團(tuán)AI在文字檢測(cè)、人臉識(shí)別、商品識(shí)別的離線訓(xùn)練(Training)環(huán)節(jié)能夠達(dá)到上百倍的效率提升。
而在應(yīng)用推理(Inference)方面,當(dāng)前,美團(tuán)基于英偉達(dá)Tesla P4 GPU + TensorRT的搭配能讓計(jì)算效率提高數(shù)十倍。而且,美團(tuán)目前使用的是FP32精度,未來(lái)如果使用英偉達(dá)T4 Tensor Core GPU進(jìn)行FP16精度的推理計(jì)算,性能將進(jìn)一步提升。這種低時(shí)延、高實(shí)時(shí)性的計(jì)算性能對(duì)于用戶與配送員的體驗(yàn)非常重要。
舉個(gè)例子,為了保障用戶的安全,當(dāng)前美團(tuán)日活的70萬(wàn)名騎手都已經(jīng)全面覆蓋了“刷臉認(rèn)證”功能。但是這項(xiàng)功能為騎手多增加了一道驗(yàn)證工序,對(duì)于效率與體驗(yàn)都有影響。
因此,為了保證騎手的人臉比對(duì)效率,美團(tuán)使用了基于GPU并行+TensorRT的方案進(jìn)行大規(guī)模人臉比對(duì)的騎手身份驗(yàn)證。相比于基于CPU方案,這套方案可以加速20倍以上,速度的提升能讓外賣(mài)小哥“刷臉認(rèn)證”的過(guò)程更快捷、體驗(yàn)更優(yōu)秀。
魏曉明說(shuō),當(dāng)前,美團(tuán)服務(wù)器集群的AI視覺(jué)服務(wù)的日均調(diào)用已經(jīng)達(dá)到了上億次。
三、美團(tuán)AI的下一步
2018年,結(jié)合美團(tuán)的計(jì)算平臺(tái)升級(jí),美團(tuán)AI視覺(jué)得到了超大規(guī)模的落地,覆蓋了上文提到的菜單識(shí)別、人臉認(rèn)證、刷臉支付、廣告生成等眾多集團(tuán)內(nèi)部應(yīng)用場(chǎng)景。
▲美團(tuán)在CVPR2019-FGVC6商品識(shí)別比賽獲得第二名
從2019年開(kāi)始,美團(tuán)的AI視覺(jué)團(tuán)隊(duì)已經(jīng)不僅僅只支持集團(tuán)內(nèi)部的AI需求,還逐步在國(guó)際大型比賽上進(jìn)行發(fā)聲。2019年,美團(tuán)AI視覺(jué)團(tuán)隊(duì)在CVPR、ICME等視覺(jué)屆知名比賽上都取得了Top3名次。
魏曉明認(rèn)為,當(dāng)前AI算法依舊在快速迭代的過(guò)程中。對(duì)于美團(tuán)這種大型平臺(tái)來(lái)說(shuō),持續(xù)對(duì)TensorFlow、Caffe、MXNet等多個(gè)深度學(xué)習(xí)框架進(jìn)行迭代能夠提高計(jì)算并行化效率,對(duì)于美團(tuán)特定AI場(chǎng)景的優(yōu)化十分重要。
下一步,美團(tuán)AI視覺(jué)團(tuán)隊(duì)還將對(duì)視頻理解、門(mén)店數(shù)字化、無(wú)人配送系統(tǒng)等更多AI場(chǎng)景落地進(jìn)行拓展。
隨著AI應(yīng)用的爆發(fā),眾多企業(yè)都在進(jìn)行AI計(jì)算平臺(tái)的升級(jí),尤其是涉及刷臉認(rèn)證、拍照信息檢索等實(shí)時(shí)性要求較高的AI推理應(yīng)用,傳統(tǒng)計(jì)算平臺(tái)已經(jīng)不能滿足需求。
不知不覺(jué)間,AI已經(jīng)逐漸滲透到了我們生活的方方面面,在你不經(jīng)意間,也許已經(jīng)享受到了AI帶來(lái)的生活便利。
https://www.toutiao.com/a6737937713061691908/
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。