溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》
  • 首頁 > 
  • 教程 > 
  • 互聯(lián)網科技 > 
  • 最大綜合教學視頻數(shù)據(jù)集發(fā)布,道路標記線會擾亂自動駕駛穩(wěn)定性 | AI一周學術

最大綜合教學視頻數(shù)據(jù)集發(fā)布,道路標記線會擾亂自動駕駛穩(wěn)定性 | AI一周學術

發(fā)布時間:2020-08-09 15:48:20 來源:ITPUB博客 閱讀:172 作者:大數(shù)據(jù)文摘 欄目:互聯(lián)網科技

最大綜合教學視頻數(shù)據(jù)集發(fā)布,道路標記線會擾亂自動駕駛穩(wěn)定性 | AI一周學術

大數(shù)據(jù)文摘專欄作品

作者:Christopher Dossman

編譯:Jiaxu、云舟

嗚啦啦啦啦啦啦啦大家好,本周的AI Scholar Weekly欄目又和大家見面啦!

AI Scholar Weekly是AI領域的學術專欄,致力于為你帶來最新潮、最全面、最深度的AI學術概覽,一網打盡每周AI學術的前沿資訊,文末還會不定期更新AI黑鏡系列小故事。

周一更新,做AI科研,每周從這一篇開始就夠啦!

本周關鍵詞:端到端自動駕駛,幻想文本冒險游戲,教學視頻分析的開源數(shù)據(jù)集

AI狂想

AI領域正在向兩個不同的方向發(fā)展,一種是小微型計算,另一種則是巨型計算。

本周熱門學術研究

針對端到端自主駕駛模型的簡單對抗實例

在開發(fā)多功能建模框架和模擬基礎設施來研究端到端自動駕駛模型的對抗性范例的過程中,研究人員發(fā)現(xiàn),一些十分簡單且易于設計的物理條件,會對自動駕駛模型產生一定的對抗性。例如道路上的標記線就能夠打破端到端駕駛模型的穩(wěn)定。

這些范例的對抗性有在很多情況下并不會呈現(xiàn)很強的干擾性,比如直線行駛的時候,但在諸如車輛轉彎的其他情況下,則會體現(xiàn)出很強的干擾性。

盡管對于人類來說,區(qū)分和避免此類沖突是十分簡單的,但對于端到端監(jiān)視模型而言,這些干擾將造成嚴重的交通違規(guī)問題。在測試和實驗中,研究人員使用了CARLA自動駕駛汽車模擬器,證明這些物理擾亂不僅存在,而且在特定的駕駛情況下甚至對于最先進的模型也有相當強的作用。

最大綜合教學視頻數(shù)據(jù)集發(fā)布,道路標記線會擾亂自動駕駛穩(wěn)定性 | AI一周學術

潛在應用及影響

智能機器學習系統(tǒng)極易受到干擾的問題引發(fā)了廣泛的擔憂。這些研究成果及其理論框架無疑為以后的研究提供了有用的信息,并揭示了端到端深度學習模型的缺陷,便于日后改進。此外,該研究也為人工智能工程師們進一步探索更大范圍內深度學習模型可能遭受的攻擊提供了重要的見解。

原文: 

https://arxiv.org/abs/1903.05157

綜合教學視頻分析數(shù)據(jù)集(COIN數(shù)據(jù)集)

為了解決教學視頻數(shù)據(jù)集缺乏多樣性和規(guī)模的問題,研究人員最近推出了COIN數(shù)據(jù)集,該數(shù)據(jù)集是現(xiàn)在用于綜合教學視頻分析的最大的視頻數(shù)據(jù)集。

該數(shù)據(jù)集以分層結構組織,包括大約11827個視頻,廣泛涵蓋了日常生活10個以上領域的180個課題 。 COIN數(shù)據(jù)集中的所有視頻都進行了一系列專業(yè)注釋。 此外,研究人員還提出了一個簡單有效的方法,可用于捕獲不同描述階段的數(shù)據(jù)依賴性。這類方法還可同傳統(tǒng)方法相結合,以更好地提取教學視頻中的關鍵步驟。

最大綜合教學視頻數(shù)據(jù)集發(fā)布,道路標記線會擾亂自動駕駛穩(wěn)定性 | AI一周學術

潛在應用及影響

研究人員對于COIN數(shù)據(jù)集的創(chuàng)建目的十分明確 ——通過豐富的語義分類來建立綜合全面的教學視頻數(shù)據(jù)集,為教學視頻分析提供基準。通過COIN的建立,研究人員也希望推動AI社區(qū)未來對教學視頻分析的深入研究。

COIN數(shù)據(jù)集:

https://coin-dataset.github.io/

原文: 

https://arxiv.org/abs/1903.02874v1

不犧牲準確性的量化

通常情況下,量化會降低模型精度。 盡管如此,研究人員依舊致力于通過改進量化技術,從而減少量化過程中精確度的降低。在最近的一篇論文中,他們提出了一種可以有效地量化模型權重的聚焦量化技術。

論文中所提出的量化方法使用高斯混合表示來定位模型權重分布中的高概率區(qū)域,并且以精細水平量化它們。 此外,這一量化技術僅使用-2的冪來提供有效的計算模式。

最大綜合教學視頻數(shù)據(jù)集發(fā)布,道路標記線會擾亂自動駕駛穩(wěn)定性 | AI一周學術

通過一系列整合修剪和編碼,他們已經設法在各種CNN上展示出高端壓縮比。 例如,它們在ResNet-50中達到18.08×的壓縮比,在模型精度方面的損失僅為可以忽略不計的0.24%,超過了當前的壓縮技術。

潛在應用及影響

與深度神經網絡的量化計算集成的量化參數(shù),具有極高的實現(xiàn)大量計算增益和優(yōu)化性能的能力。 該論文所提出的聚焦量化可以使模型尺寸和計算成本降低,并轉化為高壓縮比,同時提高了當前和未來CNN的效率。

原文:

https://arxiv.org/abs/1903.03046v1

LIGHT:在幻想文本冒險游戲中學習說話和行動

想象一下,如果有一款游戲,多個計算機和人類都可以充當游戲角色,這樣的游戲會是什么樣呢?研究人員最近推出了這樣一款幻想文本冒險游戲,玩家可以在與多個玩家建立對話的同時,進行識、行動和表達等互動。

現(xiàn)有的文字冒險游戲通常是單人的,并且玩家無法在游戲中與人類進行對話,這就是為什么我覺得這個游戲聽起來很有趣和有冒險性。

在人與文本的交互游戲中學習(LIGHT),是一款多玩家的幻想文本冒險游戲,旨在幫助機構研究人類間多方面的動態(tài)協(xié)作對話。

該文本類的游戲設定于一個內涵豐富的游戲世界,其中包括超過660個位置,3460個對象和僅以自然語言定義的1750個字符。研究人員已經收集了大量的數(shù)據(jù)集(11k集),這些數(shù)據(jù)集涉及行為,表達和對話等角色驅動的人與人之間的相互作用,其目的是訓練模型以類似的方式吸引人類。

測試結果表明,在此條件下訓練、生成和檢索模型可以有效地利用游戲世界的潛在條件或規(guī)則來調節(jié)他們的預測。

最大綜合教學視頻數(shù)據(jù)集發(fā)布,道路標記線會擾亂自動駕駛穩(wěn)定性 | AI一周學術


潛在應用及影響

LIGHT提供了一個可用于在許多不同的任務中共享,培訓和評估協(xié)作對話模型的統(tǒng)一平臺,使人們能夠以有趣的方式與機器進行交互。 該框架通過提供合適的研究平臺,允許研究機構進行多種協(xié)作和學習,從而研究和增強現(xiàn)有的協(xié)作對話系統(tǒng)。 研究人員希望這項工作能夠進一步促進和推動基礎語言學習的研究工作。

官網:

http://parl.ai/

原文:

https://arxiv.org/abs/1903.03094v1

利用機器學習實現(xiàn)自動機器人的自適應

研究人員提出了一種綜合學習和定量規(guī)劃的方法,其主要目標是在機器人系統(tǒng)等動態(tài)和不確定環(huán)境中運行的高度可配置系統(tǒng)中實現(xiàn)自適應。該技術使用配置更改作為實施適應的主要機制。

該方法的創(chuàng)新之處在于,它應用機器學習來發(fā)現(xiàn)帕累托最優(yōu)配置,而無需探索所有配置,并將搜索空間的限制應用于可控計劃的特定設置。通過這種方式,它可以將學習和定量計劃結合起來,以實現(xiàn)運行時的自適應。

此外,該方法有助于在定量規(guī)劃中整合來自多個模型的信息。具體來說,研究人員探索了需要考慮時間和能量消耗的機器人操作。獨立的評估表明,該方法在不確定和動態(tài)環(huán)境中產生了高質量的適應過程。

最大綜合教學視頻數(shù)據(jù)集發(fā)布,道路標記線會擾亂自動駕駛穩(wěn)定性 | AI一周學術

潛在應用及效果

作為一種能夠有效實現(xiàn)機器人自適應的集成學習和定量規(guī)劃方法的新技術,該方法可用于許多其他網絡物理系統(tǒng)。此外,它還可以作為在線界面擴展到運行時模型更新的界面中。

原文:

https://arxiv.org/abs/1903.03920

其他爆款論文

最近的研究表明,通過演示,你現(xiàn)在可以教機器人完成兩個不同的清潔任務。     

原文:

https://arxiv.org/abs/1903.05635

在允許可靠的攝像機姿態(tài)估計時,如何避免在拍攝的3D場景上泄露機密信息?最近的一項研究提出了一種基于圖像的隱私保護定位解決方案。

原文:

https://arxiv.org/abs/1903.05572

谷歌推出了一個新的開放源碼庫,可以有效地訓練巨型神經網絡。

網頁:

https://ai.googleblog.com/2019/03/introducing-gpipe-open-source-library.html

以下是基于實例和類別級別的6D對象姿態(tài)估計,用于增強現(xiàn)實、機器人控制和導航等應用。

原文:

https://arxiv.org/abs/1903.04229

想知道如何在生物醫(yī)學文本中總結和發(fā)現(xiàn)有意義的概念嗎?

原文:

https://arxiv.org/abs/1903.02861v1

AI新聞

谷歌發(fā)布了一種基于神經網絡的端到端語音識別器,以支持最先進的語音識別。

更多信息:

https://ai.googleblog.com/2019/03/an-all-neural-on-device-speech.html

研究人員的好消息:Deep Mind開發(fā)了一個開源軟件庫來幫助他們部署TensorFlow模型。

更多信息:

https://deepmind.com/blog/tf-replicator-distributed-machine-learning/

中國最終會在AI研究上超越美國嗎?現(xiàn)在中國關于AI的論文發(fā)布數(shù)量已經超越了美國。

閱讀更多:

https://www.wired.com/story/china-catching-up-us-in-ai-research/amp

最大綜合教學視頻數(shù)據(jù)集發(fā)布,道路標記線會擾亂自動駕駛穩(wěn)定性 | AI一周學術
專欄作者介紹

Christopher Dossman是Wonder Technologies的首席數(shù)據(jù)科學家,在北京生活5年。他是深度學習系統(tǒng)部署方面的專家,在開發(fā)新的AI產品方面擁有豐富的經驗。除了卓越的工程經驗,他還教授了1000名學生了解深度學習基礎。

LinkedIn:

https://www.linkedin.com/in/christopherdossman/

向AI問一下細節(jié)

免責聲明:本站發(fā)布的內容(圖片、視頻和文字)以原創(chuàng)、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關證據(jù),一經查實,將立刻刪除涉嫌侵權內容。

AI