雷鋒網(wǎng)按:本文為 AI 研習社編譯的技術(shù)博客,原標題 Perception Projects from the Self-Driving Car Nanodegree Program,作者為 David Silver。
翻譯 | 余杭 校對 | 王祎
在這些項目中,學生們構(gòu)建了包括感知技術(shù),深度學習,計算機視覺在內(nèi)的眾多項目,充分展示了他們的能動性,創(chuàng)造性和工作理念。
我們經(jīng)常被學生告知在Udacity 自動駕駛工程師納米學位項目中他們最喜歡的主題是感知技術(shù),深度學習和計算機視覺(https://www.udacity.com/course/self-driving-car-engineer-nanodegree--nd013?utm_source=medium&utm_medium=content&utm_campaign=david_silver_blog)。
他們將對這些主題的濃厚興趣直接轉(zhuǎn)化為了高質(zhì)量的工作。現(xiàn)在,我將向你們分享一下其中 3 個學生項目,這3個項目涵蓋了上述這些主題,而且尤其令人印象深刻。
使用 ResNet 作為特征提取器實現(xiàn) YOLO
https://medium.com/@m.khan/implementing-yolo-using-resnet-as-feature-extractor-5857f9da5014
Mohammad Atif Khan
我非常喜歡這個項目! Mohammad 獨立完成了這個項目,并且大大超出了納米項目的要求。這對于他以后的事業(yè)發(fā)展有非常大的裨益,因為雇主們非常喜歡這類有天賦的學生,這類學生能夠深入研究某個專題,他們會通過自主構(gòu)建項目來將想法具現(xiàn)化并且實驗技能。
“在這個項目中我使用了預訓練的 ResNet50 神經(jīng)網(wǎng)絡,移除了它的分類層,因此它變成了一個特征提取器,然后加入了 YOLO 的分類層(隨機初始化后)。然后在 Udacity 的 CrowdAI 數(shù)據(jù)集上訓練它以檢測視頻幀中的車輛”
語義分割
https://github.com/KiqueGar/CarND-Semantic-Segmentation
Enrique Garcia
Enrique 在納米學位的高級深度學習項目中使用了 VGG-16 創(chuàng)建語義分割神經(jīng)網(wǎng)絡。他使用 KITTI 數(shù)據(jù)集來訓練網(wǎng)絡,然后將其應用到他在墨西哥自駕游時取的場景圖上。一起看看這個YouTube 視頻!
“原始的 FCN-8s 是分階段訓練。后來作者在 Github 上傳了一個同時訓練所有階段的版本的 repo . Github repo 中的版本有個很重要的不同點是:池化層 3 和 4 的輸出在它們被喂進 1 × 1 的卷積層之前被縮放了。結(jié)果是,一些學生發(fā)現(xiàn)這種包含縮放層的模型學習效果要好得多。模型的收斂速度可能不會那么快,但是會達到很高的檢測評價值以及準確率”
使用機器學習來進行車輛檢測
https://towardsdatascience.com/machine-learning-for-vehicle-detection-fd0f968995cf
Moataz Elmasry
......
想要繼續(xù)閱讀,請移步至我們的AI研習社社區(qū):http://www.gair.link/page/TextTranslation/925
更多精彩內(nèi)容盡在 AI 研習社。
不同領(lǐng)域包括計算機視覺,語音語義,區(qū)塊鏈,自動駕駛,數(shù)據(jù)挖掘,智能控制,編程語言等每日更新。
雷鋒網(wǎng)雷鋒網(wǎng)
本站僅提供存儲服務,所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請
點擊舉報。