現(xiàn)在位置:主頁 > 國內(nèi) > 小鵬汽車首席科學家郭彥東:造更懂中國人的智能汽車 | 科技生活節(jié)

小鵬汽車首席科學家郭彥東:造更懂中國人的智能汽車 | 科技生活節(jié)

作者:編輯 ? 時間:2018-07-30 ? 瀏覽:人次

小鵬汽車首席科學家郭彥東在2018科技生活節(jié)

7月29日,由鈦媒體集團舉辦的“鈦媒體 2018T-EDGE 科技生活節(jié)”在北京·751東區(qū)故事正式拉開序幕。 小鵬汽車首席科學家郭彥東博士從整車廠商的視角同與會人員探討,如何造更懂中國人的智能汽車。

郭彥東從特斯拉高級輔助駕駛系統(tǒng)被一顆橘子騙過這樣一個案例引入,直言,在出現(xiàn)高級輔助駕駛功能之后,有的司機會出現(xiàn)過度依賴的現(xiàn)象。另外,從統(tǒng)計角度來看,盡管輔助駕駛市場一直在增長,而美國的交通事故致死數(shù)量在2015年,2016年不降反增。

因此,小鵬汽車做出了這樣一個思考:如何能讓人工智能技術真正提升用戶體驗跟車輛安全性,比如用智能的感知與決策把獨立的輔助駕駛功能有機結(jié)合起來。具體來說,根據(jù)車外環(huán)境、天氣、場景的理解來調(diào)節(jié)與選擇行車功能。更重要的一個場景是,在車和人互動的過程中,讓車去更好的理解人的狀態(tài)。不光是注意力方面,還包括司機的疲勞、情緒,做一個正向的反饋循環(huán),來提升用戶的體驗。

為達到這一愿景,小鵬汽車從數(shù)據(jù)、人工智能平臺、量產(chǎn)車入手,構建閉環(huán)智能進化能力。

第一是大數(shù)據(jù)平臺。從整車廠的角度,小鵬汽車收集了大量的數(shù)據(jù),包括:1、互聯(lián)網(wǎng)大數(shù)據(jù)。2、仿真大數(shù)據(jù)。3、自有車隊,或者測試車隊大數(shù)據(jù)。4、中國用戶大數(shù)據(jù)。

郭彥東博士特別強調(diào)真實中國用戶數(shù)據(jù)的重要性:

“ 可以說,中國用戶的真實數(shù)據(jù),不管從真實度上,還是成本效率上,還是對場景的覆蓋度、數(shù)據(jù)量上,都遠遠的優(yōu)于仿真和自有車隊的數(shù)據(jù)體量。在人工智能尤其是深度學習的大環(huán)境下,其實誰坐擁了數(shù)據(jù),誰就有可能會有最先進、最完善的技術體系。這個也是整車廠商有的一個優(yōu)勢。我們從大量的用戶中搜集用戶的反饋,用這個數(shù)據(jù)不停的調(diào)教和更新我們的智能車系統(tǒng)。”

第二,人工智能平臺。郭彥東博士表示,在智能車的場景中,往往最有價值的就是所謂的長尾(long-tail)數(shù)據(jù)。這些數(shù)據(jù)發(fā)生的頻次很低,很有可能你開很久的車才會有一次、兩次發(fā)生,但是這些事情的種類、類別、數(shù)量會非常多,這個就要求人工智能平臺有快速處理小樣本長尾數(shù)據(jù)的能力。

第三,量產(chǎn)車場景。小鵬汽車布局全球,也是中國最大規(guī)模的單車研發(fā)投入。這樣也保證,最新、最強的算法能夠在車上跑起來,能夠把用戶的一些行為實時反饋回來。

基于閉環(huán)智能進化,小鵬汽車致力于打造更懂中國人的智能汽車。包括更懂“路上的”中國人:理解中國人的駕駛文化,中國政策法規(guī),中國行車/道路環(huán)境,最重要的是更懂“車里的”中國人,包括司機/乘客的識別,注意力,情緒的感知,從而提供無縫的,個性化的,適應中國人的智能化駕駛體驗。

總結(jié)而言,小鵬汽車要成為 “更懂路上的中國人、更懂車里的中國人”的智能汽車。

以下為 小鵬汽車首席科學家郭彥東的演講實錄,略經(jīng)鈦媒體編輯

自動駕駛,在中國有它獨特的挑戰(zhàn),以及獨特的機遇。我從整車廠商的視角,來跟大家分享一下我們的經(jīng)驗和體會。我今天想從小鵬汽車發(fā)展中的一些思考和努力,跟大家探討一下如何造更懂中國人的智能汽車。

自動駕駛面臨幾項實際應用問題

我今天的分享從一個橘子開始,大家在圖上看到,一個橘子被卡在了方向盤上面。這其實是一張?zhí)厮估膱D片,說的是,特斯拉的“自動駕駛限制”被1顆橘子破解。

特斯拉高級輔助駕駛被一顆橘子騙過

我們知道,特斯拉的輔助駕駛系統(tǒng),實際上要求,司機必須要手持方向盤。

那么,它是通過什么來檢測司機是不是手持方向盤的呢?

其實,在特斯拉的方向盤里面有一個壓力傳感器。有些用戶不愿意去遵守特斯拉公司這樣的一個規(guī)定,就把這個橘子放在方向盤上面,從而成功的騙過了特斯拉汽車。

這個是一個很小事件,但是我們從這個橘子上也看到了一些挺有意思的事情。

第一,我們現(xiàn)在尤其是非營運的大眾消費車,包括特斯拉在內(nèi),其實做的都是輔助駕駛,或者高級輔助駕駛。它其實是對司機的注意力、手持方向盤是有要求的。

第二,用戶在有了輔助駕駛功能汽車之后,有些用戶會過度的信任駕駛系統(tǒng)。另外,從統(tǒng)計意義上來講,也存在這樣一件事情——高級輔助駕駛市場越來越大,一直在持續(xù)增長,但是很不幸的是,我們看到在美國的數(shù)據(jù)顯示,在美國的交通中的致死數(shù)量其實在2014年之后到2015年有一個拐點,2015年是不降反升的,2016年最新的數(shù)據(jù)是比2015年的致死數(shù)量更高。

沒有人有一個非常明確的答案說這到底是為什么,但是,我們可以從其中延伸出一些探討。

一方面,可能是因為智能手機大規(guī)模普及,大家更愿意用手機,在開車的過程中看手機,回短信、回消息。

另一方面,有一些說法是,因為有了輔助駕駛功能的出現(xiàn),有些司機不愿意關注駕駛過程中的一些交通情況。甚至會因為長時間的不關注,引發(fā)疲勞現(xiàn)象。怎么去解決這個問題呢?

我們今天都在講無人車、智能車。那么,智能怎么幫我們提升車的一些體驗跟安全性,這是我們的一些思考。

三大維度構建小鵬AI car

有很多輔助駕駛功能,都包括車道線輔助、緊急剎車、盲點檢測等等技術,甚至很多都可以有供應商提供了。我們希望能讓人工智能技術真正提升用戶體驗跟車輛安全性,比如用智能的感知與決策把這些獨立的輔助駕駛功能有機結(jié)合起來,這個車才是一個真正的智能車,才能夠提高用戶的體驗。我舉幾個例子,一方面是車外的一些感知,比如天氣,比如說場景的識別、事件識別和預測。

例如,一個司機在路上看到一輛校車停在路邊,車門打開了,他會知道可能有小朋友從車里跑出來。但是什么時候我們的輔助駕駛功能車,搭載了智能模塊以后也能做出類似的判斷呢?這才是我們樂于看到的一個事情。

另外,我覺得,跟車外的一些情況預測和判斷、智能感知比起來,車內(nèi)的感知可能顯得更重要。

我舉幾個例子,包括乘客、司機的識別,包括我剛才說的注意力、情緒的識別。

我們能不能在人和車互動的過程中,讓車去更好的理解司機的狀態(tài)?不光是他的注意力,包括他的疲勞、情緒,做一個正向的反饋循環(huán),來提升用戶的體驗,這個是我們的近期愿景。

所以,我們核心就是要把這些功能智能化,然后提升用戶體驗。它的基礎就是智能感知。

下面,我想和大家分享一下,我們小鵬汽車是怎樣實現(xiàn)這個愿景的。

我們有三大模塊,第一是大數(shù)據(jù),我們的智能車,始于大數(shù)據(jù),訓練和優(yōu)化在人工智能訓練平臺上,成熟在量產(chǎn)車平臺。量產(chǎn)車平臺是我們作為整車廠商一個獨特的優(yōu)勢我們OTA最新的算法模型在量產(chǎn)車上,然后我們再從量產(chǎn)車里面收集、采集更多的中國用戶真實數(shù)據(jù),來完成這樣一個閉環(huán)迭代的過程。

我從數(shù)據(jù)、人工智能平臺、量產(chǎn)車從這三個方面,來跟大家分別探討一下。

第一,數(shù)據(jù)為王。

小鵬汽車作為整車廠商,作為一個真正做量產(chǎn)車產(chǎn)品的公司,我們最關心的、最重視的就是我們的數(shù)據(jù)。

我們的數(shù)據(jù)來自于下面4個主要的來源:

  1. 互聯(lián)網(wǎng)大數(shù)據(jù)。
  2. 仿真大數(shù)據(jù)。
  3. 自有車隊,或者測試車隊大數(shù)據(jù)。
  4. 中國真實用戶大數(shù)據(jù)。

我主要說一下互聯(lián)網(wǎng)大數(shù)據(jù)和中國真實用戶的大數(shù)據(jù)。

一是互聯(lián)網(wǎng)大數(shù)據(jù)。最近這20年,整個人類其實做了一件很有意義的事情,就是把他們的行為、信息、知識都做了互聯(lián)網(wǎng)化。我們現(xiàn)在想要找一些信息,在互聯(lián)網(wǎng)上直接做簡單的搜索就可以馬上得到,是因為我們大量的人類信息都已經(jīng)在互聯(lián)網(wǎng)上有所體現(xiàn)了,都已經(jīng)在互聯(lián)網(wǎng)上被數(shù)字化了。

我可以和大家分享一個更細節(jié)的數(shù)字,我們也跟很多技術供應商去探討,一些很頂級的技術供應商,可能一年收集10個億的圖片,但是這個圖片的量對于互聯(lián)網(wǎng)數(shù)據(jù)來說,可能是一周,甚至遠遠不到一周的時候,互聯(lián)網(wǎng)上就有這么多圖片產(chǎn)生了。這個做過搜索引擎的人最有體會的,包括我自己。

互聯(lián)網(wǎng)數(shù)據(jù)量非常之大,對早期算法的演進意義重大。但是它有它的挑戰(zhàn),就是說,這部分數(shù)據(jù)可能跟無人駕駛、智能車想要的數(shù)據(jù)分布有一些不一樣的地方,標注也有一些困難,需要用一些辦法,比如遷移學習把互聯(lián)網(wǎng)的知識轉(zhuǎn)移到智能車上去。

為了達到這樣的一個目的,我們也關注另外3個主要數(shù)據(jù)來源:1、仿真大數(shù)據(jù)。2、自有車隊數(shù)據(jù)。3、來自于用戶的真實數(shù)據(jù)。

尤其是中國用戶的真實數(shù)據(jù),不管從真實度上,還是成本效率上,還是對場景的覆蓋度、數(shù)據(jù)量上,都遠遠的優(yōu)于仿真和自有車隊的數(shù)據(jù)體量。在人工智能尤其是深度學習的大環(huán)境下,其實誰坐擁了數(shù)據(jù),誰就有可能會有最先進、最完善的技術體系。這個也是整車廠商有的一個優(yōu)勢。我們從大量的用戶中搜集用戶的反饋,用這個數(shù)據(jù)不停的調(diào)教和更新我們的智能車系統(tǒng)。

第二,我們有了數(shù)據(jù)以后,如何去做。我們搭建人工智能平臺,用大量的數(shù)據(jù)訓練多個深度學習模型。

但是,我們想強調(diào)的是在智能車的場景中,往往最有價值的就是所謂的長尾(long-tail)數(shù)據(jù)。就是說這些數(shù)據(jù)發(fā)生的頻次很低,很有可能你開很久的車才會有一次、兩次發(fā)生,但是這些事情的種類、類別、數(shù)量會非常多,想要讓我們的車輛適應盡可能多的場景,就要求我們的人工智能平臺有快速處理這樣一個長尾(long-tail)數(shù)據(jù)的能力。

這有幾個挺有意思的例子,比如我從加州回來之前在路上。因為天氣也很好,前面是一個油罐車,這個油罐車很干凈,它把后面的車,包括我自己的車倒影在油罐車的油罐上面去了。

如果你對這個場景沒有一個特殊的理解和處理的話,很多世界上最好的計算機視覺算法,都有可能誤認為倒影是真實的車道線與車輛。

特斯拉曾經(jīng)發(fā)生過一件很慘痛的事故,特斯拉的車沒有成功的把一輛白色的大貨車認成車,認為是一片云彩,也撞上去了。

右下角就更有意思了,尤其是坐在前排的觀眾,可以馬上發(fā)現(xiàn),這其實是一個披著cosplay衣服的行人走在路上,人類司機都可以完成識別是一個行人。但是計算機視覺,由于這個人穿了一件cosplay的衣服,可能算法不一定能成功檢測到是一個人。

這就對我們?nèi)斯ぶ悄軐W習平臺提出的問題——當樣本不是那么常見、頻次很低的時候,如何快速學習呢?

其實在業(yè)界有很多這種類似的方法、技術已經(jīng)被研發(fā)出來了,比如微軟的custom vision,我本人也曾參加了custom vision的核心研究工作。將來也會針對小鵬汽車的特殊場景定制和打造可以快速迭代,應對小樣本學習的人工智能學習平臺。

第三個我想分享的是我們有了數(shù)據(jù),有了人工智能訓練平臺,我們有一個獨特的場景,就是量產(chǎn)車場景。

首先我們想說我們有一個全球化的企業(yè)布局,我們在硅谷、廣州、北京、上海、肇慶、鄭州等等地方,也都有我們的研發(fā)和生產(chǎn)中心,小鵬也是中國最大規(guī)模的單車研發(fā)投入。

包括我們現(xiàn)在也跟世界上最好的芯片廠商有緊密的合作,也簽署了戰(zhàn)略合作協(xié)議,我們將會搭載世界上算力最強的人工智能芯片之一,這樣也保證我們最新的算法能夠在車上跑起來,能夠把用戶的一些行為能夠?qū)崟r的反饋回來。

如何造更懂中國人的車?

有了這樣一個閉環(huán)的智能進化能力之后,我們也想更多的探討一下在中國的場景怎么打造我們的差異化,更懂中國人。

更懂中國人,我們其實把它分兩個層面來理解:

第一層面,更懂路上的中國人。

其實我們路上有這樣那樣的行為,包括開遠光燈也好,有時候人車混流也好,需要學習的其實是人的行為,人的文化,也還有人制定的政策和法規(guī)。我可能稍微多說一點的就是右上角的圖,右上角的圖是對比圖,就是車輛等紅燈時的一些行為,對比圖的右邊也是我回來之前在加州拍的一張圖片,等紅燈的時候大家看到,其實在美國車跟車之間的距離是比較遠的,但在對比圖的左側(cè)我們看到,在中國駕駛場景當中,在等紅燈的時候,車跟車的距離非常之近,哪怕非常之近的時候都有車加塞進來,這個環(huán)境當中,這個事對智能的要求,就已經(jīng)超出了普通的物體檢測提到的要求。它其實學的是人的行為人的文化,學的是人的政策和法規(guī)。

其他幾個例子包括中文的路牌、中國特色路牌,包括密集交通、人車混流,甚至中國一些特色天氣下的處理,等等都給我們更懂“路上的”中國人提到一些機遇和挑戰(zhàn)。

第二層面,更懂車里的中國人。

更懂車里的中國人,我也把它分這么兩個層次討論:

1、更懂車里的中國人,最簡單的就是要求智能車聽得懂中國話,認得到中國人,符合中國的駕駛習慣。

2、“懂你”。“懂你”指的是說,懂在車里的這一個中國人,這一個中國司機我們要懂他。為了實現(xiàn)這樣一個目的,第一我們要人臉識別,知道開車的是誰,他有什么樣用戶的畫像。第二我們需要對用戶的情緒狀態(tài)有這樣的感知,為什么有這樣的感知呢,情緒信號其實是對我們調(diào)教車的用戶體驗的一個非常強的信號。

最后,我想談一談標準化的問題。

現(xiàn)在國際上有兩套無人駕駛的法規(guī),包括美國NHTSA和SAE,都有兩套這樣的規(guī)則,或者兩套分類的標準。

這兩套分類的標準,其實一定程度上偏定性的描述,缺乏一些定量的規(guī)定,這是其一。

其二像我剛才說的,我們絕大部分整車廠商或者消費類的車輛集中商,現(xiàn)在都集中在L2沖刺L3的階段,大家都聚焦在這個層次上。而營運類的車輛,絕大部分都聚焦在L4,因為它限定場景(不管運人還是運貨)集中在L4的階段做。

所以,我們想把這個標準化的東西提出來有兩個原因。

我們認為這個標準化的規(guī)則,應該制定的更加細分一些、定量一些,這樣有這么一套標準、體現(xiàn)車跟車之間的差異化,能夠促進車企之間的良性競爭,推動整個行業(yè)的發(fā)展。

我們也希望這樣的標準化,不僅只是由美國主導和提出,包括這兩套標準全部都是由美國主導的,我們也希望中國能夠參加到這個標準的制定中去,為世界的智能車發(fā)展貢獻一份力量。

人車共存,我們認為車是為人服務的,不管L2、L3還是L4,人和車一定是共存在路上的,車和人之間的相互理解是非常重要的,在人車共存的前提下,我們想提出的口號是以人為本,人工智能車核心是提升人的體驗。(本文首發(fā)鈦媒體)

轉(zhuǎn)載請保留原文鏈接:http://www.parkingblocks4less.com/a/guona/20180730/9906.html上一篇:上一篇:朝陽規(guī)劃藝術館楊軍:城市規(guī)劃館究竟應該做什么? | 科技生活節(jié)
下一篇:下一篇:沒有了