先介紹一下你的博士論文題目吧?
大家好!我是 Philip,我的學(xué)校是慕尼黑工業(yè)大學(xué)(TU Munich),目前是計(jì)算機(jī)科學(xué)專業(yè)博士三年級(jí),我的導(dǎo)師是 Daniel Cremers。我的研究方向是計(jì)算機(jī)視覺(jué),就是要讓計(jì)算機(jī)理解圖像和視頻。對(duì)計(jì)算機(jī)來(lái)說(shuō),圖像和視頻僅僅是一大堆沒(méi)什么含義的數(shù)字而已。不過(guò)如果用顏色把他們表示出來(lái),人類就可以馬上分辨出來(lái)圖像中有什么內(nèi)容。
為了讓計(jì)算機(jī)也能做到這樣的事情,我的方法是訓(xùn)練神經(jīng)網(wǎng)絡(luò);這是一大類模型,它們可以看作是“迷你視覺(jué)皮層”的一種實(shí)例。訓(xùn)練的目標(biāo)是把組成圖像的那些數(shù)字映射更成有意義的東西,就比如“貓”這樣的類別標(biāo)簽。神經(jīng)網(wǎng)絡(luò)在這種任務(wù)上的表現(xiàn)非常好。我研究過(guò)的問(wèn)題包括 光流 optical flow(“視頻中一幀到下一幀之間發(fā)生了什么?”)、領(lǐng)域適應(yīng)(“如何讓一個(gè)領(lǐng)域的知識(shí)/標(biāo)簽在另一個(gè)領(lǐng)域發(fā)揮作用,比如讓手寫圖像的標(biāo)簽在谷歌街景的門牌號(hào)識(shí)別任務(wù)中發(fā)揮作用”)。
在做研究之外,我還有一個(gè) YouTube 頻道“Pill's Physics”,里面的內(nèi)容是我做一些科學(xué)實(shí)驗(yàn)、討論一些科學(xué)知識(shí)。
你是如何選擇做這個(gè)方向的?
2014年的時(shí)候,我剛剛在美國(guó)加州大學(xué)圣克魯茲分校拿到物理學(xué)碩士學(xué)位。那時(shí)候我在一個(gè)研究如何給盲人移植視網(wǎng)膜的跨學(xué)科小組里面,有一次實(shí)驗(yàn)中我們需要處理一些采集起來(lái)非常費(fèi)錢的數(shù)據(jù),然而我們又沒(méi)法充分利用這些數(shù)據(jù),因?yàn)槲覀兊臄?shù)據(jù)處理程序過(guò)于簡(jiǎn)單了。所以我就開始自學(xué)機(jī)器學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)。我很快就對(duì)這東西著迷了,然后開始聯(lián)系在這個(gè)領(lǐng)域做研究的教授們。Daniel Cremers 邀請(qǐng)我過(guò)去展示我的工作成果,我覺(jué)得非常榮幸,后來(lái)他也就成為了我的博士導(dǎo)師。
你選擇來(lái)谷歌實(shí)習(xí)的原因是什么?你的導(dǎo)師起到的幫助大嗎?
深度學(xué)習(xí)領(lǐng)域的進(jìn)步速度非?。幾乎每周都有人發(fā)表突破性的新神經(jīng)網(wǎng)絡(luò)或者訓(xùn)練方法。很多時(shí)候,論文作者都是來(lái)自谷歌的。這就讓我非常好奇谷歌在這個(gè)領(lǐng)域都做了些什么樣的研究。在一個(gè)夏令營(yíng)中,我遇到了 Olivier Bousquet,他做了一個(gè)關(guān)于谷歌大腦團(tuán)隊(duì)的演講,講得非常棒。他給我介紹了谷歌研究實(shí)習(xí)生的事情,我就很快發(fā)了申請(qǐng)。我的博士導(dǎo)師也很支持我,因?yàn)榻佑|新的觀點(diǎn)、跟別人接觸、跟別人交換意見(jiàn)永遠(yuǎn)是好事,尤其是在深度學(xué)習(xí)這樣的新領(lǐng)域中。而且,谷歌有很多的資源可以用于研究,很多大學(xué)里沒(méi)有條件計(jì)算的實(shí)驗(yàn)都可以在這里完成。
你實(shí)習(xí)期間做的是什么項(xiàng)目?
我很榮幸可以和 Alexander Mordvintsev 一同工作,他是 DeepDream 的創(chuàng)始人之一。我們做的項(xiàng)目是關(guān)于一種用無(wú)標(biāo)簽數(shù)據(jù)和半監(jiān)督學(xué)習(xí)訓(xùn)練神經(jīng)網(wǎng)絡(luò)的新方法的。
我們開發(fā)出的新方法叫“從聯(lián)想中學(xué)習(xí)(Learning by Association)”。它的思路和“聯(lián)想游戲”很像,給你一個(gè)單詞,然后你要回答你聯(lián)想到的第一個(gè)東西。幾輪聯(lián)想下來(lái),一般都會(huì)形成很好玩的聯(lián)想鏈。
我們做的事情就跟這個(gè)很類似:我們首先訓(xùn)練一個(gè)能夠生成表征(神經(jīng)激活模式)的神經(jīng)網(wǎng)絡(luò),這樣的表征也可以用來(lái)做聯(lián)想。這樣的聯(lián)想就可以把有標(biāo)簽數(shù)據(jù)和無(wú)標(biāo)簽數(shù)據(jù)聯(lián)系起來(lái)。假設(shè)我們能夠生成一條有標(biāo)簽數(shù)據(jù)和無(wú)標(biāo)簽數(shù)據(jù)之間的聯(lián)想鏈,然后就可以從無(wú)標(biāo)簽數(shù)據(jù)進(jìn)行第二次聯(lián)想,再聯(lián)想到有標(biāo)簽數(shù)據(jù)。這樣就形成了一個(gè)“聯(lián)想循環(huán)”。那么,你就可以把這個(gè)循環(huán)開頭的那個(gè)標(biāo)簽和最后聯(lián)想到的標(biāo)簽做對(duì)比。我們的目標(biāo)是建立連續(xù)的聯(lián)想循環(huán),意思就是說(shuō)循環(huán)中的標(biāo)簽都是相同的。我們給這個(gè)過(guò)程建立了一個(gè)損失函數(shù),然后通過(guò)實(shí)驗(yàn)表明了這個(gè)方法可以極其有效地用更少的數(shù)據(jù)訓(xùn)練分類神經(jīng)網(wǎng)絡(luò)。
你在谷歌實(shí)習(xí)期間有發(fā)表論文嗎?
有的,我寫了一篇論文并且提交到了CVPR,這是世界上最大的計(jì)算機(jī)視覺(jué)會(huì)議;我還在CVPR 2017現(xiàn)場(chǎng)展示了這篇論文。出席大會(huì)的旅費(fèi)也是谷歌出的,所以這段實(shí)習(xí)經(jīng)歷不僅給我?guī)?lái)了很多業(yè)界公司的經(jīng)驗(yàn),而且也讓我發(fā)表了一篇引以為豪的論文。
你在實(shí)習(xí)期間所做的研究和你的博士研究題目聯(lián)系緊密嗎?
剛開始的時(shí)候,我和谷歌大腦團(tuán)隊(duì)的人一起探索了很多不同的題目,最后選中的這個(gè)和我的博士研究題目配合得非常完美。另外,即便做一個(gè)和博士研究題目完全沒(méi)有關(guān)系的項(xiàng)目也會(huì)有很大幫助,比如在編程和項(xiàng)目管理技能方面。
你自己寫代碼了嗎?
寫了好多呢!我尤其要感謝谷歌的代碼審查,讓我的代碼質(zhì)量提高了很多,而且讓我對(duì)代碼風(fēng)格和可拓展性也做了很多思考。谷歌允許代碼開源的這一點(diǎn)也讓我很高興,這就跟研究領(lǐng)域的慣例是一樣的。這樣一來(lái),我在谷歌之外也可以繼續(xù)研究這個(gè)題目,并和全世界的研究人員一起共享這些代碼。我還寫了一篇后續(xù)論文“聯(lián)想領(lǐng)域適應(yīng)(Associative Domain Adaptation)”,剛剛也被 ICCV 接收了。
現(xiàn)在你在谷歌實(shí)習(xí)已經(jīng)是第二次了,你回到谷歌有哪些原因?
谷歌里面有趣的研究項(xiàng)目太多了,一次實(shí)習(xí)經(jīng)歷怎么能夠呢?哈哈,不開玩笑了,Sylvain Gelly 團(tuán)隊(duì)有一個(gè)非常有趣的項(xiàng)目邀請(qǐng)我參加。去年我就和他和他的同事碰過(guò)面,他們?nèi)硕己馨,我不想錯(cuò)過(guò)這個(gè)和他們一起工作的機(jī)會(huì)。
在谷歌的這段時(shí)間里,你都學(xué)到了哪些關(guān)鍵技能?
我的代碼質(zhì)量提高了很多。在谷歌有機(jī)會(huì)跟著有很多經(jīng)驗(yàn)而且非常聰明的編程人員身上學(xué)習(xí),他們寫的代碼完善、快速,而且他們還能教你如何寫出這樣的代碼。我還和谷歌中很多不同團(tuán)隊(duì)、不同背景的人都建立了聯(lián)系;我遇到了一些優(yōu)秀的產(chǎn)品經(jīng)理,給我講了他們?cè)O(shè)計(jì)成功的產(chǎn)品的時(shí)候都有哪些深入的見(jiàn)解。我甚至還跟他們一起開發(fā)了一個(gè)新的YouTube功能,因?yàn)槲覄偤檬且粋(gè)YouTube內(nèi)容開發(fā)者。其實(shí)還有很多,我最后再說(shuō)一點(diǎn),我在谷歌內(nèi)部的健身中心里加入了一個(gè)“最強(qiáng)泥人”團(tuán)隊(duì),經(jīng)過(guò)鍛煉以后我的身體素質(zhì)也有提升。
這段實(shí)習(xí)經(jīng)歷對(duì)你的博士學(xué)業(yè)有哪些影響?
現(xiàn)在回頭來(lái)看的話,這段實(shí)習(xí)經(jīng)歷是我博士期間重要的里程碑。我申請(qǐng)實(shí)習(xí)的時(shí)候其實(shí)沒(méi)有期待它會(huì)幫我改變一切,但是我覺(jué)得自己結(jié)束實(shí)習(xí)的時(shí)候是帶著滿腦子的新點(diǎn)子和渾身的動(dòng)力回到學(xué)校的。
那根據(jù)你現(xiàn)在的經(jīng)驗(yàn)做個(gè)回顧:你覺(jué)得博士生應(yīng)該申請(qǐng)去谷歌實(shí)習(xí)嗎?有什么建議給他們嗎?
當(dāng)你的博士讀到一半的時(shí)候,肯定會(huì)有那種覺(jué)得自己困在問(wèn)題里走不出去的時(shí)候。這時(shí)候你就需要接觸一些新東西。還可以是當(dāng)你想試著做一個(gè)需要用到1000個(gè)GPU的實(shí)驗(yàn)的時(shí)候;或者是當(dāng)你覺(jué)得自己無(wú)所不知無(wú)所不能、想要挑戰(zhàn)自己的時(shí)候;又或者是你開始考慮博士畢業(yè)之后做什么,你在想象寫大型程序、帶來(lái)大的改變會(huì)是什么感覺(jué)。我覺(jué)得一段實(shí)習(xí)經(jīng)歷可以有很多不同的理由。那么谷歌也就是一個(gè)很有意思的地方,可以挑戰(zhàn)自己,也可以收獲一篇好論文、一群好朋友、各種好點(diǎn)子,甚至在谷歌工作的機(jī)會(huì)。
中國(guó)-博士人才網(wǎng)發(fā)布
聲明提示:凡本網(wǎng)注明“來(lái)源:XXX”的文/圖等稿件,本網(wǎng)轉(zhuǎn)載出于傳遞更多信息及方便產(chǎn)業(yè)探討之目的,并不意味著本站贊同其觀點(diǎn)或證實(shí)其內(nèi)容的真實(shí)性,文章內(nèi)容僅供參考。