終于,計算機視覺技術在中國迎來了它最好的時代。智能圖像采集設備的普及,使得機器能夠“看清”世界——然而我們并不滿足于此:我們的目標是利用人工智能技術,讓機器能夠真正“看懂”這個世界。
這是一個充滿挑戰(zhàn)的任務,正如華為諾亞方舟實驗室計算視覺首席科學家田奇博士指出的那樣:
“基于標注數據的監(jiān)督學習所帶來的紅利期已接近尾聲,現在業(yè)界亟需高效利用海量無標注數據(數據高效)的新學習范式。”
如今,越來越多的人工智能應用需要建立在“看懂世界”的基礎上。
- 例如,受到廣泛關注的L4/L5級智能駕駛,需要建立在強大的環(huán)境感知基礎上——這對計算機視覺技術提出了極為苛刻的要求;
- 又如智慧城市,如何能在人流密集的街頭做到跨域行人重識別(ReID),同樣是計算機視覺所面臨的巨大挑戰(zhàn);
- 同時,計算機視覺算法的成熟還將為終端視覺帶來質的飛躍,AI技術為圖像視頻質量增強提供了有力的武器,而超分辨率、失焦修復等也已成為手機攝像的標準配置。
總之,面向場景應用的計算機視覺技術,不僅為人們的生活增添了更多便捷,也將進一步推動人類社會走向更加智能與精彩的未來。
當然,這一切的背后少不了科學團隊的支持。
目前,田奇博士帶領的團隊主要研究重心聚焦在數據高效和能耗高效的計算機視覺基礎研究。
為了從海量無標簽數據中挖掘有用的知識,就需要數據高效的學習算法;而為了讓動輒上千萬參數量的網絡模型在各種終端設備中順暢運行,能耗高效的模型適配也是他們的研究重點之一。
落實到具體業(yè)務,計算視覺研究主要針對六大方向:底層視覺、語義理解、3D視覺、數據生成、視覺計算、視覺+X模態(tài)。得益于爆發(fā)式的應用場景以及AI人才紅利,中國的計算機視覺研究也開啟了加速模式。
當前,由田奇博士帶領的研發(fā)團隊在許多方面已經居于世界領先地位。
- 例如,在業(yè)界公認最為重要的圖像分類數據集ImageNet上,田奇博士的團隊利用高效的數據擴增算法,在不使用額外訓練數據的情況下,達到了85.8%的分類準確率,打破了谷歌多年來對這一賽道的壟斷。
- 同時,利用在自動網絡架構搜索方面取得的持續(xù)性突破(代表性工作包括P-DARTS、PC-DARTS、Stabilizing DARTS、Latency-Aware DARTS等),團隊也能夠完成從云側大模型到端側小模型的適配,在受限算力下依然保持業(yè)界領先水平。
在過去一年多的時間里,他們還研發(fā)了許多先進技術并中稿了80多篇計算機視覺頂會論文,其中多項技術已經在華為內部多個應用場景中獲得驗證與應用。
這些計算機視覺領域的創(chuàng)新研究進展將在華為開發(fā)者大會2020(Cloud)上與來自全球的科學家與優(yōu)秀AI開發(fā)者共同分享。
作為大會預告,田奇博士也提前劇透了一個令人滿懷期待的消息:
“此次他們將發(fā)布“華為視覺計劃”,他還進一步強調,這項計劃的發(fā)布,標志著華為將以更積極的姿態(tài),投身計算機視覺前沿探索,與業(yè)界一起邁向真正的人工智能時代。”

華為開發(fā)者大會2020(Cloud)
3月27日~28日期間面向全球開發(fā)者開啟線上直播
華為開發(fā)者大會HDC.Cloud是華為面向ICT(信息與通信)領域全球開發(fā)者的年度頂級旗艦活動,這也是一場包括田奇博士在內的眾多大神云集的線上活動。(延伸閱讀:華為開發(fā)者大會HDC.Cloud 的核心看點,這張圖承包了)

田奇博士
華為諾亞方舟實驗室計算視覺首席科學家
作為計算機視覺領域的資深專家,田奇博士從事該領域相關研究已經長達20多年:
- 在美國大學任教期間做了許多基礎研究,并于2010年獲Google Faculty Research Award, 2017年UTSA校長杰出研究獎。由于在多媒體信息檢索(for contributions to Multimedia Information Retrieval)方面的杰出貢獻,他于2016年初獲評IEEE Fellow、多媒體領域10大最具影響力的學者。
- 2018年,田奇博士全職加入華為,任諾亞方舟實驗室計算視覺首席科學家,主導視覺方向的前沿研究,并落實在終端手機、自動駕駛、網絡運維大腦、平安城市等方向上的算法競爭力。
- 并于2018年入選國家第十四批“千人計劃”創(chuàng)新項目,教育部長江講座教授、國家自然科學基金海外杰青,中國科學院海外評審專家,國家自然科學基金會評專家,在清華大學神經與認知計算中心、中科院計算所、中科大、浙江大學、上海交通大學、西安交通大學、大連理工大學、西安電子科技大學等任講席教授或者客座教授,并曾在Microsoft Research Asia、UIUC、NEC Lab等多個單位訪問工作。
- 田奇博士是2015年ACM International Conference on Multimedia的大會主席,在2009年任會務主席,2012年任技術演示主席,并在2011-2014、2016-2018, 2020等多次會議中任領域主席。在其它計算機視覺頂會如CVPR、ICCV、ECCV等也多次任領域主席。他是SIGMM Executive Committee Member (2019-2023) 和IEEE Circuits and Systems Society VSPC 技術委員會主席(2018-2020)。他同時是IEEE TMM, TCSVT, TNNLS, ACM TOMM、Multimedia Systems Journal等多個期刊的Associate Editor。
- 他擁有多項美國專利,在計算機視覺及多媒體方向頂級期刊及會議如IEEE TPAMI,IJCV,TIP,TMM,CVPR, ICCV,ECCV,ACM MM, NeurIPS上發(fā)表文章約550+余篇(包括250+ 篇IEEE/ACM期刊和150+篇CCF A類會議文章),谷歌學術引用次數超過19300+余次,h-index為69,有7篇論文獲最佳論文獎或者最佳學生論文。
想知道田奇博士如何為AI造“眼”嗎?
關注華為開發(fā)者大會2020(Cloud)
與全球AI開發(fā)者一起開啟你的智慧之眼!
今日份有獎互動
關于人工智能
你有什么想問田奇博士的呢?
下方留言告訴我們
3月30日將由田奇博士選出一位幸運兒
送出以下獎品
華為手環(huán)一個

