人民網(wǎng)11月17日電,第三屆世界互聯(lián)網(wǎng)大會“移動互聯(lián)網(wǎng)論壇”在烏鎮(zhèn)舉行。論壇以“人工智能開啟互聯(lián)網(wǎng)新未來”為議題。今日頭條創(chuàng)始人、首席執(zhí)行官張一鳴為嘉賓帶來《信息平臺的智能浪潮》主題演講,以下為全文內(nèi)容:
大家上午好!人工智能浪潮在中國的互聯(lián)網(wǎng)領(lǐng)域非常洶涌,現(xiàn)在各家公司紛紛轉(zhuǎn)向使用人工智能推薦信息,今天前面幾位分享了很多技術(shù)和AI的應(yīng)用。我想著重和大家說一下信息平臺的人工智能浪潮。
我認(rèn)為人工智能首先是從信息開始的,在信息平臺上也是最容易取得成果的,開始之前請大家看一個視頻,來解釋一下什么叫智能的信息平臺。(觀看視頻)視頻介紹了一個頭條利用信息平臺,利用精準(zhǔn)的定位技術(shù),在尋人上的一個嘗試。大家想想之前我們找一個失蹤的人怎么發(fā)布信息的,我們可能發(fā)布信息在報紙中縫,報紙中縫上發(fā)布尋人信息很難找到人,過去頭版頭條非常珍貴,不能把尋人啟示放在頭版頭條上,今日頭條用人工智能技術(shù)能夠精準(zhǔn)定位誰最可能找到這個人,我就這兩千個人的頭條手機屏幕上顯示尋人啟示,實際上我們只是消耗了很好的閱讀量,現(xiàn)在我們已經(jīng)是中國找人速度最快、最多的平臺了,每一百個尋人信息,我們能夠找到13.75個人,現(xiàn)在已經(jīng)累計達到500個人了。從這樣一個小小的例子,可以看出人工智能在信息領(lǐng)域的應(yīng)用。
所以有很多人問我,頭條是不是一個媒體,你們公司為什么要招這么多人工智能工程師,我要解釋一下。我們公司是最早把算法結(jié)合在一個具體的應(yīng)用上,我們把算法工程產(chǎn)品應(yīng)用結(jié)合做了一個很好的推薦引擎應(yīng)用,在推薦引擎上首先推薦文字,文字不僅包括資訊也包括各種直播、圖片、尋人等等各種各樣的信息,所以我們更愿意把我們稱為一個智能化的信息平臺。到了上個月底,我們已經(jīng)累計有66億的激活用戶,每天每個用戶使用76分鐘,1.4億活躍用戶,這個數(shù)字在中國所有app當(dāng)中,按人均時長來算,應(yīng)該可以算前三名,和所有同類和資訊類對比時長長一倍以上,這也體現(xiàn)了AI技術(shù)在產(chǎn)品上的體現(xiàn),沒有人維護編輯信息,但是我們的產(chǎn)品使用時長遠超于同行。
很多人一說今日頭條,就說你們是個性化推薦引擎,其實人工智能不僅是個性化,不僅用在個性化推薦方面,至少包括四個領(lǐng)域的應(yīng)用,信息內(nèi)容的創(chuàng)作、分發(fā)、討論和審核,在奧運期間這個機器人累計發(fā)了四百多篇新聞,閱讀量超過一百萬,只有2秒鐘的寫作時間,點擊率超過了人寫的文章,在奧運期間也有報道,我們的機器人寫作不是僅僅把數(shù)字填充到模板上,但是可以看到列表當(dāng)中還會配圖片,機器人會自動從圖庫當(dāng)中選擇適合這篇報道的圖片。我們可以想象一下機器在財經(jīng)、氣象等等領(lǐng)域,未來都有可能機器進行創(chuàng)作,因為機器最快最準(zhǔn)確,這些相對標(biāo)準(zhǔn)化適時化的內(nèi)容很有可能讓機器替代創(chuàng)作,這是一個很好的案例,人工智能介入創(chuàng)作。
我們再來看分發(fā)階段,頭條在把人工智能用在分發(fā)上,可能業(yè)界比較了解,但是業(yè)界經(jīng)常以為我們僅僅是個性化推薦。我舉個例子,這個屏幕是我去年去波士頓遇到一個哈佛的學(xué)生,他和我說為什么我在波士頓能看到長沙的新聞,雖然我是一個長沙人,他是怎么知道的,我就問他,你在過去兩三年的春節(jié)有沒有回家呢?他說回家了。我和他說大概率是因為我們的機器猜到你春節(jié)回家了,你可能是一個長沙人,但是他說我又看不到很多的長沙新聞,為什么長沙市政府引進人才的新聞我們可以看到呢?我和他說我們確實不是因為你是長沙人就把長沙的新聞推薦給你,我們現(xiàn)在只是把在長沙的留學(xué)人才可能喜歡看的新聞推薦給你。他又問我,為什么長沙在外留學(xué)的人喜歡看這條新聞呢?我說并不是因為你看了這條新聞,因為其他長沙在外留學(xué)的人,他們點擊了這篇新聞,你和這些人類似,所以你會看到這篇新聞。這也是個性化推薦,其次體現(xiàn)了泛化,他并沒有看過這條長沙吸引高端人才回流的新聞,而是和他類似的人看過新聞,泛化就是我們在利用人之間的共同特征,把一個模式應(yīng)用到其他的人身上,不僅是你為自己推薦內(nèi)容,而是人人為人人推薦內(nèi)容。
數(shù)據(jù)積累方面,我們發(fā)現(xiàn)推薦系統(tǒng)具備這樣一個特點,首先是一個人用,一個人用的越久越好用,因為我知道你閱讀的數(shù)據(jù),這是個性化。第二個是越多人用越好用,越多人用可以找到類似的人群。第三個是數(shù)據(jù)的積累,我們看一下數(shù)據(jù)的積累,到目前為止我們有八百個算法方面的工程師,有兩萬臺處理器,有151條訓(xùn)練樣本,每天用戶請求60億次,這個請求在人工智能應(yīng)用當(dāng)中已經(jīng)是非常大的,有兩萬臺機器晝夜不停計算各種概率。
除了創(chuàng)作分發(fā),在互動方面人工智能參與非常多,我們經(jīng)常想問一個問題,但是我不知道這個問題問誰,不知道大家是否有這樣的經(jīng)歷,我有一個問題,不知道誰知道這個問題,我們可以在朋友圈問一下,如果有人懂這個方面,可能就會回答。我們分析問題領(lǐng)域,我們在所有的用戶當(dāng)中找到這個領(lǐng)域感興趣的人,這個人看過這個領(lǐng)域很多的文章,我們將把你的問題推薦給可能的回答者,我們判斷他有可能回答出高質(zhì)量的答案,把問題推薦給他,如果把問題回答出來以后,我們再判斷還有什么人對這個答案感興趣,再推薦給讀者,所以提問、回答、閱讀,這個匹配過程也是可以讓機器發(fā)揮非常重要的作用,很可能你感興趣的問題,我們不僅用問答的匹配,我們也在嘗試結(jié)構(gòu)化信息化的內(nèi)容,機器直接計算出答案,這就是基于計算的自動問答。
接下來就是審核方面,大家知道目前互聯(lián)網(wǎng)信息的爆炸有非常非常多內(nèi)容產(chǎn)生,很多內(nèi)容良莠不齊,我們需要把符合法律法規(guī)不符合公眾社會道德的內(nèi)容去除掉,現(xiàn)在頭條的內(nèi)容一個人看的話需要150天才能看完,如果兩個人看他們之間的準(zhǔn)確率只有75%,但是有機器處理準(zhǔn)確率可以達到87%,25分鐘就可以閱讀完,機器人可以比人更快的閱讀,找出其中的錯誤的部分,所以人工智能也用于審核。我覺得頭條是一個中國原創(chuàng)但是全球領(lǐng)先的,人工智能在信息領(lǐng)域的應(yīng)用,我們現(xiàn)在也在努力把這項技術(shù)這項產(chǎn)品推向全世界,謝謝大家!