今日頭條的問答社群準備怎麼玩

才智咖 人氣:2.52W

引導語:今日頭條的問答社群準備怎麼玩?用今日頭條演算法構架師曹歡歡的說法,頭條問答關注的是「更廣泛的問題」,「我們希望這上面有很專業的問題,但是我們覆蓋的是幾億使用者,所以也會覆蓋到一些並不專業、但是使用者有需求的問題,總的來說我們在覆蓋面上有一定的優勢。」

今日頭條的問答社群準備怎麼玩

2016 年,已經醞釀良久的知識分享終於呈現出了爆發式發展。除了在這個領域深耕多年的知乎和果殼分別以不同形式實現了產品形態和商業模式上的突破之外,包括百度、微博、喜馬拉雅等更多的力量開始突圍。就在今年,這其中也出現了今日頭條的身影。

今年 4 月,今日頭條的頭條問答欄目正式上線。這個聚集了 6 億使用者的內容分發平臺似乎在各個角度上,都與人們定義的「消費升級」前提下的知識付費浪潮調性不符合,但是在 11 月的世界網際網路大會上,今日頭條 CEO 張一鳴曾經這樣介紹過頭條問答的機制:「傳統意義上的問答基本上都是基於社交模式,存在很多問題,在我看來這恰恰是人工智慧和演算法可以解決的。」

也就是說,在依託於今日頭條的頭條問答上,演算法可以幫助使用者在 6 億使用者和 30 多萬個「作者」中找到最適合回答某個問題的「專家」,也可以把最「合適」的問答內容推送到最需要閱讀他們的人。更關鍵的是,今日頭條還希望未來演算法可以根據熱門事件自動生成問題:在頭條問答上,你大概不會看到類似於「謝邀」的寒暄,因為回答這些問題的「邀請」大多數是由機器發出的,甚至問題和答案都是由機器提供的。

看上去這又是今日頭條基於「效率先於價值」推出的一款產品。能夠支撐起這套系統執行的則是使用者留存在今日頭條上的海量資料分析,以及這家公司一直視為生命根基的人工智慧演算法。

用演算法驅動的問答社群到底什麼樣?

用今日頭條演算法構架師曹歡歡的說法,頭條問答關注的是「更廣泛的問題」,「我們希望這上面有很專業的問題,但是我們覆蓋的是幾億使用者,所以也會覆蓋到一些並不專業、但是使用者有需求的問題,總的來說我們在覆蓋面上有一定的優勢。」

開啟今日頭條的問答頻道,你會發現這裡人們關心的問題和知乎不太一樣,調性也更加「接地氣」。你可能看到的是類似於「俄羅斯大使在土耳其安卡拉被殺會造成哪些影響」這樣的專業性問題,也有可能看到「李小璐為什麼會嫁給賈乃亮」之類的八卦分析,發生這一切可能性的前提,都要看你平常是如何「調教」今日頭條 app。

不過就現階段來說,這個用機器驅動的問答系統並不成熟,它還不能很好的完成「個性化分發」的任務。相比於今日頭條上的內容分發,頭條問答的內容分發是比單純的新聞內容個性化推薦更加複雜的領域,因為它涉及到的不是「內容和讀者」兩方之間的關係,而是擴充套件到了「問題、答案、讀者、專家」等更多維度的關係。

具體到問答領域的難點,曹歡歡認為可以總結為以下六個方面,分別是:

問題分發:如何為使用者的提問快速找到最適合回答的專家,並且提供高質的回答。

答案質量:是否很好的回答問題,其中包括能否有效處理答非所問、答案配圖無關等問題。

答案排序:在同一問題下,機器能否給出比較好的答案排序,該排序對瀏覽使用者和創作者是否都比較友好。

問題配圖:使用者提問的時候,系統能否給出合適並且優質的配圖候選。

問題自動生成:碰到一些熱門的新聞或者使用者津津樂道的話題時,系統能否快速的自動生成問題並且配以生動的描述。

問題去重:對於重複的問題,機器能否聚合,怎樣做到高準確的召回。

知識表示、推理和內容分發領域涉及到深度學習、概率圖模型、矩陣分解和稀疏方法、決策樹等理論和技術。而關於現階段如何更好的解決這些技術難題,今日頭條的方法是把頭條問答上的資料開放,以實際問題作為題目舉辦一場演算法比賽。

事實上,用演算法大賽驅動演算法和實際問題解決方案的進步一直是科技界的傳統。其中最著名的應該就是 2006 年 Netflix 在舉辦的百萬美金 Netflix Prize,就曾經為該公司帶來過包括演算法、人才和品牌價值上的豐厚回報。其中在業界,這次大賽帶來的最直接影響就是關於「推薦」演算法上的突破性進步。

於是在這次人工智慧學會聯合IEEE中國和今日頭條聯合舉辦的這場「2016 Byte Cup 國際機器學習競賽」,上述的第一個問題「為使用者的提問快速找到最合適的人,並且提供高質量的問答」就被直接列為了比賽題目。而具體任務則是建立模型,預測某個專家可以回答某個問題的概率。經過幾個月的比賽後,11 月 17 日,今日頭條最終公佈了比賽結果,一支由中科院和喬治亞理工兩校博士組成的隊伍最終獲得了第一名,他們同樣也會獲得5000美金的現金酬勞。

當然,由學界和今日頭條共同主辦的這次比賽顯然還不能與 Netflix Prize 相提並論,「其實過去所有機器學習的比賽都是圍繞著 Netflix Prize 來做的,現在大家通用的推薦演算法也是在 Netflix Prize 獲獎方案的基礎上去做,所以今日頭條的這次演算法大賽希望做的是一個『差不多』的比賽,但同時不要太難。」今日頭條實驗室總監李磊表示。

而目前就比賽的結果來說,最終獲勝的前三名的確也為頭條問答的演算法創新帶來了一定啟發。「比賽中提出了一些非常新穎的想法,比如冠軍隊伍的雙向非對標 SVD + +,亞軍隊伍提出利用問題-作者資料構建無向圖,再利用隨機漫步路徑模擬文件,從而借用 word2vec 模型獲得問題-作者對偶向量,都非常有趣,而且實際中確實對演算法效果有改進,非常難得。」曹歡歡表示。

為什麼人工智慧對問答系統越來越重要?

雖然頭條問答是 2016 年今日頭條剛剛啟動的專案,但是根據曹歡歡介紹,頭條問答上的問題閱讀率和回答資料已經和知乎非常接近。

用演算法驅動這個問答社群為什麼會變得重要?如果從今日頭條的產品形態來說,提高提問者和專家、問題和合適的答案,以及這些內容和普通使用者之間的「匹配」效率可能是最主要的原因。而且,今日頭條已經聚集了 39 萬頭條號作者,這些作者中不乏各個領域中的專家,當他們以「專家」形態參與到頭條問答中時,這些作者的內容價值輸出渠道也變得更加豐富。

這大概也是今日頭條進一步完善平臺內容生態的重要方式。在鑄造內容平臺這道圍城時,今日頭條在籠絡了大量使用者和頭條號作者後,一直希望用短視訊、圖片等形式完善自己的內容矩陣。而頭條問答則成為了今日頭條為提升頭條作者價值的`另一個陣地和渠道,對於那些提供優秀答案的作者,系統會突出展示其頭條號的名稱,從而增強其頭條號作者的影響力和活躍度。

因此就現階段來說,匹配機制還不夠完善的頭條問答對於頭條作者的意義也許大於普通使用者。由於覆蓋的使用者數量巨大,所以頭條問答的社群氛圍顯然和我們現在熟知的問答社群不太一樣。在以「社交」為驅動和紐帶的問答社群中,feed 流中大多還是以時間軸和使用者關注人以及他們關注的問題組成。但是不能否認的是,單從產品形態來說,機器學習也許可以提高問答社群的運轉效率,讓長尾問答內容需求得到滿足。

比如 IT 技術問答網站 Stackoverflow 就已經引入了智慧推薦機制,不過這個平臺上的問題通常比較具體,而且答案是唯一的。在今日頭條今年剛剛成立的演算法實驗室裡,針對於實時性問題的「自動問答」解決方案已經成為團隊研究的一個重點。「我們相信關於一些事實性問題,類似《哈利·波特》的作者是誰,現任美國總統是誰這類事實性問題,機器能夠像百科全書一樣自動回答。單單放在頭條問答領域,也可以節省專家人力,提高效率。」今日頭條實驗室總監李磊表示。

今日頭條實驗室裡的另外一個研究重點是概率推理演算法研究,「這方面研究的意義是,希望機器不只是能從資料裡快速學到東西,還希望能夠做到在不確定的文本里做出推理,綜合模糊的因素做出判斷。」

可以肯定的是,現階段,針對一些需要展示「觀點」的問題,能夠做的除了提高分發匹配效率,機器能做的還很少。不過我們依然可以期待的一點是,在未來問答社群的產品形態裡,機器和人分別能夠扮演什麼樣的角色,以及這種趨勢對已經爆發的付費問答領域會帶來什麼樣的影響。