AI落地場景在不斷增多,但賺錢依舊艱難。
根據(jù)億歐報告顯示,2018年全年,近90%的人工智能公司處于虧損狀態(tài),而10%賺錢的企業(yè)基本是技術提供商。從談概念、講技術,到拼場景、搶落地,建立在大數(shù)據(jù)基礎之上的人工智能,仍面臨數(shù)據(jù)本身帶來的挑戰(zhàn)。
數(shù)據(jù)割裂致使落地難
“我們經(jīng)常提及大數(shù)據(jù),但事實上我們并不需要那么多的數(shù)據(jù),AI未來一個趨勢是小數(shù)據(jù)崛起。”在市北·GMIS 2019全球數(shù)據(jù)智能峰會上,斯坦福大學教授、Landing.ai創(chuàng)始人、CEO吳恩達表示。
一個具體的案例是工廠手機屏幕劃痕檢測。目前不少是利用人眼來檢測手機是否存在劃痕,如果擁有100萬個劃痕手機,AI可以非常高效的識別手機劃痕。但現(xiàn)實情況是沒有任何工廠會有幾百萬不同劃痕的手機,這個時候小樣本學習(few shot learning),即利用較少的數(shù)據(jù)得出同樣準確結論的人工智能,將有助于推動整個領域的發(fā)展。
小樣本學習的迫切性更在于落地過程面臨的數(shù)據(jù)孤島、數(shù)據(jù)隱私保護導致的數(shù)據(jù)割裂問題,讓AI技術很難充分發(fā)揮價值。
“和AI用于比賽需要上千萬的圖片訓練不同,當AI深入行業(yè)我們看到數(shù)據(jù)往往是小數(shù)據(jù)和細碎的數(shù)據(jù),也就是沒有聯(lián)通起來的數(shù)據(jù),再先進的AI技術也很難用上。”國際人工智能學會理事長、香港科技大學教授、微眾銀行首席人工智能官楊強說道。
今年5月,國家互聯(lián)網(wǎng)信息辦公室發(fā)布了《數(shù)據(jù)安全管理辦法(征求意見稿)》,提出在中國境內(nèi)利用網(wǎng)絡開展數(shù)據(jù)、存儲、傳輸、處理、使用等活動,以及數(shù)據(jù)安全的保護和監(jiān)督管理意見。
楊強認為“中國版GDPR”即將到來,數(shù)據(jù)隱私在走向嚴格化、全面化,這使得企業(yè)在實際應用中可以使用的數(shù)據(jù)維度和范圍并不大。數(shù)據(jù)隱私保護的趨嚴,為人工智能技術升級提供了契機。
以保險行業(yè)利用AI進行個性化定價為例,背后需要業(yè)務數(shù)據(jù)和用戶互聯(lián)網(wǎng)行為數(shù)據(jù)融合,理想的狀態(tài)是可以拿到非常豐富的用戶畫像,與用戶的ID高度匹配,但實際情況迫于隱私、安全、法規(guī)等原因,企業(yè)可以應用的數(shù)據(jù)是非常有限的。
再例如在小微企業(yè)貸款應用方面,AI需要引入票據(jù)數(shù)據(jù)、資產(chǎn)數(shù)據(jù)、輿情數(shù)據(jù)等,但由于數(shù)據(jù)的割裂,實際應用中只能使用一些政府的數(shù)據(jù),例如央行的征信報告,但這些報告只能覆蓋不到10%的人群。這一問題在醫(yī)療領域更為明顯,不同醫(yī)院的醫(yī)療影像數(shù)據(jù)很難匯聚到一起,形成大數(shù)據(jù)來訓練一個醫(yī)療模型。
“小數(shù)據(jù)”崛起
針對數(shù)據(jù)割裂帶來的人工智能落地難問題,楊強提出了聯(lián)邦學習。所謂聯(lián)邦學習,是多個數(shù)據(jù)方之間組成一個聯(lián)盟,共同參與到全局建模的建設中,各方之間在保護數(shù)據(jù)隱私和模型參數(shù)基礎上,僅共享模型加密后的參數(shù),讓共享模型達到更優(yōu)的效果。
據(jù)楊強介紹,聯(lián)邦學習分為橫向聯(lián)邦和縱向聯(lián)邦,橫向聯(lián)邦是指企業(yè)各方數(shù)據(jù)維度相同、ID維度不同,更多存在于消費者應用中;縱向聯(lián)邦是指企業(yè)各方數(shù)據(jù)的ID維度相同(樣本重疊)、數(shù)據(jù)維度不同,更多存在于B端應用。
例如針對保險行業(yè)的個性化保險定價問題,一家互聯(lián)網(wǎng)企業(yè)和一家保險企業(yè)進行數(shù)據(jù)合作,這種合作數(shù)據(jù)的ID重合度相當大,數(shù)據(jù)特征維度大大增加,使模型的個性化定價效果顯著提升,為保險企業(yè)帶來8倍覆蓋率提升和1.5倍利潤率提升。
橫向聯(lián)邦學習方面,在手機行業(yè),通過在本地建立加密上傳的小模型,服務器端看不到內(nèi)容卻可以把模型匯聚起來,進行云端模型的更新,新的通用模型再釋放給手機,幫助用戶自動化進行圖片標注。這樣既保護了用戶隱私,也可以進行模型學習和更新。
楊強認為聯(lián)邦學習最大的優(yōu)勢是保證數(shù)據(jù)不出戶,通過生態(tài)在不同行業(yè)選取合作伙伴,用群體智能不斷提升模型效果。因此聯(lián)邦學習一定是多方共同協(xié)作組成一個聯(lián)盟,生態(tài)的建設十分重要。
面對AI落地難、盈利難問題,吳恩達則認為,在期待AI為企業(yè)帶來紅利之前,企業(yè)需要避免幾個陷阱。首先AI技術會影響很多企業(yè)做業(yè)務的核心,所以選擇項目是非常重要的,從小的項目開始,可以建立好的基礎,同時幫團隊獲得動能。
其次團隊建設不能僅依靠明星工程師,而是要建立一個完善的、跨學科、跨職能的團隊。同時不要期待AI立刻產(chǎn)生作用,而是要多次嘗試,對AI發(fā)展的回報曲線進行合理預算。不要使用傳統(tǒng)的流程評估人工智能項目,應該為AI項目團隊設立合適的KPI和目標。
“有關 AI 的應用越來越多了,但企業(yè)的 AI 轉型并不是開發(fā)一個 APP 這么簡單,不要指望AI解決所有的問題,也不要指望AI項目一次性就成功。”吳恩達表示。