就在2019年7月30日,“靈犬3.0”發(fā)布,升級(jí)了識(shí)別類型和模型能力,支持圖片識(shí)別(反色情低俗、反血腥暴力)和文本識(shí)別(反色情低俗、反暴力謾罵、反標(biāo)題黨)。
快手則在下架風(fēng)波時(shí)回應(yīng)稱正全面整改中,采取對(duì)現(xiàn)有庫(kù)存視頻加大清查力度、控制每日短視頻上傳總量等7大措施,并將審核團(tuán)隊(duì)從2000人擴(kuò)充至5000人。其招聘信息顯示,“內(nèi)容審核編輯”的工作要求為:審核用戶上傳到快手的視頻、圖片、評(píng)論的合法性、合規(guī)性,對(duì)違規(guī)賬號(hào)進(jìn)行合理處置,維護(hù)社區(qū)的綠色與健康。
除了建立自己的風(fēng)控體系之外,一些公司也會(huì)去找第三方合作。
為各類平臺(tái)提供審核服務(wù)的從業(yè)者江洋對(duì)燃財(cái)經(jīng)表示,人工審核和機(jī)器審核相輔相成,有一部分機(jī)器不能攔截到的東西,通過(guò)人工去提供一些標(biāo)簽,算法就可以去驗(yàn)證,同時(shí)捕捉到跟這個(gè)賬號(hào)有關(guān)聯(lián)的群組和賬號(hào),這樣效率會(huì)更高。
內(nèi)容審核難在哪兒?
即使企業(yè)大力審核,各類APP仍然難逃被下架的命運(yùn)。那么,內(nèi)容審核難在哪兒?有哪些新模式與技術(shù)應(yīng)用在審核上?
江洋告訴燃財(cái)經(jīng),目前審核方面的技術(shù)已經(jīng)經(jīng)歷了四個(gè)階段。
第一代審核解決方案以名單類(如黑名單)等方案為主,技術(shù)上比較簡(jiǎn)單,建立基于數(shù)據(jù)的名單,根據(jù)一些關(guān)鍵詞,并通過(guò)大數(shù)據(jù)AI技術(shù)收集數(shù)據(jù)名單中的有效信號(hào),攔截相關(guān)信息。
第二代審核方式由公司啟用專家系統(tǒng),即把行業(yè)專家多年積累的風(fēng)控和業(yè)務(wù)知識(shí)通過(guò)系統(tǒng)的方案固化下來(lái),做出一些攔截欺詐的規(guī)則模型,并在風(fēng)控中做一些自動(dòng)化的決策。比如可以設(shè)置一個(gè)賬號(hào)發(fā)廣告不能發(fā)超過(guò)50條,到第51條賬號(hào)就會(huì)被封。
第三代開(kāi)始了機(jī)器學(xué)習(xí),或者說(shuō)有監(jiān)督的機(jī)器學(xué)習(xí)。即給風(fēng)控案例或數(shù)據(jù)做一些標(biāo)簽,通過(guò)各種機(jī)器學(xué)習(xí)的手段,把它固化成模型,通過(guò)不停的迭代,做風(fēng)控和反欺詐方面的決策。
他舉例,比如系統(tǒng)監(jiān)測(cè)到某賬號(hào)或登陸IP之前有過(guò)欺詐行為,通過(guò)這些有限的數(shù)據(jù)讓機(jī)器去學(xué)習(xí),總結(jié)出一些規(guī)則來(lái)攔截。例如有的用戶把涉黃的詞匯用拼音代替,或加一個(gè)隔斷符號(hào),機(jī)器可以通過(guò)一千條類似的文本學(xué)習(xí)到這個(gè)規(guī)則,有效攔截掉類似的不良內(nèi)容,這種方法強(qiáng)依賴于大量打上標(biāo)簽的數(shù)據(jù)。
第四代審核技術(shù)則進(jìn)入了無(wú)監(jiān)督的機(jī)器學(xué)習(xí),對(duì)于很多缺乏標(biāo)簽的問(wèn)題和不斷更新進(jìn)化的新問(wèn)題,運(yùn)用無(wú)監(jiān)督機(jī)器學(xué)習(xí)檢測(cè)信息。
江洋表示,現(xiàn)代的欺詐和黑產(chǎn)趨向于群組性的行動(dòng),這樣的組織甚至有上中下游產(chǎn)業(yè)鏈,可能購(gòu)買了1萬(wàn)個(gè)賬號(hào)通過(guò)群控的軟件發(fā)布違規(guī)信息。這些賬戶的行為比較異常,且多個(gè)賬號(hào)有緊密聯(lián)系,無(wú)監(jiān)督機(jī)器學(xué)習(xí)就是利用了這一點(diǎn),比如賬號(hào)注冊(cè)時(shí)間在某個(gè)時(shí)間段內(nèi),IP有時(shí)在美國(guó),有時(shí)在越南,賬號(hào)之間可能存在過(guò)交易行為,交易數(shù)額在一定范圍內(nèi)。在這樣的情況下,即便沒(méi)有數(shù)據(jù)貼標(biāo)簽,系統(tǒng)也能捕捉出來(lái)群組進(jìn)行攔截。
他舉例解釋第三代和第四代的差別,比如一群貓和狗混在一起,有監(jiān)督的機(jī)器學(xué)習(xí)需要一條一條的列出貓的胡須長(zhǎng)、走路更輕等,把這些特征各打一個(gè)標(biāo)簽,再到群組里去識(shí)別匹配,而無(wú)監(jiān)督的機(jī)器學(xué)習(xí)是在沒(méi)有標(biāo)簽的時(shí)候,通過(guò)這些動(dòng)物之間的特性和關(guān)系來(lái)區(qū)分。
但是,如果不是有組織大批量的賬號(hào)行為,可能就需要人工審核或其它輿情監(jiān)測(cè)的平臺(tái)來(lái)輔助。目前各平臺(tái)采用的多是系統(tǒng)攔截加人工的方式,有規(guī)則、黑名單、人工智能風(fēng)控,也有人工審核,二者結(jié)合進(jìn)行欺詐信息和不良內(nèi)容的清洗。
除了技術(shù)因素之外,平臺(tái)的主觀選擇也是一大重要因素,很多社交平臺(tái)存在涉黃問(wèn)題,但如果不打擦邊球,平臺(tái)活躍度可能降低。所以,在審核上,一方面黑產(chǎn)組織在不斷與規(guī)則作斗爭(zhēng),開(kāi)發(fā)新模式,再加上用戶數(shù)巨大,技術(shù)加人工的審核難度依然不小,另一方面,平臺(tái)在權(quán)衡內(nèi)容和活躍度的時(shí)候,也要做出取舍。
推薦虛假種草帖需擔(dān)責(zé)
小紅書平臺(tái)上用戶發(fā)布違規(guī)內(nèi)容,板子是否該打到小紅書身上?
中國(guó)政法大學(xué)傳播法研究中心副主任朱巍對(duì)燃財(cái)經(jīng)表示,小紅書上的“種草帖”本質(zhì)上就是廣告,因?yàn)樗鼈兌伎梢酝ㄟ^(guò)內(nèi)容引流直接變現(xiàn),按照2016年《互聯(lián)網(wǎng)廣告管理暫行辦法》的規(guī)定,媒介方平臺(tái)經(jīng)營(yíng)者、廣告信息交換平臺(tái)經(jīng)營(yíng)者以及媒介方平臺(tái)成員,對(duì)其明知或者應(yīng)知的違法廣告,應(yīng)當(dāng)采取刪除、屏蔽、斷開(kāi)鏈接等技術(shù)措施和管理措施,予以制止。
朱巍指出,假如一個(gè)用戶發(fā)布了內(nèi)容,平臺(tái)沒(méi)有推薦,點(diǎn)擊量不高,小紅書不承擔(dān)責(zé)任。但如果是一些小紅書進(jìn)行算法推薦且內(nèi)容達(dá)到很高的瀏覽量和成交額的內(nèi)容出了問(wèn)題,或是用戶舉報(bào)平臺(tái)不處理、競(jìng)價(jià)排行內(nèi)容出問(wèn)題、賣家留的聯(lián)系方式是虛假等情況,小紅書要承擔(dān)連帶責(zé)任。
“小紅書的模式可以說(shuō)是社交電商中最成功的一種模式,獲得了大量用戶的信任,F(xiàn)在問(wèn)題出來(lái),對(duì)小紅書來(lái)說(shuō)未必是壞事。小紅書應(yīng)該把籬笆墻扎好,用更高的水平來(lái)要求自己。這并非是提高運(yùn)營(yíng)成本,而是以用戶的信任和保障產(chǎn)品質(zhì)量為基礎(chǔ),將來(lái)會(huì)更多地占有市場(chǎng)。”朱巍表示。
小紅書原本在商業(yè)化之路上就面臨著保證用戶體驗(yàn)與合理變現(xiàn)的挑戰(zhàn),如今,強(qiáng)化審核走向合規(guī)成為了更急迫的命題。
文中江洋為化名。
來(lái)源:燃財(cái)經(jīng) 唐亞華
共2頁(yè) 上一頁(yè) [1] [2]
關(guān)注公號(hào):redshcom 關(guān)注更多: 小紅書