您現在的位置是:首頁 > 旅遊首頁旅遊
我們是怎麼掉進個性推薦的怪圈?
獲取手機識別碼是什麼意思
本文圍繞個性推薦展開了一系列的分析思考,並主要講了獨立因素推薦、融合因素推薦、推薦方式以及回聲室陷阱等內容。
你剛在微信和朋友討論AJ款式,看公眾號就刷到了AJ的廣告,淘寶首頁也驚喜般地出現了AJ推薦;
晚上刷抖音總是刷個不停,感覺刷到的每一個影片都有某個點能戳中自己,你陷入尋找刺激的迴圈。
為什這些APP都知道你在想要什麼且清楚你的興奮點,是他們監控你的聊天記錄?
不,是你的
個人基礎資訊和行為資料
告訴了他們你需要這些,他們就把你的需要主動給到你罷了。
那他們是怎麼做到的呢?下面我們就來簡單探討下個性推薦。
這裡是文章的結構圖,圖和文章可以對照看,方便理解。
首先,個性推薦系統是為了解決資訊過載,透過個性化推薦提高資訊分發的效率和準確性,使得使用者更有粘性而被廣泛使用的系統。
通俗的說他就是為了讓你更爽,你要什麼我就給你什麼。
這很美好,但這裡有一個陷阱,
意思是你不要什麼我就少點給你或者不給你——你也就失去了與你意見相左的知識領域接觸的機會,單一的內容被推薦多了使用者也會感到疲勞。
個性推薦用在電商領域來說應該叫“精準投放”——你想買什麼淘寶就推薦給你什麼,這像是雙贏的感覺。
但對於內容領域(短影片等)來說,只推薦你有興趣的內容,刺激你興奮點的同時也讓你接觸世界的邊界越來越窄,
沉浸於自己營造的狹小的世界;
難道我們進入這種迴音室的怪圈之後就無法破解了嗎?
(
迴音室效應:
一些意見相近的聲音不斷重複,令身處其中的多數人認為這些聲音就是事實的全部。)
我們先不急著解答,待我們逐步探討下個性推薦的內容後,自己就能解答以上的問題;
獨立因素推薦
獨立因素推薦,就是推薦系統基於
單個因素
篩選的內容或商品推送給使用者;我們在瞭解獨立因素推薦的同時也瞭解下推薦的兩種模式被動推薦和主動推薦;
被動推薦
推薦是使用者被動的接收資訊,需要使用者去觸發而產生的推薦結果。
例如淘寶上使用者依據
價格區間的
獨立因素篩選商品,這種行為完全依據使用者有意識的自主操作告訴淘寶我需要特定獨立因素的商品,淘寶後臺會依據你的輸入資訊進而對前端的你進行反饋。
假如使用者不是選一個因素而是同時選擇價了
格區間+發貨地區+品牌
這三個獨立因素時,這時後臺進行篩選,把同時具備這幾個獨立因素的商品推薦給使用者,這只是多個獨立因素的簡單物理標籤相的加可以說還是屬於獨立因素推薦的範疇。(當然淘寶真實推薦結果更為複雜,因為有商品競價排名,這些都會影響推薦的結果,目前是舉例說明)
與之類似的還有
網易雲音樂的歌單廣場
,歌單廣場將歌單分為了
流行、民謠、電子等不同的類別,每一個類別就是一個因素,使用者選擇哪個因素的標籤,後臺系統就更新屬於該因素的歌單的資料給到前端介面上展示,這類都是獨立因素的被動推薦。
主動推薦
主動推薦,由系統定時更新資料並主動推薦到使用者面前,使用者開啟介面就能接觸到主動推薦的結果;如網易雲音樂的熱歌榜,抖音的人氣熱搜榜等就是主動推薦的方式。
但這種熱榜這種統一推薦的方式有一定程度的成
馬太效應
——火的內容會得到更多的曝光越來越火,但大部分人喜歡的內容並不帶代表每一個使用者都是喜愛的,
熱門推薦滿足使用者從眾心理的同時也忽略了使用者的個性差異體驗,
所以就需要依據使用者個性的推薦來彌補,隨著使用者對自我獨特性的感知越來越強,需要個性化定製的需求也越來越明顯。如何讓特定的內容滿足特定的使用者,讓使用者開開心心的走進個性推薦的陷阱裡就是接下來我們要講的重點。
融合因素推薦
融合因素推薦就是將幾個不同的因素依據特定演算法融合
而產生
新的屬性標籤
,並推薦到與該屬性標籤匹配的使用者手機上。
我們把融合因素推薦分為基於內容本身屬性推薦、基於內容屬性與使用者屬性協同推薦、基於相似使用者協同推薦這三種推薦方式。
基於內容本身屬性推薦(推薦物件一般是所有人)
還是以抖音熱門短影片為例,我們需要做的是依據內容的本身屬性建立
內容畫像,
用資料模型來表示內容的特徵。
由抖音熱搜榜可看到,我們把
點贊數
排名在前30的影片放上熱搜榜。
當然決定點贊數的因素除了影片內容本身的型別及質量外,
很大的關鍵還在於平臺給多少人推薦了這個影片,即有多少人可以刷到了這個影片。
平臺判斷一個影片是否值得推薦給更多的
使用者群體,
又與歷史使用者對影片的
互動行為息息相關。
例如:
短影片平臺將一個稽核過後的新影片先推薦給10w人的
基礎使用者池
進行播放展示,如果這10w人有很多人進行完全播放、點贊、評論、轉發等操作,平臺就判斷該影片為優質內容進而推薦給100w、1000w的使用者池如此類推。
如果該影片在10w的展示量中大部分使用者對該影片不感冒,很少播放完或點贊,就會減少該影片的展示量或不會再推薦給更多的使用者。
這形成一個優質內容能得到更多展示劣質內容減少展示的良性迴圈。(使用者池也分不同種類的使用者池,舉例用非真實資料)
這樣判斷一個影片能否進入到下一個使用者池的標準就成為了關鍵,現實中這個標準是根據模型動態變化的,現在我們先進行標準的性靜態分析這樣便於理解;根據下面初級的演算法公式可看到一個影片的優質程度與使用者對這個影片的喜愛程度成正比,我們先用使用者的喜愛程度這個特性來反應影片的優質程度。
影片優質度=使用者喜愛度 X 影片質量基數 X 題材類別基數 X 平臺廣告基數
影響使用者喜愛程度的獨立因素有使用者對影片的平均播放時長、點贊、評論、分享、關注以及不感興趣等操作,每一個操作都會為一個獨立因素增加數值;而且每個獨立因素對與平臺判斷使用者對影片的喜愛程度的重要性是不同的,如,分享>評論>點贊。我們用
權重
來表示,對喜愛度高的因素進行
資料加權,
資料加權一般有兩種常用方式;
自定義加權:
產品經理、運營經理依據平時的資料報表人為的定義這些獨立因素和設定權重因子的數值,這種方式比較直接也比較簡單,但他侷限於團隊的自身經驗,沒有經過大資料的驗證與現實還是有較大的偏差。
資料建模:
資料建模簡單的說就是將時間變數、獨立因素、權重因子透過特定的演算法公式進行計算得出該影片的一個優質度數值。根據這個數值進行推薦和排名,隨著時間變數的改變,獨立因子、甚至是權重因子也會依據一定的函式關係進行改變,整個模型的輸入和輸出都是動態變化的,而且我們不斷的採集使用者行為資料用來訓練模型使其更加接近現實預測的數值。
基於以上資訊我們就可以粗劣的得出一張反映使用者對影片喜愛程度的參考表,該表也可以反映出影片的優質程度;
使用者喜愛度=(播放時長量+點贊量+評論量+分享量 – 不感興趣量+…)X 權重因子 X 衰減因子
(正常情況下,需要對各個指標做線性方程迴歸分析,確定各個指標具有獨立性後,再做權重分析,以上面表格是非真實資料)
根據以上思路我們可以對影片進行優質程度和型別的評定,有了內容畫像現在只需找到對這個影片內容感興趣的使用者把影片推送給他就行了,下面就是我們要說到的基於內容屬性與使用者屬性的協同的推薦。
基於內容屬性與使用者屬性協同推薦(推薦給特定屬性的人)
我們透過採集一個人的基礎資訊和行為資料來對一個使用者做定性分析,得出一個使用者在網際網路及現實中的各種特徵,所有特徵整合在一起就成為一個代表現實中使用者的虛擬畫像。
構建使用者畫像資料會用到靜態和動態兩類資料:
靜態使用者畫像資料:我們在註冊APP時通常會輸入姓名、年齡、性別、允許獲取位置、這些基礎資訊相對穩定。
動態使用者畫像資料:使用者在平時生活對手機產生的操作行為,如你玩過的遊戲、關注的公眾號、消費記錄,有沒有房貸車貸發過紅包買過保險,這些行為最後都會變成幾千個事實標籤,用這些事實標籤構建模型計算
使用者的行為偏好。
(圖片來源於回形針PaperClip)
還是用上面提到的使用者對影片的喜愛度的情況為例。
當用戶刷抖音看到一個標籤為美女類的影片點了一個贊,並不意為者該使用者就喜歡看美女可能是不小心點的,這就需要更多的行為來判斷該使用者對美女類影片的喜愛程度;根據前面提到的初級公式:
對美女的喜愛權重=(播放時長量+點贊量+評論量+分享量 – 不感興趣量+…)X 權重因子 X 衰減因子
除了點贊、評論、分享,關注了某作者這些行為外還有一個時間的限定,
短期行為無法代表長期興趣,單次行為的權重會隨著時間流逝不斷衰減,
使用者每次開啟美女類內容都會生成一個興趣權重,把一段時間內你所有的美女類興趣權重進行累加,再用S型函式標準化就能得到一個0-10區間的興趣值,標籤值數值越高,就代表使用者對美女就越感興趣程度。
到了這裡平臺已可以計算出使用者對某一類影片的喜愛程度和厭惡程度,同時也對影片做了分類處理,可直接根據使用者的偏好將影片推薦給使用者。
平臺除了可以計算出使用者在內容興趣上面的權重外還可以在
消費能力、社交偏好等
方向進行建模計算,進而得出一個交為完整的
使用者畫像。
另外透過行為直接推薦影片的效果往往不如透過同類影片推薦,找到和你一樣的人,把他們的瀏覽記錄推薦給你,往往比直接猜你喜歡什麼效果更好!
基於相似使用者協同推薦(人以群分)
如何找到和你一樣的人
根據以上思路,我們在使用者的美女喜愛偏好權重、社交偏好權重、消費能力權重等多個維度建立模型,計算使用者的偏好,之後將這些偏好反映的權重值轉化為特徵向量!
如,我們把使用者對美女的喜愛權重為8,社交偏好權重為5,消費能力權重為2,將向量理解成多維空間上的一個座標,透過把每個使用者的向量座標代入餘弦公式和距離公式中,就能計算出和你相似的人,進而把使用者分類。
(這裡用到的是鄰近技術:利用使用者的歷史喜好資訊計算使用者之間的距離空間中的點越近越相似。)
這樣廣告主或平臺就可以依據與你相似群體的消費記錄和喜愛偏好給你推薦商品或影片,這也恰巧就是你喜歡的型別。
需要說明的是,微信淘寶們採集的行為資料不僅僅對應你的賬號,更與你的手機唯一識別碼繫結在一起,這意味著你就算不註冊不登陸,你的行為資料一樣會被採集。同時廣告平臺也可以根據你的手機識別碼在其他APP上為你投放廣告,這樣你在刷抖音的時候也能看到淘寶的AJ廣告了!
總的來說,你的一切上網行為都會在手機上留下操作的痕跡(基礎資訊和行為資料)。平臺採集到這些歷史痕跡進行資料清洗——結構化資料——建模分析,計算出你的行為偏好,根據你的偏好或同類人的偏好向你推薦商品和內容。
這也就是為什麼你剛在微信和朋友討論AJ款式,刷公眾號就刷到了AJ的廣告,淘寶首頁也驚喜般的出現了AJ推薦;晚上刷抖音總是刷個不停,感覺刷到的每一個影片都有某個點能戳中自己;
那麼陷入迴音室的怪圈又是怎麼回事呢?
(迴音室怪圈:只推薦你有興趣的內容,讓你接觸世界的邊界越來越窄,沉浸於自己營造的狹小的世界)
迴音室怪圈的陷阱是我們自己挖的
由個以上個性化推薦機制的流程可知,你現在的行為資料將決定你將來會接收到什麼樣的內容,從這個角度看個性化推薦的結果完全取決於你自己本身的傾向。
如果你刷抖音時能包容那些和你意見不同的人,能耐心看完或評論互動,那麼根據個性推薦的機制,你的內容資訊流中既有自己喜歡的內容也會有自我認知之外的內容,不用擔心個性化推薦會把你留在迴音室裡面。
相反,如果你只接受那些你認同的意見或人,不能包容異己,將與自己觀點不對等的內容拉黑處理,長此以往你的資訊流裡就會只剩下你喜歡的內容,沉浸在自己打造的迴音室裡。
個性推薦只是依據你的習慣做出的推薦結果,讓你掉進迴音室怪圈裡的還是你自己。
參考書籍:《個性推薦》
用例及圖片來源於:回形針PaperClip
本文由 @瓶蓋 原創釋出於人人都是產品經理,未經作者許可,禁止轉載。
題圖來自Unsplash,基於CC0協議