溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

如何用Map/Reduce來做好友推薦

發(fā)布時間:2021-12-31 16:07:30 來源:億速云 閱讀:110 作者:iii 欄目:數(shù)據(jù)庫

這篇文章主要講解了“如何用Map/Reduce來做好友推薦”,文中的講解內(nèi)容簡單清晰,易于學習與理解,下面請大家跟著小編的思路慢慢深入,一起來研究和學習“如何用Map/Reduce來做好友推薦”吧!

  SNS網(wǎng)站都有一個功能,就是好友推薦(或者Follower推薦)。例如,在人人網(wǎng)上出現(xiàn)的“你可能認識的人”。怎么來實現(xiàn)呢,有一個很簡單的辦法。如果小剛和小明不是好友,但是他們有很多的共同好友。那么可以認為,A和B很可能相識。

  怎樣用Map/Reduce來做好友推薦

  從圖論的講法上看,就是先列出一個人(記為小A)的所有朋友的朋友,在尋找小A和這些人之間有多少長度為2的通路。將這些通路數(shù)排序,尋找最高的那幾個就可以了。

  所以我們的Map/Reduce的任務就是:找出所有人的十個Top“推薦好友”。

  社會化網(wǎng)絡的圖一般都很簡單。我們假設(shè)輸入是按name排序的。

  "ricky" => ["jay", "peter", "phyllis"]

  "peter" => ["dave", "jack", "ricky", "susan"]

  我們使用兩輪Map/Reduce任務來完成這個操作。

  第一輪MR任務

  這個任務的目的是計算每一對距離是2的人之間的通路數(shù)。

  在Map函數(shù)中,我們先將每對朋友做一個笛卡爾乘積,說的不大清楚,舉個例子,比如

  "ricky" => ["jay", "john", "mitch"]

  那么結(jié)果就是

  ["jay", "john"], ["jay", "mitch"], ["john", "mitch"]

  他們都是通過ricky牽線搭橋認識的。將已經(jīng)是朋友的組合篩選掉,再排好序。傳給Reducer。

  在Reduce函數(shù)中, 相同的組合必定會傳給Reducer。所以Reducer只要數(shù)好有幾個相同的組合傳給他就行了.

  Input record … person -> connection_list

  e.g. "ricky" => ["jay", "john", "mitch", "peter"]

  also the connection list is sorted by alphabetical order

  def map(person, connection_list)

  # Compute a cartesian product using nested loops

  for each friend1 in connection_list

  # Eliminate all 2-degree pairs if they already

  # have a one-degree connection

  emit([person, friend1, 0])

  for each friend2 > friend1 in connection_list

  emit([friend1, friend2, 1], 1)

  def partition(key)

  #use the first two elements of the key to choose a reducer

  return super.partition([key[0], key[1]])

  def reduce(person_pair, frequency_list)

  # Check if this is a new pair

  if @current_pair != [person_pair[0], person_pair[1]]

  @current_pair = [person_pair[0], person_pair[1]]

  # Skip all subsequent pairs if these two person

  # already know each other

  @skip = true if person_pair[2] == 0

  if !skip

  path_count = 0

  for each count in frequency_list

  path_count += count

  emit(person_pair, path_count)

  Output record … person_pair => path_count

  e.g. ["jay", "john"] => 5

  怎樣用Map/Reduce來做好友推薦

  第二輪MR任務

  這一輪的MR任務是為了列出每個人距離為2的好友,查出他們直接究竟有幾條路徑。

  在Map函數(shù)中,我們將每一組數(shù)據(jù)重新排列,保證一個人信息落在一個reducer上

  在Reduce函數(shù)中,只要將每個人的可能好友之間的路徑數(shù)排個序就可以了.

  Input record = Output record of round 1

  def map(person_pair, path_count)

  emit([person_pair[0], path_count], person_pair[1])

  def partition(key)

  #use the first element of the key to choose a reducer

  return super.partition(key[0])

  def reduce(connection_count_pair, candidate_list)

  # Check if this is a new person

  if @current_person != connection_count_pair[0]

  emit(@current_person, @top_ten)

  @top_ten = []

  @current_person = connection_count_pair[0]

  #Pick the top ten candidates to connect with

  if @top_ten.size < 10   for each candidate in candidate_list   @top_ten.append([candidate, connection_count_pair[1]])   break if @pick_count > 10

  Output record … person -> candidate_count_list

  e.g. "ricky" => [["jay", 5], ["peter", 3] …]

  Follower推薦

  如果我想要做Follower推薦而不是好友推薦怎么辦呢?

  很簡單。只要將第一步的MR任務改為求“Follow關(guān)系”和“Followed”關(guān)系的笛卡爾乘積就可以了。這里就不列偽碼了。

感謝各位的閱讀,以上就是“如何用Map/Reduce來做好友推薦”的內(nèi)容了,經(jīng)過本文的學習后,相信大家對如何用Map/Reduce來做好友推薦這一問題有了更深刻的體會,具體使用情況還需要大家實踐驗證。這里是億速云,小編將為大家推送更多相關(guān)知識點的文章,歡迎關(guān)注!

向AI問一下細節(jié)

免責聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI