python矩陣分解原理是什么

發(fā)布時間：2022-03-22 16:23:22 來源：億速云閱讀：197 作者：iii 欄目：大數(shù)據(jù)

本篇內(nèi)容介紹了“python矩陣分解原理是什么”的有關(guān)知識，在實際案例的操作過程中，不少人都會遇到這樣的困境，接下來就讓小編帶領(lǐng)大家學(xué)習(xí)一下如何處理這些情況吧！希望大家仔細(xì)閱讀，能夠?qū)W有所成！

原理：矩陣分解

矩陣分解是推薦系統(tǒng)系列中的一種算法，顧名思義，就是將矩陣分解成兩個（或多個）矩陣，它們相乘后得到原始矩陣。在推薦系統(tǒng)中，我們通常從用戶與項目之間的交互/評分矩陣開始，矩陣分解算法會將用戶和項目特征矩陣分解，這也稱為嵌入。下面以電影推薦中的評分，購買等矩陣為例。

通常，在數(shù)據(jù)集中，要挖掘用戶和項目屬性的潛在特征。本質(zhì)上，潛在特征是用戶/項目在任意空間中的表示，表示用戶如何評價電影。在電影推薦系統(tǒng)的示例中，一個用戶樣本中包含了他所觀看的多個電影，潛在特征的值越高，則表示他喜歡該類型的電影，那么就應(yīng)該推薦此類型的電影。

準(zhǔn)備

本文所用數(shù)據(jù)來自kaggle，包含了76000個用戶樣本。

首先，導(dǎo)入數(shù)據(jù)和有關(guān)庫。

from recsys import * 
from generic_preprocessing import 

from IPython.display import HTML ## 以Ipython Notebook顯示

import pandas as pd,numpy as np

anime = pd.read_csv('anime.csv')
ratings = pd.read_csv('rating.csv').iloc[:5000000]

為了創(chuàng)建推薦系統(tǒng)，我們需要一個可交互的矩陣。為此，使用recsys模塊中的create_interaction_matrix函數(shù)，這個函數(shù)要求以Pandas的DataFrame類型的數(shù)據(jù)為輸入，輸入數(shù)據(jù)的列必須有諸如用戶id，項目id和評分等。此函數(shù)的中如果設(shè)置norm=True，則意味著任何評分的值都應(yīng)該是正的。在這個示例中，沒有必要設(shè)置，因為實際的購買數(shù)據(jù)和評分都是正的。

# 利用評分?jǐn)?shù)據(jù)創(chuàng)建矩陣
interactions = create_interaction_matrix(df = ratings,
                     user_col = ‘user_id’,
                     item_col = ‘a(chǎn)nime_id’,
                     rating_col = ‘rating’)
interactions.shape

然后用create_user_dict和create_item_dict函數(shù)（recsys模塊）創(chuàng)建關(guān)于用戶和項目的字典。

# 用戶字典
user_dict = create_user_dict(interactions=interactions)
# 項目字典
movies_dict = create_item_dict(df = anime,
                               id_col = 'anime_id',
                               name_col = 'name')

矩陣分解模型

用recsys中的runMF函數(shù)來創(chuàng)建矩陣分解模型，這個函數(shù)的參數(shù)：

interaction：前面所創(chuàng)建的矩陣
n_components：對于每個用戶和項目嵌入的數(shù)量
loss：定義一個損失函數(shù)，本例中我們使用warp損失函數(shù)，因為我們更關(guān)心矩陣的秩。
epoch：運行的次數(shù)
n_jobs：并行處理中使用的核數(shù)

mf_model = runMF(interactions = interactions,
                 n_components = 30,
                 loss = 'warp',
                 epoch = 30,
                 n_jobs = 4)

“python矩陣分解原理是什么”的內(nèi)容就介紹到這里了，感謝大家的閱讀。如果想了解更多行業(yè)相關(guān)的知識可以關(guān)注億速云網(wǎng)站，小編將為大家輸出更多高質(zhì)量的實用文章！

向AI問一下細(xì)節(jié)

python矩陣分解原理是什么

原理：矩陣分解

準(zhǔn)備

矩陣分解模型

猜你喜歡

最新資訊

相關(guān)推薦

相關(guān)標(biāo)簽