Matrix-Factorization---based-Collaborative-Filtering/matrix-factorization.py at master · p0l4r/Matrix-Factorization---based-Collaborative-Filtering · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
#Author: Shantanu Kumar Rahut
#Email: shantanurahut@gmail.com
#I am a researcher and a programmer. Keep supporting my work. Thank you.

import numpy as np


class matrix_factorization():

      def __init__(self,data,features,userFeatures= None, itemFeatures= None):
          self.data = data
          self.features = features
          self.user_count = data.shape[0]
          self.item_count = data.shape[1]

          if userFeatures is None:
              #randomly initializing user features
              self.user_features = np.random.uniform(low=0.1,high=0.9,size=(self.user_count,self.features))
          else:
              self.user_features = userFeatures

          if itemFeatures is None:
              #randomly initializing item features
              self.item_features = np.random.uniform(low=0.1,high=0.9,size=(self.features,self.item_count))
          else:
              self.item_features = itemFeatures

          print("Shape of initialized Matrix (MxN): ",(np.matmul(self.user_features,self.item_features)).shape)
          print("Shape of initialized User Features (MxK):",(self.user_features).shape)
          print("Shape of initialized Item Features (KxN):",(self.item_features).shape)


      def MSE(self):
          matrix_product = np.matmul(self.user_features,self.item_features)
          return np.sum((self.data-matrix_product)**2)

      def single_gradient(self,user_row,item_col,wrt_user_idx=None,wrt_item_idx=None):
          if wrt_user_idx != None and wrt_item_idx !=None:
            return "Too many elements"
          elif wrt_user_idx == None and wrt_item_idx ==None:
            return "Insufficient elements"
          else:
            u_row = self.user_features[user_row,:]
            i_col = self.item_features[:,item_col]
            ui_rating = float(self.data[user_row,item_col])
            prediction = float(np.dot(u_row,i_col))

            if wrt_user_idx != None:
              row_elem = float(i_col[wrt_user_idx])
              gradient = 2*(ui_rating - prediction)*row_elem
            else:
              col_elem = float(u_row[wrt_item_idx])
              gradient = 2*(ui_rating - prediction)*col_elem
            return gradient

      def user_feature_gradient(self,user_row,wrt_user_idx):

          summation = 0
          for col in range(0,self.item_count):
            summation += self.single_gradient(user_row=user_row,item_col=col,wrt_user_idx=wrt_user_idx)
          return summation/self.item_count

      def item_feature_gradient(self,item_col,wrt_item_idx):
          summation = 0
          for row in range(0,self.user_count):
            summation += self.single_gradient(user_row=row,item_col=item_col,wrt_item_idx=wrt_item_idx)
          return summation/self.user_count

      def update_user_features(self,learning_rate):
          for i in range(0,self.user_count):
            for j in range(0,self.features):
              self.user_features[i,j] += learning_rate*self.user_feature_gradient(user_row=i,wrt_user_idx=j)

      def update_item_features(self,learning_rate):
            for i in range(0,self.features):
              for j in range(0,self.item_count):
                self.item_features[i,j] += learning_rate*self.item_feature_gradient(item_col=j,wrt_item_idx=i)


      def train_model(self,learning_rate=0.01,iterations=1000):
        for i in range(iterations):
          self.update_user_features(learning_rate=learning_rate)
          self.update_item_features(learning_rate=learning_rate)
          if i% 50 == 0:
            print(self.MSE())

      def predicted_matrix(self):
          return np.rint(np.matmul(self.user_features,self.item_features))