System rekomendacji
Transkrypt
System rekomendacji
System rekomendacji
Piotr Findeisen & Kamil Lenartowicz
16 marca 2009
Google News Algorytmy Ważniak
Spis treści
1
Google News
Wprowadzenie
Korelacja
Covisitation
Klasteryzacja
2
Algorytmy
MinHash
PLSI
Porównanie
3
Ważniak
Wprowadzenie
Algorytm - MinHash
Dane
Piotr Findeisen & Kamil Lenartowicz
System rekomendacji
Google News Algorytmy Ważniak
Wprowadzenie Korelacja Covisitation Klasteryzacja
Problem
kilka milionów unikalnych użytkowników w ciagu
˛ kilku dni
Piotr Findeisen & Kamil Lenartowicz
System rekomendacji
Google News Algorytmy Ważniak
Wprowadzenie Korelacja Covisitation Klasteryzacja
Problem
kilka milionów unikalnych użytkowników w ciagu
˛ kilku dni
kilka milionów wiadomości w ciagu
˛ miesiaca
˛
Piotr Findeisen & Kamil Lenartowicz
System rekomendacji
Google News Algorytmy Ważniak
Wprowadzenie Korelacja Covisitation Klasteryzacja
Problem
kilka milionów unikalnych użytkowników w ciagu
˛ kilku dni
kilka milionów wiadomości w ciagu
˛ miesiaca
˛
trzeba zaprezentować użytkownikowi krótka˛ list˛e wybranych
wiadomości
Piotr Findeisen & Kamil Lenartowicz
System rekomendacji
Google News Algorytmy Ważniak
Wprowadzenie Korelacja Covisitation Klasteryzacja
Problem
kilka milionów unikalnych użytkowników w ciagu
˛ kilku dni
kilka milionów wiadomości w ciagu
˛ miesiaca
˛
trzeba zaprezentować użytkownikowi krótka˛ list˛e wybranych
wiadomości
U = {u1 , . . . , uN } - użytkownicy
S = {s1 , . . . , sM } - wiadomości
Cu = {si1 , . . . , si|Cu | } - historia klikni˛eć użytkownika u
Piotr Findeisen & Kamil Lenartowicz
System rekomendacji
Google News Algorytmy Ważniak
Wprowadzenie Korelacja Covisitation Klasteryzacja
Korelacja
rua ,sk =
X
I(ui ,sk ) w(ua , ui )
i6=a
Piotr Findeisen & Kamil Lenartowicz
System rekomendacji
Google News Algorytmy Ważniak
Wprowadzenie Korelacja Covisitation Klasteryzacja
Korelacja
rua ,sk =
X
I(ui ,sk ) w(ua , ui )
i6=a
tablica 106 × 106
Piotr Findeisen & Kamil Lenartowicz
System rekomendacji
Google News Algorytmy Ważniak
Wprowadzenie Korelacja Covisitation Klasteryzacja
Korelacja
rua ,sk =
X
I(ui ,sk ) w(ua , ui )
i6=a
tablica 106 × 106
kosztowne wyliczanie rekomendowanej listy
Piotr Findeisen & Kamil Lenartowicz
System rekomendacji
Google News Algorytmy Ważniak
Wprowadzenie Korelacja Covisitation Klasteryzacja
Covisitation
u
t
Piotr Findeisen & Kamil Lenartowicz
System rekomendacji
Google News Algorytmy Ważniak
Wprowadzenie Korelacja Covisitation Klasteryzacja
Covisitation
u
t
ru,s =
X
P
s0 ∈Cu0
Piotr Findeisen & Kamil Lenartowicz
w(s, s0 )
0 00
s00 w(s , s )
System rekomendacji
Google News Algorytmy Ważniak
Wprowadzenie Korelacja Covisitation Klasteryzacja
Modelowanie danych
rua ,sk ≈
X
w(ua , ci )
ci :ua ∈ci
Piotr Findeisen & Kamil Lenartowicz
X
I(uj ,sk )
uj :uj ∈ci
System rekomendacji
Google News Algorytmy Ważniak
Wprowadzenie Korelacja Covisitation Klasteryzacja
Modelowanie danych
rua ,sk ≈
X
w(ua , ci )
ci :ua ∈ci
Piotr Findeisen & Kamil Lenartowicz
X
I(uj ,sk )
uj :uj ∈ci
System rekomendacji
Google News Algorytmy Ważniak
Wprowadzenie Korelacja Covisitation Klasteryzacja
Modelowanie danych
rua ,sk ≈
X
w(ua , ci )
ci :ua ∈ci
Piotr Findeisen & Kamil Lenartowicz
X
I(uj ,sk )
uj :uj ∈ci
System rekomendacji
Google News Algorytmy Ważniak
MinHash PLSI Porównanie
Jaccard coefficient
Definiuje „miar˛e” podobieństwa zbiorów danych
J (Z1 , Z2 ) =
1
|Z1 ∩Z2 |
|Z1 ∪Z2 |
http://en.wikipedia.org/wiki/Jaccard_index
Piotr Findeisen & Kamil Lenartowicz
System rekomendacji
Google News Algorytmy Ważniak
MinHash PLSI Porównanie
Jaccard coefficient
Definiuje „miar˛e” podobieństwa zbiorów danych
J (Z1 , Z2 ) =
|Z1 ∩Z2 |
|Z1 ∪Z2 |
Jδ (Z1 , Z2 ) = 1 − J (Z1 , Z2 ) jest metryka˛1
1
http://en.wikipedia.org/wiki/Jaccard_index
Piotr Findeisen & Kamil Lenartowicz
System rekomendacji
Google News Algorytmy Ważniak
MinHash PLSI Porównanie
Jaccard coefficient
Definiuje „miar˛e” podobieństwa zbiorów danych
J (Z1 , Z2 ) =
|Z1 ∩Z2 |
|Z1 ∪Z2 |
Jδ (Z1 , Z2 ) = 1 − J (Z1 , Z2 ) jest metryka˛1
porównuje arbitralne zbiory danych
1
http://en.wikipedia.org/wiki/Jaccard_index
Piotr Findeisen & Kamil Lenartowicz
System rekomendacji
Google News Algorytmy Ważniak
MinHash PLSI Porównanie
MinHash
Dla Z1 , Z2 , . . . , Zn i losowej permutacji h zbioru
definiujemy
λi = min{j : h(j) ∈ Zi }
Piotr Findeisen & Kamil Lenartowicz
System rekomendacji
Sn
i=1 Zi
Google News Algorytmy Ważniak
MinHash PLSI Porównanie
MinHash
Dla Z1 , Z2 , . . . , Zn i losowej permutacji h zbioru
definiujemy
λi = min{j : h(j) ∈ Zi }
Zi i Zj uznamy za podobne, gdy λi = λj
Piotr Findeisen & Kamil Lenartowicz
System rekomendacji
Sn
i=1 Zi
Google News Algorytmy Ważniak
MinHash PLSI Porównanie
MinHash
Dla Z1 , Z2 , . . . , Zn i losowej permutacji h zbioru
definiujemy
λi = min{j : h(j) ∈ Zi }
Zi i Zj uznamy za podobne, gdy λi = λj
czyli z prawdopodobieństwem J (Z1 , Z2 )
Piotr Findeisen & Kamil Lenartowicz
System rekomendacji
Sn
i=1 Zi
Google News Algorytmy Ważniak
MinHash PLSI Porównanie
MinHash
Dla Z1 , Z2 , . . . , Zn i losowej permutacji h zbioru
definiujemy
λi = min{j : h(j) ∈ Zi }
Zi i Zj uznamy za podobne, gdy λi = λj
czyli z prawdopodobieństwem J (Z1 , Z2 )
podobieństwo jest relacja˛ równoważności
Piotr Findeisen & Kamil Lenartowicz
System rekomendacji
Sn
i=1 Zi
Google News Algorytmy Ważniak
MinHash PLSI Porównanie
MinHash
Dla Z1 , Z2 , . . . , Zn i losowej permutacji h zbioru
definiujemy
λi = min{j : h(j) ∈ Zi }
Zi i Zj uznamy za podobne, gdy λi = λj
czyli z prawdopodobieństwem J (Z1 , Z2 )
podobieństwo jest relacja˛ równoważności
klasy abstrakcji = klastry
Piotr Findeisen & Kamil Lenartowicz
System rekomendacji
Sn
i=1 Zi
Google News Algorytmy Ważniak
MinHash PLSI Porównanie
MinHash – klasteryzacja
Cu ⊆ S – klikni˛ecia użytkownika u
Piotr Findeisen & Kamil Lenartowicz
System rekomendacji
Google News Algorytmy Ważniak
MinHash PLSI Porównanie
MinHash – klasteryzacja
Cu ⊆ S – klikni˛ecia użytkownika u
h – losowa permutacja S
Piotr Findeisen & Kamil Lenartowicz
System rekomendacji
Google News Algorytmy Ważniak
MinHash PLSI Porównanie
MinHash – klasteryzacja
Cu ⊆ S – klikni˛ecia użytkownika u
h – losowa permutacja S
u jest w klastrze ci , gdy i = min{j : h(j) ∈ Cu }
Piotr Findeisen & Kamil Lenartowicz
System rekomendacji
Google News Algorytmy Ważniak
MinHash PLSI Porównanie
MinHash – klasteryzacja
Cu ⊆ S – klikni˛ecia użytkownika u
h – losowa permutacja S
u jest w klastrze ci , gdy i = min{j : h(j) ∈ Cu }
u i u0 sa˛ razem w klastrze z prawdopodobieństwem J (Cu , Cu0 )
Piotr Findeisen & Kamil Lenartowicz
System rekomendacji
Google News Algorytmy Ważniak
MinHash PLSI Porównanie
MinHash – klasteryzacja
Cu ⊆ S – klikni˛ecia użytkownika u
h – losowa permutacja S
u jest w klastrze ci , gdy i = min{j : h(j) ∈ Cu }
u i u0 sa˛ razem w klastrze z prawdopodobieństwem J (Cu , Cu0 )
Intuicja
“Użytkownik u ma wpływ na użytkownika u0 tak bardzo, jak bardzo
sa˛ podobni.”
Piotr Findeisen & Kamil Lenartowicz
System rekomendacji
Google News Algorytmy Ważniak
MinHash PLSI Porównanie
MinHash – rekomendacja
ru,s =?
P
u0 6=u J (u
0 , u)I
(u0 ,s)
Piotr Findeisen & Kamil Lenartowicz
System rekomendacji
Google News Algorytmy Ważniak
MinHash PLSI Porównanie
MinHash – rekomendacja
ru,s = ...
sumujemy rekomendacje dla wszystkich klastrów użytkownika u
rekomendacja “z klastra”: cz˛estość klikania w s
Piotr Findeisen & Kamil Lenartowicz
System rekomendacji
Google News Algorytmy Ważniak
MinHash PLSI Porównanie
MinHash – rekomendacja
E ru,s =
P
u0 6=u J (u
0 , u)I
(u0 ,s)
sumujemy rekomendacje dla wszystkich klastrów użytkownika u
rekomendacja “z klastra”: cz˛estość klikania w s
ru,s =
X # klikni˛eć w s przez użytkowników z ci
# użytkowników z ci
c :u∈c
i
i
Piotr Findeisen & Kamil Lenartowicz
System rekomendacji
Google News Algorytmy Ważniak
MinHash PLSI Porównanie
MinHash – rekomendacja
E ru,s = O
P
u0 6=u
J (u0 , u)I(u0 ,s)
sumujemy rekomendacje dla wszystkich klastrów użytkownika u
rekomendacja “z klastra”: cz˛estość klikania w s
ru,s =
X # klikni˛eć w s przez użytkowników z ci
# klikni˛eć użytkowników z ci
c :u∈c
i
i
Piotr Findeisen & Kamil Lenartowicz
System rekomendacji
Google News Algorytmy Ważniak
MinHash PLSI Porównanie
PLSI
u ∈ U – użytkownicy, zmienna losowa
Piotr Findeisen & Kamil Lenartowicz
System rekomendacji
Google News Algorytmy Ważniak
MinHash PLSI Porównanie
PLSI
u ∈ U – użytkownicy, zmienna losowa
s ∈ S – wiadomości, zmienna losowa
Piotr Findeisen & Kamil Lenartowicz
System rekomendacji
Google News Algorytmy Ważniak
MinHash PLSI Porównanie
PLSI
u ∈ U – użytkownicy, zmienna losowa
s ∈ S – wiadomości, zmienna losowa
zwiazek
˛
u i s modelujemy:
z ∈ Z – “ukryta” zmienna losowa, |Z| = L
obliczamy, konstruujemy p(u|z), p(s|z)
z to nasze PLSI-klastry
Piotr Findeisen & Kamil Lenartowicz
System rekomendacji
Google News Algorytmy Ważniak
MinHash PLSI Porównanie
PLSI
u ∈ U – użytkownicy, zmienna losowa
s ∈ S – wiadomości, zmienna losowa
zwiazek
˛
u i s modelujemy:
z ∈ Z – “ukryta” zmienna losowa, |Z| = L
obliczamy, konstruujemy p(u|z), p(s|z)
z to nasze PLSI-klastry
ru,s = p(s|u) =
L
X
p(s|z)p(z|u)
z=1
Piotr Findeisen & Kamil Lenartowicz
System rekomendacji
Google News Algorytmy Ważniak
MinHash PLSI Porównanie
PLSI – p(u|z), p(s|z)
PLSI trzeba “nauczyć” – expectation maximalization
Piotr Findeisen & Kamil Lenartowicz
System rekomendacji
Google News Algorytmy Ważniak
MinHash PLSI Porównanie
PLSI – p(u|z), p(s|z)
PLSI trzeba “nauczyć” – expectation maximalization
zestaw danych treningowych {(u1 , s1 ), . . . , (uT , sT )}
Piotr Findeisen & Kamil Lenartowicz
System rekomendacji
Google News Algorytmy Ważniak
MinHash PLSI Porównanie
PLSI – p(u|z), p(s|z)
PLSI trzeba “nauczyć” – expectation maximalization
zestaw danych treningowych {(u1 , s1 ), . . . , (uT , sT )}
zminimalizować
T
1X
log (p(st |ut ))
−
T
t=1
Piotr Findeisen & Kamil Lenartowicz
System rekomendacji
Google News Algorytmy Ważniak
MinHash PLSI Porównanie
PLSI – p(u|z), p(s|z)
PLSI trzeba “nauczyć” – expectation maximalization
zestaw danych treningowych {(u1 , s1 ), . . . , (uT , sT )}
zminimalizować
T
1X
log (p(st |ut ))
−
T
gdzie p(st |ut ) =
z
t=1
Piotr Findeisen & Kamil Lenartowicz
X
System rekomendacji
p(st |z)P(z|ut )
Google News Algorytmy Ważniak
MinHash PLSI Porównanie
PLSI – p(u|z), p(s|z)
PLSI trzeba “nauczyć” – expectation maximalization
zestaw danych treningowych {(u1 , s1 ), . . . , (uT , sT )}
zminimalizować
T
1X
log (p(st |ut ))
−
T
gdzie p(st |ut ) =
z
t=1
daje si˛e zrównoleglić
Piotr Findeisen & Kamil Lenartowicz
X
System rekomendacji
p(st |z)P(z|ut )
Google News Algorytmy Ważniak
MinHash PLSI Porównanie
PLSI – p(u|z), p(s|z)
PLSI trzeba “nauczyć” – expectation maximalization
zestaw danych treningowych {(u1 , s1 ), . . . , (uT , sT )}
zminimalizować
T
1X
log (p(st |ut ))
−
T
gdzie p(st |ut ) =
X
p(st |z)P(z|ut )
z
t=1
daje si˛e zrównoleglić
. . . ale nie chcemy ogladać
˛
wzorków w stylu
p̂(s|z)p̂(z|u)
z∈Z p̂(s|z)p̂(z|u)
q∗ (z; u, s; θ̂) := p(z|u, s; θ̂) = P
Piotr Findeisen & Kamil Lenartowicz
System rekomendacji
Google News Algorytmy Ważniak
MinHash PLSI Porównanie
PLSI a MinHash
klastry
max. # klastrów
przynależność
kalibracja
ru,s =
MinHash
PLSI
ci
z=i
|S|
L, np. 1000
{0, 1}
< 0, 1 >
agregacja historii
X
rci ,s
uczenie maszynowe
L
X
p(s|z)p(z|u)
ci :u∈ci
Piotr Findeisen & Kamil Lenartowicz
z=1
System rekomendacji
Google News Algorytmy Ważniak
MinHash PLSI Porównanie
Porównanie
Piotr Findeisen & Kamil Lenartowicz
System rekomendacji
Google News Algorytmy Ważniak
Wprowadzenie Algorytm - MinHash Dane
Wprowadzenie
u odwiedził adres X
przeglądarka
u ocenił fragment X +/
ocena fragmentu/URL X dla u
Piotr Findeisen & Kamil Lenartowicz
System rekomendacji
serwer
użytkownicy
historia
Google News Algorytmy Ważniak
Wprowadzenie Algorytm - MinHash Dane
Wprowadzenie
u odwiedził adres X
przeglądarka
u ocenił fragment X +/
ocena fragmentu/URL X dla u
uczenie si˛e na bieżaco
˛ tablicy fragmentów/URL
Piotr Findeisen & Kamil Lenartowicz
System rekomendacji
serwer
użytkownicy
historia
Google News Algorytmy Ważniak
Wprowadzenie Algorytm - MinHash Dane
Wprowadzenie
u odwiedził adres X
przeglądarka
u ocenił fragment X +/
ocena fragmentu/URL X dla u
serwer
użytkownicy
historia
uczenie si˛e na bieżaco
˛ tablicy fragmentów/URL
3 typy oceny materiału (wejście, ocena +1, ocena -1)
Piotr Findeisen & Kamil Lenartowicz
System rekomendacji
Google News Algorytmy Ważniak
Wprowadzenie Algorytm - MinHash Dane
Wprowadzenie
u odwiedził adres X
przeglądarka
u ocenił fragment X +/
ocena fragmentu/URL X dla u
serwer
użytkownicy
historia
uczenie si˛e na bieżaco
˛ tablicy fragmentów/URL
3 typy oceny materiału (wejście, ocena +1, ocena -1)
2 typy zawartości (fragment, URL)
Piotr Findeisen & Kamil Lenartowicz
System rekomendacji
Google News Algorytmy Ważniak
Wprowadzenie Algorytm - MinHash Dane
Wprowadzenie
u odwiedził adres X
przeglądarka
u ocenił fragment X +/
ocena fragmentu/URL X dla u
serwer
użytkownicy
historia
uczenie si˛e na bieżaco
˛ tablicy fragmentów/URL
3 typy oceny materiału (wejście, ocena +1, ocena -1)
2 typy zawartości (fragment, URL)
mały zbiór kandydatów do rekomendacji
Piotr Findeisen & Kamil Lenartowicz
System rekomendacji
Google News Algorytmy Ważniak
Wprowadzenie Algorytm - MinHash Dane
Algorytm
Permutacja 1
1
Permutacja 2
8
2
2
5
3
7
4
4
5
1
6
3
7
8
6
Modyfikacja MinHash: Każdy użytkownik należy do n klastrów ze
wzgl˛edu na podobieństwo oceniania oraz m klastrów ze wzgl˛edu na
odwiedzanie tych samych stron, przy czym n > m.
Piotr Findeisen & Kamil Lenartowicz
System rekomendacji
Google News Algorytmy Ważniak
Wprowadzenie Algorytm - MinHash Dane
Algorytm
Użytkownik u wszedł na stron˛e S:
Piotr Findeisen & Kamil Lenartowicz
System rekomendacji
Google News Algorytmy Ważniak
Wprowadzenie Algorytm - MinHash Dane
Algorytm
Użytkownik u wszedł na stron˛e S:
obliczam m haszy URL-a S i podmieniam jeśli któryś jest
mniejszy od odpowiadajacego
˛
mu dotychczasowego minimum
S
u
h1 h2 h3 h4
h1 h2 h3 h4
wejścia
h1 h2 h3 h4 h5 h6 h7 h8 h9
ocena
Piotr Findeisen & Kamil Lenartowicz
System rekomendacji
Google News Algorytmy Ważniak
Wprowadzenie Algorytm - MinHash Dane
Algorytm
Użytkownik u wszedł na stron˛e S:
obliczam m haszy URL-a S i podmieniam jeśli któryś jest
mniejszy od odpowiadajacego
˛
mu dotychczasowego minimum
S
u
h1 h2 h3 h4
h1 h2 h3 h4
wejścia
h1 h2 h3 h4 h5 h6 h7 h8 h9
ocena
do wszystkich (m + n) klastrów u dodaje 1 klikni˛ecie dla S
Piotr Findeisen & Kamil Lenartowicz
System rekomendacji
Google News Algorytmy Ważniak
Wprowadzenie Algorytm - MinHash Dane
Algorytm
Użytkownik u ocenił fragment F na stronie S na +/−:
Piotr Findeisen & Kamil Lenartowicz
System rekomendacji
Google News Algorytmy Ważniak
Wprowadzenie Algorytm - MinHash Dane
Algorytm
Użytkownik u ocenił fragment F na stronie S na +/−:
obliczam n haszy (F, +/−) i podmieniam jeśli któryś jest
mniejszy od odpowiadajacego
˛
mu hasza ocen
u
F
h1 h2 h3 h4
wejścia
h1 h2 h3 h4 h5 h6 h7 h8 h9
h1 h2 h3 h4 h5 h6 h7 h8 h9
ocena
Piotr Findeisen & Kamil Lenartowicz
System rekomendacji
Google News Algorytmy Ważniak
Wprowadzenie Algorytm - MinHash Dane
Algorytm
Użytkownik u ocenił fragment F na stronie S na +/−:
obliczam n haszy (F, +/−) i podmieniam jeśli któryś jest
mniejszy od odpowiadajacego
˛
mu hasza ocen
u
F
h1 h2 h3 h4
wejścia
h1 h2 h3 h4 h5 h6 h7 h8 h9
h1 h2 h3 h4 h5 h6 h7 h8 h9
ocena
do wszystkich (m + n) klastrów u dodaje +/− dla fragmentu F
oraz +/−
k do oceny S gdzie k to liczba fragmentów na stronie S
Piotr Findeisen & Kamil Lenartowicz
System rekomendacji
Google News Algorytmy Ważniak
Wprowadzenie Algorytm - MinHash Dane
Algorytm
Użytkownik u pyta o ocen˛e fragmentów z listy: F1 , . . . , Fl .
Piotr Findeisen & Kamil Lenartowicz
System rekomendacji
Google News Algorytmy Ważniak
Wprowadzenie Algorytm - MinHash Dane
Algorytm
Użytkownik u pyta o ocen˛e fragmentów z listy: F1 , . . . , Fl .
pobieram list˛e klastrów użytkownika u: K = {K1 , . . . , Kn+m }
Piotr Findeisen & Kamil Lenartowicz
System rekomendacji
Google News Algorytmy Ważniak
Wprowadzenie Algorytm - MinHash Dane
Algorytm
Użytkownik u pyta o ocen˛e fragmentów z listy: F1 , . . . , Fl .
pobieram list˛e klastrów użytkownika u: K = {K1 , . . . , Kn+m }
dla i ∈< 1, l > obliczam:
ru,Fi =
X ocena(Kj , Fi )
|Kj |
Kj ∈K
Piotr Findeisen & Kamil Lenartowicz
System rekomendacji
Google News Algorytmy Ważniak
Wprowadzenie Algorytm - MinHash Dane
Algorytm
Użytkownik u pyta o ocen˛e URL-i z listy: S1 , . . . , Sl .
Piotr Findeisen & Kamil Lenartowicz
System rekomendacji
Google News Algorytmy Ważniak
Wprowadzenie Algorytm - MinHash Dane
Algorytm
Użytkownik u pyta o ocen˛e URL-i z listy: S1 , . . . , Sl .
pobieram list˛e klastrów użytkownika u: K = {K1 , . . . , Kn+m }
Piotr Findeisen & Kamil Lenartowicz
System rekomendacji
Google News Algorytmy Ważniak
Wprowadzenie Algorytm - MinHash Dane
Algorytm
Użytkownik u pyta o ocen˛e URL-i z listy: S1 , . . . , Sl .
pobieram list˛e klastrów użytkownika u: K = {K1 , . . . , Kn+m }
dla i ∈< 1, l > obliczam:
ru,Si =
X X ∗ ocena(Kj , Si ) + Y ∗ #odwiedzin(Kj , Si )
|Kj |
Kj ∈K
gdzie X, Y stałe.
Piotr Findeisen & Kamil Lenartowicz
System rekomendacji
Google News Algorytmy Ważniak
Wprowadzenie Algorytm - MinHash Dane
Dane
użytkownik
lista klastrów
lista ocen
lista odwiedzonych stron
Piotr Findeisen & Kamil Lenartowicz
System rekomendacji
Google News Algorytmy Ważniak
Wprowadzenie Algorytm - MinHash Dane
Dane
użytkownik
lista klastrów
lista ocen
lista odwiedzonych stron
fragment
ocena per klaster (zdenormalizowana)
Piotr Findeisen & Kamil Lenartowicz
System rekomendacji
Google News Algorytmy Ważniak
Wprowadzenie Algorytm - MinHash Dane
Dane
użytkownik
lista klastrów
lista ocen
lista odwiedzonych stron
fragment
ocena per klaster (zdenormalizowana)
klaster
suma ocen (do normalizacji)
historia? suma po aktualnych członkach klastra?
Piotr Findeisen & Kamil Lenartowicz
System rekomendacji