小土刀

一个满怀热爱的手艺人。无论是文字还是代码,我都想写点不一样的。

聊聊推荐系统(一)

对于推荐系统一直非常感兴趣,一是因为目前在用的产品几乎没有让我满意的,就拿豆瓣来说,我都标记了五百多本书了,推荐出来的还是乱七八糟;二是本身对淘金感兴趣,有种做侦探的感觉。可是毕竟不是专业搞这个的,所以下面说的纯属扯淡。另外标题中的一,也不是说之后会有二,我就是意思意思,给自己个心理安慰。

先从最简单的讲起,其实用基础的统计学就可以开始设计,比方这样,有一百个用户,每个用户看了十本书,统计一下两两的相关性,就可以开始推荐了。就类似于淘宝上的那个“浏览了此商品的人还浏览了”的那个栏目。当然淘宝肯定不止这么简单,我就举个例子。

其实这里说的推荐系统更偏向于书籍推荐,原因其实也很简单。商品导购类的推荐(尤其是衣服之类的)很容易一眼分出胜负,一件衣服,喜欢就是喜欢,不会出现特别五十五十的情况(不考虑价格,而且我对时尚一窍不通,就大概这个意思)。但是书的话,我看得比较多,感觉就有很多弯弯绕了。比方说这个作者可能写出来的东西艺术性不强,但是思想很有深度;又或者都是大白话,但是故事性很强;再可能不同的心情应该看不同的书.....


我们继续拿豆瓣来说,看豆瓣猜这个界面,明摆着告诉你了,我们的推荐系统不说是基于关键词,至少关键词是很重要的。不同的字体大小估计是表示权重,这么说来我的兴趣还是比较广泛的括弧笑。但是这不重要,重要的是,这种推荐方式,究竟能不能推荐出来我想要的书。

并且衣服可以看样子,书看封面和名字,就很可能误判了(当然排除网络小说那种露骨的不算)。比方这个来自新世界,我根本很难判断出自己到底喜不喜欢这本书,当然鼠标放到封面上会有简介什么的,但是,这不够,我会很想知道为什么会推荐这本书给我。是因为我看过的某本书跟它的相关度很高,还是我关注的人很喜欢这本书,这些可能太多,我没办法带着一堆疑惑去喜欢。

好,我们假设现在真的连推荐的理由都有了,我还是不满意。我觉得豆瓣根本不了解我,豆瓣只了解书,推荐都是源于书与我的关系,而不是我与书的关系。等等,书与我和我与书真的有很大差别吗?有的,就像矩阵乘法,顺序很重要。首先豆瓣的每个小单位可以看做是一本书,其中有各种信息还有用户的标注及书评。可不可以这么看,这是通过用户来评价一本书,而不是通过书来评价用户。换句话说,对于书来说,有评分有分类有介绍,但是对于用户,可能只有根据已读未读想读列表中的某些统计和聚类提取出来的关键词信息。

这很不对等,也导致了从书及用户的思路,很难成为一个效果好的推荐系统。推荐推荐,应该是面向未来的,虽然是基于过去,但是我想要看到更多个性的东西在里面。

我在想,有没有可能换一种思路,从人出发,对每个用户进行不同性格和阅读习惯的划分,那么推荐的路径就从原来的书的链接,切换到人的链接。更加接近于现实生活中口味相近的朋友互相推荐书籍的情形。

从这个角度想开去,其实完全可以开这样一家公司,用户可以绑定各种各样社交账号,然后去分析这个人的个性性格喜好,基于已人为最小单位来进行联系。

不过我还真不知道怎么做,以上就是吃饭时候瞎想想,有机会再继续。


评论(2)
热度(3)

© 小土刀 | Powered by LOFTER