最佳配对

作者:爱新闻 刘伊文SCNU 来源:中国日报网
2015-07-02 10:41:10

“包装好的货物”

以男性身份登陆默契网,让我有种在网上购物的感觉,这并不奇怪。网站利用 数据挖掘潜在语义索引(LSI)技术,像谷歌搜索引擎那样对相关的网页进行排列。

这背后的小把戏其实是就是道数学题,它十分成功地将人和产品,或是人与人,或是人和其他一些通过修改档案把自己包装成产品一样的人配对起来。“你和我无法想象出四维空间,但是数学家和电脑却有这种能力,”美博客先驱——台六度公司(SixApart)的副总裁大卫·雅各布斯(DavidJacobs)说。同样的技术,他的工作主要是负责设计社交媒体网站。“每一个附加属性都被视为在一个‘空间’内创造另外一个维度,这正是默契网所追寻的。这种算法创造了一个虚拟图,它能够粗略估计成百上千条轴线。”

这其实十分简单。但是另外一半的把戏并非如此:它必须分析用户的浏览方式而不是排列和反馈。凭借我们“在家都是排行老大”这个相同点,为“多愁善感的小哥450”推荐了这个对象和凭借网站知道像“多愁善感的小哥450”喜欢查看那些钱赚得较少,身材更矮,却拥有相同的宗教信仰的女性档案的用户来进行配对是不一样的。

“每一个在研究与开发这方面投资重本的公司,都在尝试和研发这些小把戏,将其视为竞争优势,”雅各布说,“他们不会公布详细的资料,因为他们认为这是秘密武器。而且,我猜这些小把戏并非是单一向量,即使种族可能成为简单的识别方式,人们会声称他们对这些毫不在意,其实他们在乎得很。”

雅各布的意思并不是说,默契网的开发者能够通过这些“小把戏”知道谁可能喜欢谁。程序员利用一种叫做特征值分解(singular-valuedecomposition)或者是奇异值分解(SVD)的代数方法,它们拥有大量的应用数据。默契网忽略了当人类在使用一些类似宗教或者是体型这样的术语时的思维特质。相反,他们能够识别一些模式:SVD向两个有着不同偏好和个性的用户赋值,让他们认为彼此很适合。

当雅各布告诉了我关于潜在语义索引的详细情况后,我感到默契网给我的指示(“你们出生在同一个月”)是如此简单。通过观察我在哪个档案停留时间最长以及哪个喜欢我的用户和我有什么相似点,然后进行配对,于是配对就产生了。

电脑能够知道这位“多愁善感的小哥”真正想要的是什么,或者说,如果他存在的话,他寻求的是什么,这个想法是十分恐怖的。唯一让它听起来没那么恐怖的就是,就拿鲁比的事例来说,所有的预测技术一次又一次被证实是失败的。

鲁比把更多的时间花在这个网站上,或许应该给她一点分红,这样的话这个网站就能更好的了解她。最近,她已经着手于现实世界了。这个方法有其有利的一面。对于初学者,你能够在见面之后,再给他展示你穿比基尼的样子。

艾米丽·古尔德(Emily Gould)曾任掴客网(Gawker.com.)的编辑

由艾米丽·古尔德发表于2009年12月21日

最佳配对

上一页 1 2 下一页

标签: