徐世中
开通时间:..
最后更新时间:..
既然将来打算围着IT转圈,体会一下信息资源的利用的重要性吧。以人人网为例
总体来讲,信息是资源,能否有效地利用资源是一种重要的能力
1. 信息是人民群众需要的
2. 真实可靠的信息 是人民群众迫切需要的
3. 人人网 记录的 人与人之间关系信息,基本上是真实可靠的(好友之间相互印证)。 QQ则不是,说不清楚跟你聊天的是人还是狗
4. 人人网需要挖掘自己的商业价值,即,如何充分满足人民群众的需求。
5. 人民群众的一种急迫的需求: 如何认识某人。 (如图书馆的例子)
6. 人人网中,个人用户,如果想要查找特定的某个人,很容易就能搜出来,并找到他的好友信息的。 但是,如果你们没有共同的好友,你就不得不 遍历/洪犯似地搜索,运气好才能找到你如何通过 2个朋友到达她/他。如果需要通过3个呢?通过4个呢?
7. 人人网管,手上有全套的用户之间的好友关系图 (一个关系网络), 通过调用 最短路算法/k-最短路算法,可以得到从你出发,到达 某个特定人的 最短路/k条最短路 (cost/length 的定义可以根据用户需求)。 更复杂些,可以引入约束路由(比如,限定不通过小学同学,因为小学留下的印象太坏了)。
8. 人人网利用这个功能,就发达了。
9. 隐私问题: 这些数据在人人网上都是公开的,也是用户自愿公开的。只不过对普通用户来说,逐个遍历的工作量太大了(你没做prj2?)。 所以有人说“做外挂、做爬虫,把数据下载回来”