微博里的短域名


今天早上点开一看,我粘贴的wikii链接变成一个奇怪的链接,看上去和我以前在微博里看到别人分享的链接类似,但点击后还真就跳到了我粘的那个wiki页面。原来我看到那些链接的时候还以为他们都是粘贴的自己微博的地址,看来有可能,微博信息里的url都转化格式了。

是这样吗?

谷歌了一下,原来,现在的微博系统里,几乎无一例外的加入了“短域名”的功能。最初使其大范围使用的,就是Twitter。

查阅了一些资料,下面就来说说这个短域名相关的东西。

好处:

1.从短域名的“原罪”来讲,应该是为了节省存储空间。不单是每条记录的存储空间,对于去除数据冗余改进有效存储也很有帮助。昨天吃饭的时候我就在想,现在这个些社交网站信息量如此巨大,十年后的我们,还能查阅到今天发的某条微博或者日志吗?

2.增强品牌效应。比如当年谷歌g.cn是那么的好记,对于增大其市场占有率是有很大帮助的。以至于她退出中国的时候,仍然保留了这个域名服务。简洁性现在已经成了互联网行业的一种首要设计理念。

3. 改善用户体验。特别是针对连续粘贴几个url的时候,能减少用户烦躁。再一个就是能为手机用户减少天然缺陷带来的烦恼。在这一点上,我觉得淘宝最应该提供 这种服务,http://item.taobao.com/auction /item_detail.htm?item_num_id=6091817224肯定没有t.com/xxxx来得好记。

4.进一步商业空间的开发。,比如对该链接点击的次数时间频率等信息来进行数据挖掘,对服务提供方和流量来源方都有商业价值。甚至可以依此服务来深入开发产品和业务,类似于从流量里挖掘商业空间。现有的一些成功例子如360,返利网都是靠流量点击率来生存的。

不足:

1.健壮性(Robust)。包括唯一性,冲突率等指数。看到有人抱怨说goo.gl的解析规则不唯一,同一个url可以解析出不同的短域名来。

2.安全性。短域名可能被一些不法分子利用,比如生成一些类似的短地址而将链接转向一些不健康或不安全的网页上去。所以短域名使用较多的社交网站最好还是自己提供这个服务,而不是采用第三方的短域名服务。比如Twitter就已经这样做了。

3. 功能性。由于短域名从技术上讲就是哈希,因此如何选择哈希算法和如何解决冲突就成为了关键。特别是解决冲突,从解决方式可以分为两种:程序处理、用户定 义。一般来讲,解析出来的短域名的那一串哈希后缀是不可改变的,程序处理是正常的哈希冲突解决办法。用户定义可能从专业效率上不如程序处理,但从用户体验 和商业价值上远远高于前者,特别是在web2.0以用户为中心的时代。经查阅,现在tinyurl.com已经能够提供这种服务,用户可以自己定义短域名 的后缀,称为“语义url”。

在学习短域名的过程中我又学到了一个新名词:“62进制”。就是以数字和大小写字母一共62个字符作为基本映射单元来进行进制转换。

至于具体技术细节,没有太多好讲的,就是把原始url进行某个进制的转换之后生成key,原始url作为value,现在流行的Nosql都是这样key-value形式的存储。

猜你喜欢

转载自john521.iteye.com/blog/1123611