缘起
自从圣诞节“丁香医生”在公众号上发布了一篇《百亿保健帝国权健,和它阴影下的中国家庭》的文章,沉搁几年的一个案件重新回到大众视野,几乎一天之内相关系列的文章占据了各大媒体头条,成为了全网热点话题。
现在,具体事件缘由各位可以自行搜索,相关案件和公司也还在调查当中,有关权健和丁香医生之间的隔空对话,本文就不展开了,本文主要说在得知这件事的第二天,我通过各大电商平台搜索权健产品,作为IT男就从IT角度说下自己的感受,试着整理下电商平台搜索规则。
电商平台搜索结果
- 苏宁易购(https://search.suning.com/权健/)
- 当当网(http://search.dangdang.com/?key=Ȩ��)
- 唯品会(https://category.vip.com/suggest.php?keyword=权健)
整理
关键字编码
网址链接中的中文通常需要编码,中文常用的编码有两种gbk(GB2312)编码和UTF-8编码,前者一个汉字对应两组%xx,即%xx%xx,后者一个汉字对应三组%xx,即%xx%xx%xx,以“权健”两个汉字为例,UTF-8编码后为(%C8%A8%BD%A1),gbk编码后为(%E6%9D%83%E5%81%A5)。
对比各平台的编码规则如下(搜索后通过浏览器的地址栏查看,搜索通常直接使用get请求),如果读者打开本页面发现前面地址有乱码,这当前浏览器选择的另一种编码格式(浏览器只正常显示符合当前编码规则和未编码的内容):
- gbk:淘宝、苏宁易购
- utf-8:天猫、当当网
- 未编码:京东、唯品会
结果分析
淘宝表示目前还在等待总局通知,不过毕竟民心所向,淘宝还是下架了商品,天猫上也只是搜索到不相关的商家,其它各平台已经无法找到权健痕迹,事实上各平台早早开始声明自身立场,甚至唯品会宣称从来没卖过权健商品。
不过,从搜索的过程来看各家搜索处理方式各不相同,以下说说自己的观察:
- 淘宝:搜索栏的关键词推荐还有相关内容,只是搜索结果中无法找出商品了,可见淘宝的搜索部门各司其职,但部门太多估计有环节漏了。
- 天猫:可以搜索到个别名字类似,但实质不相关商品,跟淘宝相比天猫的入驻门槛较高,在处理商家上相对比较谨慎,不像淘宝里面可以一刀切,天猫还是相对理智;当然,关键字推荐一样可以找到。
- 京东:处理的干脆果断,当然东哥前段时间出了点状况,现在还在重塑个人品牌,这种时候一定是站队坚决。
- 苏宁:其商品是由于相关法律法规和政策,商品无法显示,从处理方式上相对比较圆滑,不得罪商家、也不得罪消费者,只是通过一个声明表明自身的中立,也许风声一过就可以恢复。
- 当当:当当早已不只卖书了,它的搜索商品里已经没有,搜索关键词也删除了,不过,搜索的热门推荐里还有。
- 唯品会:好吧,一点痕迹没有。
个人思考
之前看吴军的《数学之美》了解到google做好一个搜索引擎非常不容易,其中涉及的数学模型和算法早已超过了普通人的认知;而作为电商平台,其搜索推荐引擎原则跟google又如出一辙,在如此庞大公司中管理如此庞大的系统,各团队部门都有自己的利益诉求和技术难点,想想背后的故事,简直太刺激了。
从莆田系到权健系,不知还有多少不为人知的故事,我想后面还会有XX系,所有的黑暗都终将呈现在阳光下。正所谓:“善恶终有报、天道好轮回,不信抬头看,苍天绕过谁。”
扫码关注公众号,换个角度看世界。