V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
tanteng
V2EX  ›  PHP

看看这个 url 格式为什么用加密的形式?

  •  
  •   tanteng · 2015-03-12 10:53:03 +08:00 · 4647 次点击
    这是一个创建于 3578 天前的主题,其中的信息可能已经有所发展或是发生改变。

    http://game.163.com/14/1209/10/AD13QG2L00314TM7.html
    我想问一下这个url为什么搞成这种形式,AD13QG2L00314TM7像是加密的一样,这样的网址又不好记又不美观,可能是基于什么考虑的呢?

    19 条回复    2015-03-13 03:08:22 +08:00
    Arrowing
        1
    Arrowing  
       2015-03-12 11:14:13 +08:00
    应该是对应文章类型与标题,方便存储而已
    rayseer
        2
    rayseer  
       2015-03-12 11:20:56 +08:00
    生成的静态网页。
    pockry
        3
    pockry  
       2015-03-12 11:25:03 +08:00
    可能有防采集的原因吧。
    binux
        4
    binux  
       2015-03-12 11:32:08 +08:00
    我觉得你想多了,就这篇文章来说。

    用中文吗?
    http://game.163.com/14/1209/10/天谕玩家原创网络剧《谕宅一族》第一集.html
    兼容性有问题,这样的标题被用户复制之后,放在不同编码的页面里面,url 是不同的。

    用拼音吗?
    http://game.163.com/14/1209/10/tian-yu-wan-jia-yuan-chuang-wang-luo-ju-yu-zhai-yi-zu-di-yi-ji
    你会去读吗?SEO 也没有任何意义。

    url 用英文吗?
    http://game.163.com/14/1209/10/days-the-player-declares-the-original-series-first-episode-of-Oracle-home-owners
    谁看得懂?

    人写 url 的话,编辑成本又加大了。
    还不如干脆就用某种方式映射为 id 就好了。
    tanteng
        5
    tanteng  
    OP
       2015-03-12 11:40:19 +08:00
    @binux 那为什么不用本来的id
    tanteng
        6
    tanteng  
    OP
       2015-03-12 11:40:35 +08:00
    @pockry 嗯,这个有可能
    xfspace
        7
    xfspace  
       2015-03-12 11:46:17 +08:00
    @tanteng 用ID方便采集...
    yibin001
        8
    yibin001  
       2015-03-12 11:46:26 +08:00
    @tanteng
    id是连续的啊,一遍历就全采集到了。
    vvtommy
        9
    vvtommy  
       2015-03-12 11:51:13 +08:00
    @tanteng 有可能这就是本来的ID
    abelyao
        10
    abelyao  
       2015-03-12 12:12:23 +08:00
    @tanteng 这也是 ID 的一种,根据类目+时间戳 等各种元素组合起来生成的一个 ID,在设计订单号或者流水号的时候有有多种设计方案
    binux
        11
    binux  
       2015-03-12 12:14:35 +08:00
    @tanteng 你怎么知道这不是原来的 id?
    cevincheung
        12
    cevincheung  
       2015-03-12 12:14:56 +08:00   ❤️ 1
    ID的本意就是对一个复杂事物或者一个简单的对象的别名、别称或编号。不一定非要是数字才能被称为ID
    orvice
        13
    orvice  
       2015-03-12 12:52:21 +08:00
    就是id吧。。
    cismous
        14
    cismous  
       2015-03-12 13:58:03 +08:00
    举个例子,我们所用的用户名
    leyle
        15
    leyle  
       2015-03-12 15:06:45 +08:00
    这个本来就是文章或者文章列表的 ID,在客户端上,不同的 entry 有不同的类似这样的 ID,点开后,服务器返回给客户端的 json 中包含了很多这样的文章 ID,本来就不是给人看的。

    可以看我以前的分析: http://www.leyle.com/archives/163spider.html
    kisshere
        16
    kisshere  
       2015-03-12 16:15:58 +08:00 via Android
    用ID一个爬虫就爬完了
    zhangyh26258
        17
    zhangyh26258  
       2015-03-12 17:13:51 +08:00
    不是给人看的。老鬼知道他/她怎么写urlpattern的
    atom
        18
    atom  
       2015-03-12 17:52:44 +08:00
    @binux
    膜拜
    shakoon
        19
    shakoon  
       2015-03-13 03:08:22 +08:00
    宇宙行的url是我见过的网站中最奇葩的,所有目录都是中文名
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5333 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 32ms · UTC 07:41 · PVG 15:41 · LAX 23:41 · JFK 02:41
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.