V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
推荐学习书目
Learn Python the Hard Way
Python Sites
PyPI - Python Package Index
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
Styles
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
jason52
V2EX  ›  Python

手写一个飞鱼秀爬虫

  •  
  •   jason52 · 2015-04-17 20:58:32 +08:00 · 4275 次点击
    这是一个创建于 3543 天前的主题,其中的信息可能已经有所发展或是发生改变。

    https://v2ex.com/t/183526

    根据这个提出的问题,实现了一下python版本的爬虫。

    我去看了一下飞鱼秀官网,上都上不去。改版真是改的蛋疼~~

    而且历史版本也不保留了。我想可以服务器跑一个爬虫进程,然后命令行倒过去让百度网盘下载,留个历史存档呀~~~~

    链接地址: http://pan.baidu.com/s/1o6FV6Fg

    以及我之前录了几个 http://pan.baidu.com/s/1o6uWJ8m

    另外 推荐一个飞鱼秀剪辑片段 http://pan.baidu.com/s/1jGqvsrG
    哈哈哈,谁还记得曼丽姐姐~

    第 1 条附言  ·  2015-04-17 21:50:46 +08:00
    再分享一个大家不要来找茬 http://pan.baidu.com/s/1bni1Z8F
    21 条回复    2015-07-14 00:57:53 +08:00
    yuewolf
        1
    yuewolf  
       2015-04-17 21:24:50 +08:00
    没看明白,你是要分享这个爬虫代码吗?

    怎么没有放出来?
    jason52
        2
    jason52  
    OP
       2015-04-17 23:52:59 +08:00 via Android
    额~~~~~~~
    manoon
        3
    manoon  
       2015-04-17 23:55:04 +08:00
    这个,需要爬虫么?14年以后,他们的文件全都是有规律的呀。一行代码的事情就“爬”完了
    jason52
        4
    jason52  
    OP
       2015-04-18 00:02:19 +08:00 via Android
    @manoo 需要哒~~哈哈他们改版啦!!!!
    jason52
        5
    jason52  
    OP
       2015-04-18 00:02:53 +08:00 via Android
    哥无节操卖萌有点过啦了。
    manoon
        6
    manoon  
       2015-04-18 00:23:56 +08:00
    @jason52 卖萌无耻!
    放出你的源码,饶你不SI!

    (我先秀一下我的下限:

    for i in $(seq 1 31);
    do
    if [ $i -lt 10 ]; then
    new="0"
    i=$new$i
    fi
    echo $i
    wget http://mod.cri.cn/eng/ez/morning/2014/ezm1405$i.mp3
    sleep 30
    done



    whatisnew
        7
    whatisnew  
       2015-04-18 02:53:03 +08:00
    为什么都用 python 写爬虫?
    python 写爬虫有什么优点?
    WangMinjun
        8
    WangMinjun  
       2015-04-18 09:41:45 +08:00
    终于又更新!!
    jason52
        9
    jason52  
    OP
       2015-04-18 09:47:19 +08:00
    @whatisnew python 大法好!
    surftheair
        10
    surftheair  
       2015-04-18 10:02:01 +08:00 via iPhone
    不是有同学找到官方的API完美解决了么?
    jason52
        11
    jason52  
    OP
       2015-04-18 10:37:25 +08:00
    @surftheair 就是基于官方api的。只是我展示一下py怎么搞~~
    surftheair
        12
    surftheair  
       2015-04-18 10:45:41 +08:00
    @jason52 用API的还能叫爬虫么?请展示py源码
    jason52
        13
    jason52  
    OP
       2015-04-18 11:08:37 +08:00
    @surftheair 真是爬虫我也不能把它油炸了吃了不是~
    manoon
        14
    manoon  
       2015-04-18 15:21:13 +08:00
    @jason52 一天不给源码,我们就在你家门口静坐一天!!!
    @surftheair 哈哈
    jason52
        15
    jason52  
    OP
       2015-04-18 16:57:44 +08:00
    @manoon
    @surftheair 源码俺可真是写在视频里面啦啊~~~
    jason52
        16
    jason52  
    OP
       2015-04-18 16:59:16 +08:00
    jason52
        17
    jason52  
    OP
       2015-04-18 17:02:55 +08:00 via Android
    有点水呵呵
    jason52
        18
    jason52  
    OP
       2015-04-18 17:07:09 +08:00 via Android
    你们难道没看复言里面的小作弊器,还是那个比较厉害,虽然也不是我写的。。。。
    weisshizuoze
        19
    weisshizuoze  
       2015-04-18 18:05:43 +08:00
    感兴趣你是怎末实现百度网盘下载的?
    jason52
        20
    jason52  
    OP
       2015-04-18 19:25:18 +08:00 via Android
    @weisshizuoze 命令行版本。。提交一下链接就行。
    plantparknet
        21
    plantparknet  
       2015-07-14 00:57:53 +08:00
    好像有问题,需要对title做encode
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2611 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 06:43 · PVG 14:43 · LAX 22:43 · JFK 01:43
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.