作为一个靠python为什么叫爬虫自学入門的菜鸟想和大家分享自己写的第一个也是目前为止唯一一个爬虫代码
写爬虫要具备的能力基础:python为什么叫爬虫入门基础,html5基础知识嘫后这边用的是scrapy框架,所以还要需要学习scrapy其实beautifulSoup也可以,我也是先学习了beautifulsoup写了一点之后发现scrapy更方便简单于是又学习用scrapy
先附一张别人的构思图片,我就是看到这个才有思路的再这边感谢那个作者,(已经忘记名字了)
我爬取的网站是“古诗文网(http://www.gushiwen.org/)”接下来就直接分享构思图和代码吧
最后爬取下来有几万首古诗词先存着吧,应该会用作为毕业设计
这边还要感谢知乎上交我写正则表达式的大神们,(比洳大神“黄哥”)
发布了22 篇原创文章 · 获赞 11 · 访问量 2万+