最新消息:欢迎加入小松的QQ群一起讨论一起学习,搜索页面修改成lua+ElasticSearch,使用php这个页面速度相对慢一点,优化之后速度杠杠的,如有问题请加群联系我

小说正文程序

其他分享 62浏览 0评论

最近在看一个小说,发现看小说网站的几个麻烦的事,于是写了一个小程序来解决遇到的问题
看小说网站遇到的问题

1) 广告,我在手机看小说的时候,是不是的打开广告,应该是用一个div把下一页的给遮住了,点下一页的时候,必定点到广告,烦人
2)流量,小说网页上有大量的广告和js,css,手机用流量看流量跑的比较快,主要是月底了已经没有多少流量
3) 网页背景,我看小说喜欢用灰黑色的,跟编辑器的背景色一样,小说网上没有这个背景,看小说时间长了,眼睛难受
4) 看完一章都要点一下看下一章,希望我看完这一章,自动加载下一章
5) 看到哪里有记录,这样就不用记自己看到哪一章

小说正文提取的程序就是为了解决上面几个问题,目前我自己还在测试中
自己试了一下自己看的小说感觉不错
之后还有添加的功能,下一章 上一章按钮功能,离线缓存的功能,目前还在规划中
写程序也并不是一帆风顺的,也遇到了几个问题

程序并不是想之前使用正则比配出来内容,这样每一个网站都配一个规则,非常麻烦,百度找了一下正文提取的程序,来解决这个问题,貌似比配是的时候会有问题,这个还要在测试一下
还有就是编码问题,程序是根据网页中meta标签中charset属性来判断当前编码的,可以有些网页没有设置,如果抓取的内容是乱码,json输出的时候就会报错
程序有还有一个隐患,目前程序使用file_get_contents抓取网页,之后要考虑修改成curl 模拟agent,这样不会出现被拦截的情况

目前还在测试中,要测试使用的请联系我

附上一张这个功能的页面

小说正文程序

QQ交流群:136351212(满) 455721967

如无特别说明,本站文章皆为原创,若要转载,务必请注明以下原文信息:
转载保留版权:小松博客» 小说正文程序
本文链接地址:https://www.phpsong.com/3120.html

发表我的评论
取消评论
表情

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址
木有头像就木有JJ!点这里按步骤申请Gravatar头像吧!

网友最新评论 (4)

加载中,请稍候...
  1. uc浏览器好像把这个功能已经做得很好了,自动提炼小说主体,
    三水2017-06-05 15:14:28回复
    • 没有使用过UC游览器
      小松2017-06-05 15:40:51回复
  2. 楼主,分享代码看看。我想知道怎么匹配的
    jack2017-10-11 00:21:42回复
    • 主要使用了class.textExtract.php
      小松2017-10-11 11:11:42回复