四川省教育考试院官网最新动态获得工具,由论坛大佬原创制作的一款能及时获得四川省教育考试院官网最新动态信息的获得程序,由Python语言编写。对于需要不断刷新想要第一时间获得最新信息的朋友们考生们能够下载这款EXE程序,一旦有更新就会立即通知,不用苦苦等待刷新。
首先.访问官网www.sceea.cn
1.右击左边的列表,选择‘检查’
2.右击A标签
3.选择拷贝(copy)
4.拷贝Xpath路径,然后得到不一样的属性值
import requests
import time
from lxml import etree
import webbrowser
headers = {
'User-Agent': 'Mozilla/5.0(Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.105 Safari/537.36'
}
eduurl ='http://www.sceea.cn' # 四川教育考试院官网
alll = [] # 定义一款空列表,存放已访问过的标题
while True: # 死循环
HTMl = requests.get(eduurl, headers=headers).text
HTMl = etree.HTML(HTMl)
title = HTMl.xpath('//*[@id="news-left"]/li/a/@title') # 用Xpath获得文章标题
titletime = HTMl.xpath('//*[@id="news-left"]/li/span/span[2]/text()') # 用Xpath获得发布时间
urls = HTMl.xpath('//*[@id="news-left"]/li/a/@href') # 用Xpath获得文章连接
keyword = ['专科', '对口招生', '旅游', '高职'] # 建立一款关键字列表
for tit in title: # 在所有得到的标题里面遍历
for key in keyword: # 在所有关键字里面遍历
if key in tit: # 判断关键字出现在标题中
if tit in alll: # 判断标题在已访问过的标题列表里面
pass # 在里面就不作为
else: #
local = title.index(tit) # 获得标题在标题列表中的位置,用于得到发布时间
print(titletime[local] + ' ' + title[local] + '⁄n') # 打印出发布时间和文章标题
url = 'http://www.sceea.cn' + urls[local] # URL的拼接
webbrowser.open(url) # 打开查看器,访问文章
alll.软件end(tit) # 将已访问的标题添加到列表中,防止重复访问
time.sleep(600) # 设定延迟10分钟,相当于10分钟刷新一次吧
爬虫程序大部分功能通用,如果将代码中的官网以及相关设定进行替换,则能够获得其它教育网站的查询程序,源代码也在安装包内,能够下载学习
本站可以给你提供浏览器插件,插件下载,上网助手等相关下载软件,浏览辅助用户热评软件排行,向您推荐最受关注和最新的浏览辅助工具。在这里有着最新最全的浏览辅助工具、IE修复工具、AdobeFlashPlayer、广告屏蔽器、IE工具等各类浏览辅助软件免费下载。有需要的小伙伴们赶快来下载吧!
浏览安全 | 633.00KB
2020-08-25
下载浏览安全 | 12.00KB
2020-08-08
下载浏览安全 | 4.90MB
2016-01-28
下载浏览安全 | 655.00KB
2015-07-22
下载浏览安全 | 2.10MB
2015-07-08
下载浏览安全 | 196.00KB
2015-05-20
下载浏览安全 | 4.90MB
2015-05-19
下载浏览安全 | 1.60MB
2015-05-19
下载浏览安全 | 2.20MB
2015-05-19
下载浏览安全 | 3.40MB
2015-05-19
下载