代码
提交代码
import requests # requests库,用来发送网络请求
from bs4 import BeautifulSoup # 这是一个解析库,用来解析网页
url = "https://www.imooc.com" #慕课网首页地址
headers = {'User-Agent' : 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_5) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.79 Safari/537.36'} # 请求头部
r = requests.get(url, headers= headers) # 发送请求
bs = BeautifulSoup(r.text, "html.parser") # 解析网页
mooc_classes = bs.find_all("h3", class_="course-card-name") # 定位课程信息
class_list = []
for i in range(len(mooc_classes)):
title = mooc_classes[i].text.strip()
class_list.append("课程名称 : {} \n".format(title)) #格式化课程信息
with open('mooc_classes.txt', "a+") as f: # 将课程信息写入文本文件中
for text in class_list:
f.write(text)
运行结果