当前位置: 首页 > news >正文

手机手机端网站建设如何进入网站

手机手机端网站建设,如何进入网站,网站公司做网站修改会收费吗,南宁国贸网站建设网上所有代码都无法完全克隆单个网页,不是Css,Js下载不下来就是下载下来也不能正常显示,只能自己写了,记得点赞~ 效果如图: 源码与所需的依赖: pip install requests pip install requests beautifulsoup4…

网上所有代码都无法完全克隆单个网页,不是Css,Js下载不下来就是下载下来也不能正常显示,只能自己写了,记得点赞~

 效果如图:

源码与所需的依赖:

pip install requests
pip install requests beautifulsoup4 lxml 
requests.packages.urllib3.disable_warnings()
pip install urllib3
pip install pyOpenSSL requests[security] urllib3[secure]
import os
import time
import requests
from urllib.parse import urljoin
from bs4 import BeautifulSoup# 配置requests,不验证SSL证书
requests.packages.urllib3.disable_warnings()
session = requests.Session()
session.verify = False  # 不推荐,仅用于测试目的def sanitize_filename(filename):return "".join(i for i in filename if i not in "\/:*?<>|").split('?')[0]def ensure_dir(file_path):if file_path:directory = os.path.dirname(file_path)if directory and not os.path.exists(directory):os.makedirs(directory)def download_resource(url, dest_folder, local_path):try:r = session.get(url, stream=True)r.raise_for_status()ensure_dir(local_path)with open(local_path, 'wb') as f:for chunk in r.iter_content(chunk_size=8192):f.write(chunk)return Trueexcept requests.exceptions.RequestException as e:print(f"Error downloading {url}: {e}")return Falsedef update_resource_links(soup, tag, attribute, base_url, dest_folder, sub_folder):resources = soup.find_all(tag, {attribute: True})for resource in resources:old_url = resource[attribute]new_url = urljoin(base_url, old_url)local_filename = sanitize_filename(new_url.split('/')[-1])local_path = os.path.join(dest_folder, sub_folder, local_filename)full_local_path = os.path.abspath(local_path)if download_resource(new_url, dest_folder, full_local_path):resource[attribute] = os.path.join(sub_folder, local_filename).replace('\\', '/')def save_complete_webpage(url, dest_folder):response = session.get(url)response.raise_for_status()# 尝试从响应头部或内容中获取编码if response.encoding is None:response.encoding = response.apparent_encodingsoup = BeautifulSoup(response.content, 'html.parser', from_encoding=response.encoding)base_url = urlupdate_resource_links(soup, 'img', 'src', base_url, dest_folder, 'images')update_resource_links(soup, 'link', 'href', base_url, dest_folder, 'css')update_resource_links(soup, 'script', 'src', base_url, dest_folder, 'js')ensure_dir(os.path.join(dest_folder, 'index.html'))with open(os.path.join(dest_folder, 'index.html'), 'w', encoding=response.encoding) as file:file.write(soup.prettify())if __name__ == "__main__":timestamp = str(int(time.time()))[-5:]  # 获取当前时间戳的最后5位数字target_url = input("请输入网址:")  # 目标网址destination_folder = f'downloaded_website_{timestamp}'  # 添加时间戳后5位的本地文件夹路径save_complete_webpage(target_url, destination_folder)print(f"已完整,保存到{destination_folder}文件夹中")

 

http://www.ritt.cn/news/27914.html

相关文章:

  • 我有网站 怎么做淘宝推广seo的中文含义是什么
  • 富顺做网站windows优化大师下载安装
  • 雁塔区网站建设百度搜索app
  • 网站界面设计规则李江seo
  • 网站市场推广免费seo教程
  • 在b站看视频的好处广州最新新闻事件
  • 莱芜都市网官网seo优化论坛
  • wordpress站点进入时弹窗西安网是科技发展有限公司
  • 做公司的网站的需求有哪些内容全网营销推广方案
  • 建设银行信用卡管理中心网站首页百度教育会员
  • 建网站主机优化大师电脑版官方免费下载
  • 主流做网站网站建设全网营销
  • spark怎么做网站数据库seo优化范畴
  • 那里有做网站搜索引擎优化方法有哪几种
  • 在网站上做招聘版面网络营销的六大特征
  • php做网站框架哪个公司的网站制作
  • 中恒建设集团有限公司 网站搜索引擎入口大全
  • 自己做网站 有名6一份完整的市场调查方案
  • 有域名在本机上做网站推广赚钱的软件
  • 做区域分析的地图网站提高工作效率
  • 一起做网站广州重庆网站推广
  • 常平做网站百度推广首次开户需要多少钱
  • 网站建设含意如何优化网络速度
  • 外贸网站设计制作优化推广江苏网站推广
  • 淘客网站是怎么做的seo是什么职业
  • wordpress做商城网站吗资阳市网站seo
  • 网站备案接入商变更搜索引擎优化培训班
  • 怎么做韩剧网站的翻译淄博seo网络公司
  • 浦东做网站app平台搭建需要多少钱
  • 家居网站模板哈尔滨seo