亚洲欧洲国产欧美一区精品,激情五月亚洲色五月,最新精品国偷自产在线婷婷,欧美婷婷丁香五月天社区

<nav id="oe4g2"></nav>

<table id="oe4g2"></table>

<noframes id="oe4g2"></noframes>

<samp id="oe4g2"></samp>

<fieldset id="oe4g2"></fieldset>

python

python編程基礎(chǔ) python網(wǎng)絡(luò)爬蟲 python數(shù)據(jù)分析 python科學(xué)計(jì)算 pythonWeb前端開發(fā) python后端高級(jí)開發(fā) python教程 python問答

當(dāng)前位置：中華考試網(wǎng) >> python >> python爬蟲 >> 文章內(nèi)容

python數(shù)據(jù)爬下來保存在哪里?

來源：中華考試網(wǎng) [2020年10月9日] 【大中小】

　　　python數(shù)據(jù)爬下來保存在本地，一般是文件或數(shù)據(jù)庫中，但是文件形式相比要更加簡(jiǎn)單，如果只是自己寫爬蟲玩，可以用文件形式來保存數(shù)據(jù)。

　　#coding=utf-8

　　import urllib.request

　　import re

　　import os

　　'''

　　XPath helper插件是chrome的一個(gè)插件，基于chrome核的瀏覽器也可以安裝。XPath helper可以用來調(diào)試XPath表達(dá)式。

python課程免費(fèi)試聽預(yù)約

地區(qū):
- 北京
- 天津
- 上海
- 江蘇
- 浙江
- 山東
- 江西
- 安徽
- 廣東
- 廣西
- 海南
- 遼寧
- 吉林
- 黑龍江
- 內(nèi)蒙古
- 山西
- 福建
- 河南
- 河北
- 湖南
- 湖北
- 四川
- 重慶
- 云南
- 貴州
- 新疆
- 西藏
- 陜西
- 青海
- 寧夏
- 甘肅
姓名:
手機(jī):

　　Urllib 模塊提供了讀取web頁面數(shù)據(jù)的接口，我們可以像讀取本地文件一樣讀取www和ftp上的數(shù)據(jù)

　　urlopen 方法用來打開一個(gè)url

　　read方法用于讀取Url上的數(shù)據(jù)

　　'''

　　def getHtml(url):

　　page = urllib.request.urlopen(url);

　　html = page.read();

　　return html;

　　def getImg(html):

　　imglist = re.findall('img src="(http.*?)"',html

　　return imglist

　　html = getHtml("https://www.zhihu.com/question/34378366").decode("utf-8");

　　imagesUrl = getImg(html);

　　if os.path.exists("D:/imags") == False:

　　os.mkdir("D:/imags");

　　count = 0;

　　for url in imagesUrl:

　　print(url)

　　if(url.find('.') != -1):

　　name = url[url.find('.',len(url) - 5):];

　　bytes = urllib.request.urlopen(url);

　　f = open("D:/imags/"+str(count)+name, 'wb');

　　f.write(bytes.read());

　　f.flush();

　　f.close();

　　count+=1

　　經(jīng)測(cè)試，基本功能還是可以實(shí)現(xiàn)的�；ǖ妮^多的時(shí)間就是正則匹配哪里，因?yàn)樽约簩?duì)正則表達(dá)式也不是非常熟悉。所以還是花了點(diǎn)時(shí)間。

責(zé)編：hym

上一篇：python爬蟲可以用來做什么?

下一篇：python3爬蟲如何帶上cookie?

相關(guān)文章

編輯推薦

python問答

更多

python教程

更多

會(huì)計(jì)考試
建筑工程
職業(yè)資格
醫(yī)藥考試
外語考試
學(xué)歷考試

初級(jí)會(huì)計(jì)職稱中級(jí)會(huì)計(jì)職稱經(jīng)濟(jì)師注冊(cè)會(huì)計(jì)師證券從業(yè)銀行從業(yè)會(huì)計(jì)實(shí)操統(tǒng)計(jì)師審計(jì)師高級(jí)會(huì)計(jì)師基金從業(yè)資格稅務(wù)師資產(chǎn)評(píng)估師國(guó)際內(nèi)審師 ACCA/CAT 價(jià)格鑒證師統(tǒng)計(jì)資格從業(yè)

人力資源考試教師資格考試出版專業(yè)資格健康管理師導(dǎo)游考試社會(huì)工作者司法考試職稱計(jì)算機(jī)營(yíng)養(yǎng)師心理咨詢師育嬰師事業(yè)單位教師招聘公務(wù)員公選考試招警考試選調(diào)生村官

成人高考高考中考自學(xué)考試考研 MBA考試

<small id="42qi2"></small>

<samp id="42qi2"></samp>

<button id="42qi2"><rt id="42qi2"></rt></button>