Python工程師的就業方向有很多,包括Python爬蟲開發,這是一個非常受歡迎的職位,也是很多公司的熱門職位。那么你知道面試Python爬蟲開發工程師會問哪些問題嗎?小編為大家提供了幾個相關的面試題,希望對大家有所幫助。
一、Scrapy和scrapy-redis有什么區別?
Scrapy是Python爬蟲的框架之一,高效且高度可定制,但不支持分布式;scrapy-redis是一套基于redis數據庫并運行在scrapy框架上的組件,它允許scrapy支持分布式策略。slaver端共享master端redis數據庫中的item隊列、請求隊列、請求指紋采集。
二、Scrapy框架的運行機制是什么?
從start_urls獲取第一批URL并發送請求,請求由引擎交給調度器進入請求隊列。請求完成后,調度器將請求隊列中的請求傳遞給下載器,獲取請求對應的資源,然后將響應交給自己編寫的解析方法進行提取處理。
1如果提取出需要的數據,直接下發到管道文件中進行處理;
2如果提取了URL,則繼續前面的步驟,直到請求隊列中沒有請求為止,程序就可以結束了。
三、Post和get的區別是什么?
post:請求無法緩存,post請求不會保存在瀏覽器瀏覽記錄中,post請求的url不能保存為瀏覽器書簽;沒有長度限制;請求會將請求的數據放在http請求包的正文中;Post比get更安全。
Get:從指定服務器獲取數據,Get請求可以被緩存;它將保存在瀏覽器的瀏覽歷史記錄中;get請求的URL可以保存為瀏覽器書簽;請求有長度限制;get請求主要用于獲取數據。
以上內容為大家介紹了2021年Python爬蟲面試題,希望對大家有所幫助,如果想要了解更多Python相關知識,請關注IT培訓機構:千鋒教育。http://www.kei0345678.cn/