发帖

【优惠升级】华秋PCB首单最高立减100元，SMT免费贴片！！！

[问答]

什么是爬虫？

1193 爬虫

问答对人有帮助，内容完整，我也想知道答案 0 什么是爬虫？爬虫的价值？最简单的python爬虫爬虫基本架构 0
2020-11-5 06:13:12　　评论淘帖0 邀请回答您可以邀请以下用户，快速回答问题 × 陈该类别下有 5 个回答。邀请回答 jf_71236567 该类别下有 3 个回答。邀请回答 tijing忽忽该类别下有 2 个回答。邀请回答 HELLOKITTYNEW 该类别下有 2 个回答。邀请回答 dlksmad 该类别下有 2 个回答。邀请回答 nvwwerwr 该类别下有 2 个回答。邀请回答 mu0543 该类别下有 2 个回答。邀请回答 60user28 该类别下有 2 个回答。邀请回答 To7ny 该类别下有 2 个回答。邀请回答 yhsales 该类别下有 2 个回答。邀请回答 puzhang549 该类别下有 2 个回答。邀请回答 ZONEK 该类别下有 2 个回答。邀请回答 asd005 该类别下有 1 个回答。邀请回答 byyyyyyyyyyyy 该类别下有 1 个回答。邀请回答陈涛少01 该类别下有 1 个回答。邀请回答 naugia 该类别下有 1 个回答。邀请回答 dang28 该类别下有 1 个回答。邀请回答 mmvjsuds 该类别下有 1 个回答。邀请回答顺风之鱼该类别下有 1 个回答。邀请回答 wq644921241 该类别下有 1 个回答。邀请回答举报刘佳相关推荐 • 如何运行imdb爬虫？ 2209 • 使用爬虫代理错误问题解决方案 1571 • 请问packet capture爬虫软件抓取的数据怎么做成网页链接？ 3181 • 请问哪位大神可以分享一下scrapy的架构和原理吗？ 14460 • 物联网平台上的数据导出 10618 • 菜鸟求助，如何在labview中实现网页按钮点击操作（按钮只有value及type=submit，无ID，无Name属性） 4866 • 5G与人工智能的关系 4364 • 传感器和人工智能的关系 5723 • 你都知道Python主要应用于哪些领域吗？ 953 • 什么是Python？看了这篇文章呢就知道了 31305 4个回答

答案对人有帮助，有参考价值 0 什么是爬虫？爬虫的本质就是将互联网网页(数据)下载下来的程序。爬虫通常为PC端爬虫、以及移动端爬虫（接口数据窃取抓包 wap站），当然我们更多的是使用PC端的爬虫。如下图可以看出爬虫相对于人浏览网页的不同，可以在脑袋里有个简单的概念。通过对互联网无数个url数据的下载，url之间可能又有关联，于是形成了犹如蜘蛛网状的结构，而爬虫就守在这张大网之上，因此我们通常又将爬虫成为蜘蛛。

2020-11-5 16:29:51 评论举报徐敏

答案对人有帮助，有参考价值 0 爬虫的价值？列几个简单的例子，看看就行搜索引擎今日头条比价网大数据

2020-11-5 16:29:58 评论举报徐音之

答案对人有帮助，有参考价值 0 最简单的python爬虫 urllib库基于python3.5 # encoding:UTF-8import urllib.requestdef download_data(): url = "http://www.baidu.com" response = urllib.request.urlopen(url) print(response.getcode()) if response.getcode() == 200: print(response.read())download_data() 运行结果如下可以看出爬虫下载都是网页源码。

2020-11-5 16:30:05 评论举报刘龙飞

答案对人有帮助，有参考价值 0 爬虫基本架构由上图可以看出爬虫一般由爬虫调度器、URL管理器、网页下载器、网页解析器、数据存储这几个模块组成。爬虫调度器主要是对url管理器、网页下载器网页解析器进行管理。 URL管理器主要通过初始url及网页解析器获得的url进行存储管理，并为调度器提供接口，为网页下载器提供下载入口。网页下载器主要功能就是下载该url下的网页数据(源码) 网页解析器一方面解析出我们需要的价值数据，一方面又将网页下载器下载数据中的url存储到url管理器中。数据存储是将网页解析器的解析的价值数据存储到内存、数据库、文件等。

2020-11-5 16:30:14 评论举报姜钰

撰写答案

你正在撰写答案

如果你是对答案或其他答案精选点评或询问，请使用“评论”功能。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容图片侵权或者其他问题，请联系本站作侵删。侵权投诉

我要提问

精选推荐

“0元购”智元灵犀X1机器人，软硬件全套图纸和代码全公开！资料免费下载！

3688 浏览 2 评论
关于卷积神经网络，这些概念你厘清了么~

1399 浏览 0 评论
【实操文档】在智能硬件的大模型语音交互流程中接入RAG知识库

6741 浏览 1 评论
防止AI大模型被黑客病毒入侵控制（原创）聆思大模型AI开发套件评测4

1092 浏览 0 评论
不可错过！人工神经网络算法、PID算法、Python人工智能学习等资料包分享（附源代码）

3413 浏览 0 评论

快速回复 返回顶部 返回列表

关注微信公众号

电子发烧友网

电子发烧友论坛

社区合作: 刘勇; 联系电话：15994832713; 邮箱地址：liuyong@huaqiu.com

社区管理: elecfans短短; 微信：elecfans_666; 邮箱：users@huaqiu.com

【优惠升级】华秋PCB首单最高立减100元，SMT免费贴片！！！

返回机器人论坛

回复

关闭

站长推荐 /7

快速回复 返回顶部 返回列表

- 威廉希尔官方网站社区: HarmonyOS威廉希尔官方网站社区

RISC-V MCU威廉希尔官方网站社区

FPGA开发者威廉希尔官方网站社区

- OpenHarmony开源社区: OpenHarmony开源社区

- 嵌入式论坛: ARM威廉希尔官方网站论坛

STM32/STM8威廉希尔官方网站论坛

嵌入式威廉希尔官方网站论坛

单片机/MCU论坛

RISC-V威廉希尔官方网站论坛

瑞芯微Rockchip开发者社区

FPGA|CPLD|ASIC论坛

DSP论坛

- 电路图及DIY: 电路设计论坛

DIY及创意

电子元器件论坛

专家问答

- 电源威廉希尔官方网站论坛: 电源威廉希尔官方网站论坛

无线充电威廉希尔官方网站

- 综合威廉希尔官方网站与应用: 机器人论坛

USB论坛

电机控制

模拟威廉希尔官方网站

音视频威廉希尔官方网站

综合威廉希尔官方网站交流

上位机软件（C/Python/Java等）

- 无线通信论坛: WIFI威廉希尔官方网站

蓝牙威廉希尔官方网站

天线|RF射频|微波|雷达威廉希尔官方网站

- EDA设计论坛: PCB设计论坛

DigiPCBA论坛

Protel|AD|DXP论坛

PADS威廉希尔官方网站论坛

Allegro论坛

multisim论坛

proteus论坛|仿真论坛

KiCad EDA 中文论坛

DFM|可制造性设计论坛

- 测试测量论坛: LabVIEW论坛

Matlab论坛

测试测量威廉希尔官方网站

传感威廉希尔官方网站

- 招聘/交友/外包/交易/杂谈: 项目外包

供需及二手交易

工程师杂谈|交友

招聘|求职|工程师职场

- 官方社区: 发烧友官方/活动

华秋商城

华秋电路

time

recommend

hot

post

—
—
—

版
块
导
航