资料介绍
针对数字城市研究手段不足,尤其在收集大量研究文献的基础上对数字城市进行整体研究上的欠缺,本文基于R语言和Selenium框架设计了稳定、高效的爬虫程序,获取了中国知网2018年5月前收录的数字城市为主题的研究文献,并建立了数字城市文献数据库和数字城市自动分词模型。通过分析数字城市研究的时序性、空间分布特征和研究热点,揭示了数字城市研究的发展历程、现状、发展趋势和研究热点。结果表明本文设计的网络爬虫程序在数字城市研究文献的收集方面具有可行性和有效性。
数字城市源自“数字地球”的概念,是把城市的地理信息和其他与城市相关的信息结合并存储在计算机网络中,让城市和城市外空间连接在一起的虚拟空间[1]。目前数字城市的建设在全国多个省份、城市中展开,william hill官网 深入城市的各个领域。关于数字城市的研究,近年来虽然不乏威廉希尔官方网站 和理论等方面的研究,但从获取大量的数字城市研究文献的角度对数字城市研究的发展历程、现状、发展趋势、研究热点的研究目前还没有。
网络爬虫是依据程序,interwetten与威廉的赔率体系 访问网页、自动化提取网页信息的脚本,是快速获取网页信息的一种方式。网络爬虫按照类型主要分为通用型爬虫、面向主题爬虫、分布式爬虫三种,相比较而言面向主题爬虫应用广泛,形式较为灵活,可针对特定的网页数据进行设计高效的爬虫程序。
本文采用面向主题的网络爬虫方法,以中国知网(National Knowledge Infrastructure, CNKI) 2018 年5 月前收录的以数字城市为主题的文献为研究对象,基于R 语言和Selenium 网络框架设计出网络爬虫程序。该程序对中国知网的网页进行分析,获取网页请求参数,模拟浏览器请求和响应服务器,最终获取了数字城市研究文献信息,将获取到的数据同步保存到本地,构建数字城市文献数据库(包括:编号、题名、作者、来源、发表时间、数据库、被引、下载次数、作者单位、摘要、关键词、资助基金共12 个字段)。并以数字城市文献数据库为数据基础,基于文本挖掘威廉希尔官方网站 构建了数字城市自动分词模型,通过分析数字城市研究的时序性、空间分布特征和研究热点,揭示了数字城市研究的发展历程、现状、发展趋势和热点。
数字城市源自“数字地球”的概念,是把城市的地理信息和其他与城市相关的信息结合并存储在计算机网络中,让城市和城市外空间连接在一起的虚拟空间[1]。目前数字城市的建设在全国多个省份、城市中展开,william hill官网 深入城市的各个领域。关于数字城市的研究,近年来虽然不乏威廉希尔官方网站 和理论等方面的研究,但从获取大量的数字城市研究文献的角度对数字城市研究的发展历程、现状、发展趋势、研究热点的研究目前还没有。
网络爬虫是依据程序,模拟访问网页、自动化提取网页信息的脚本,是快速获取网页信息的一种方式。网络爬虫按照类型主要分为通用型爬虫、面向主题爬虫、分布式爬虫三种,相比较而言面向主题爬虫应用广泛,形式较为灵活,可针对特定的网页数据进行设计高效的爬虫程序。
本文采用面向主题的网络爬虫方法,以中国知网(National Knowledge Infrastructure, CNKI) 2018 年5 月前收录的以数字城市为主题的文献为研究对象,基于R 语言和Selenium 网络框架设计出网络爬虫程序。该程序对中国知网的网页进行分析,获取网页请求参数,模拟浏览器请求和响应服务器,最终获取了数字城市研究文献信息,将获取到的数据同步保存到本地,构建数字城市文献数据库(包括:编号、题名、作者、来源、发表时间、数据库、被引、下载次数、作者单位、摘要、关键词、资助基金共12 个字段)。并以数字城市文献数据库为数据基础,基于文本挖掘威廉希尔官方网站 构建了数字城市自动分词模型,通过分析数字城市研究的时序性、空间分布特征和研究热点,揭示了数字城市研究的发展历程、现状、发展趋势和热点。
- 网络爬虫,Python和数据分析 0次下载
- 用Python写网络爬虫 21次下载
- 什么是网络爬虫使用Python写网络爬虫的教程说明 3次下载
- 用Python写网络爬虫的PDF电子书免费下载 9次下载
- 爬虫是如何实现数据的获取爬虫程序如何实现 10次下载
- 如何设计一个网络爬虫程序进行智慧城市研究的获取与分析 9次下载
- 如何使用大数据威廉希尔官方网站 进行居民在夜间的情感变化研究资料分析 5次下载
- python爬虫入门教程之python爬虫视频教程分布式爬虫打造搜索引擎 29次下载
- 应用Verilog HDL进行数字系统设计实例 88次下载
- 一种新型网络爬虫的设计与实现
- 一种新的网络爬虫带宽控制策略
- 一种维护WAP网站的网络爬虫的设计
- 基于HTMLParser 信息提取的网络爬虫设计Design
- 用MatLab进行数字信号处理
- “数字城市”初步研究
- 如何看待Python爬虫的合法性? 451次阅读
- 网络封包分析软件——Wireshark抓包教程 1187次阅读
- 爬虫的学习方法 736次阅读
- Python-爬虫开发01 507次阅读
- 网络数据包分析软件wireshark的基本使用 2853次阅读
- 爬虫威廉希尔官方网站 为什么变成了害虫?爬虫威廉希尔官方网站 到底犯了什么错? 4164次阅读
- 如何解决爬虫被封的问题 5141次阅读
- Python爬虫8个常用的爬虫技巧分析总结 5009次阅读
- Python3网络爬虫入门实战解析 5390次阅读
- Python爬虫速成指南让你快速的学会写一个最简单的爬虫 7001次阅读
- Python学习爬虫掌握的库资料大全和框架的选择的分析 5102次阅读
- 网络爬虫教程(1):音乐歌单编写 1098次阅读
- 初学者写Python爬虫的四大工具 5721次阅读
- 针对中小城市GSM网络的网络规划和整治流程及方案分析 648次阅读
- EDA威廉希尔官方网站 进行数字电路设计 3647次阅读
下载排行
本周
- 1HFSS电磁仿真设计应用详解PDF电子教程免费下载
- 24.30 MB | 128次下载 | 1 积分
- 2雷达的基本分类方法
- 1.25 MB | 4次下载 | 4 积分
- 3电感威廉希尔官方网站 讲解
- 827.73 KB | 2次下载 | 免费
- 4从 MSP430™ MCU 到 MSPM0 MCU 的迁移指南
- 1.17MB | 2次下载 | 免费
- 5有源低通滤波器设计应用说明
- 1.12MB | 2次下载 | 免费
- 6RA-Eco-RA2E1-48PIN-V1.0开发板资料
- 35.59 MB | 2次下载 | 免费
- 7面向热插拔应用的 I2C 解决方案
- 685.57KB | 1次下载 | 免费
- 8爱普生有源晶体振荡器SG3225EEN应用于储能NPC、新能源
- 317.46 KB | 1次下载 | 免费
本月
- 12024年工控与通信行业上游发展趋势和热点解读
- 2.61 MB | 763次下载 | 免费
- 2HFSS电磁仿真设计应用详解PDF电子教程免费下载
- 24.30 MB | 128次下载 | 1 积分
- 3继电保护原理
- 2.80 MB | 36次下载 | 免费
- 4正激、反激、推挽、全桥、半桥区别和特点
- 0.91 MB | 32次下载 | 1 积分
- 5labview实现DBC在界面加载配置
- 0.57 MB | 21次下载 | 5 积分
- 6在设计中使用MOSFET瞬态热阻抗曲线
- 1.57MB | 15次下载 | 免费
- 7GBT 4706.1-2024家用和类似用途电器的安全第1部分:通用要求
- 7.43 MB | 14次下载 | 免费
- 8AD18学习笔记
- 14.47 MB | 8次下载 | 2 积分
总榜
- 1matlab软件下载入口
- 未知 | 935113次下载 | 10 积分
- 2开源硬件-PMP21529.1-4 开关降压/升压双向直流/直流转换器 PCB layout 设计
- 1.48MB | 420061次下载 | 10 积分
- 3Altium DXP2002下载入口
- 未知 | 233084次下载 | 10 积分
- 4电路仿真软件multisim 10.0免费下载
- 340992 | 191360次下载 | 10 积分
- 5十天学会AVR单片机与C语言视频教程 下载
- 158M | 183329次下载 | 10 积分
- 6labview8.5下载
- 未知 | 81578次下载 | 10 积分
- 7Keil工具MDK-Arm免费下载
- 0.02 MB | 73804次下载 | 10 积分
- 8LabVIEW 8.6下载
- 未知 | 65985次下载 | 10 积分
评论
查看更多