在Power BI Desktop中做数据地图时 , 由于BING地图中国数据不是那么准确 , 如果仅以汉字的地名来作图 , 经常出现莫名奇妙的情况 , 明明是国内的地址 , 会跑到国外去 。 所以最准确的办法就是通过经纬度来定位 。
文章插图
现在的网络上什么数据都有 , 搜索了一下 , 有很多网站提供经纬度查询 , 我们这种作图对经纬度的精度要求并不高 , 找了一个可以查询全国各省市县区级经纬度的网站:
文章插图
找到上海市 , 随便找一个区查一下:果然可以
文章插图
检查一下网页上的连接地址 , 很简单的结构 , 应该直接就可以抓取了:
文章插图
这种结构的网页 , 通常是通过子网页的连接来查找内容的 , 不是那种现成的数据表 , 一个页面上对我们有用的数据就只有三个:地名 , 经度 , 纬度 。 所以需要用文本的方式打开 , 然后筛选出来我们需要的内容 , 然后整理一下就好了 。
但是这么多的子网页我们不能一个一个的手工去添加 , 从任意一个页面进去 , 都有其他区的连接 , 我们就通过这个连接来自动添加 。
第一部分 获取全部的链接地址先来修改这个源的设置 , 注意一定要设置GB2312编码 , 否者汉字就是乱码 。
文章插图
保留行 , 109行开始 , 一共19行
文章插图
文章插图
接下来是提取内容:各区的名字与连接的地址:
这个提取>分隔符之间的文本 , 非常好用 。 高级设置里要跳过1个字符 , 大家观察一下 , 这个“<li>”中的“>”是第一个开始符号 , 我们需要的内容在第二个开始符号后 , 所以要跳过第一个开始符号 。
文章插图
获取连接地址也是同样的办法 , 不过不用跳过 , 直接就可以获取了:
文章插图
第二部分 抓取自定义列:还是用Web.Contents根据链接地址就可以查询了 。
文章插图
查询的结果是二进制文件 , 点击合并后会出来一个警告 , 点击编辑
文章插图
点击编辑后会出来一个对话框 , 这里还是要选择文本文件:
文章插图
接下来就是合并文件的操作了 , 还是要注意选择GB2312编码:
文章插图
Power Query会向我我们合并文件那样 , 自动生成一个自定义函数 , 并且引用这个自定义函数 , 把所有的页面合并起来 , 为了后续操作的简便 , 我们在右侧的步骤里后退一步 , 找到删除其他列 , 这里找回被自动删除的各区的名字 , 如果不找回来 , 后面要自己再提取一遍 。
文章插图
以上关于本文的内容,仅作参考!温馨提示:如遇专业性较强的问题(如:疾病、健康、理财等),还请咨询专业人士给予相关指导!
「辽宁龙网」www.liaoninglong.com小编还为您精选了以下内容,希望对您有所帮助:- 天秤座的特点 天秤座的性格
- 天秤座性格-天秤座性格女生
- 部分南方城市供暖-有集中供暖的南方城市
- 台湾小吃棺材板视频 台湾小吃棺材板的做法
- 前世今生测试你的前世 测试你的前世是什么转世
- 书房对厕所的风水好吗 书房风水禁忌
- 雪白的外套搭配浅绿色内衬,事业线微露多了几分性感,戴上墨镜,多了些霸气御姐范
- 家里养什么花最旺财旺人 选择寓意吉祥的花朵
- 汤唯的忽然出现,让我发现时尚圈的沧海遗珠,用心诉说气质穿衣
- 众星重现《仙剑》造型,张一山“猴版”李逍遥,网友:放过我们的眼睛吧