相关动态
【Hadoop笔记_4】项目案例实战
2024-11-10 18:08

【Hadoop笔记_4】项目案例实战

  • 第一部分:Hadoop介绍及安装

  • 第二部分:HDFS

  • 第三部分:MapReduce

分析资料

  • 链接:https://pan.baidu.com/s/1sn9uRWi3Rhl4GL4g04Tv5w 提取码:zidg

6.1 项目开发流程

在这里插入图片描述

6.2 项目任务

6.2.1 合并小文件

说明

  • 由于在网络上挖掘下来的数据可能不止一个文件,而对每一个小文件进行MapReduce分析则需要分成等数量的块,很可能会对mapreduce造成很大的压力,所以在之前根据需求有必要进行一个简单的文件合并

代码

FirstStep.java
 
6.2.2 完成网站KPI指标的统计

说明

  • KPI:关键业绩指标
  • 我们可以通过KPI看出这个网站的经营状况
  • 这里我们统计和
1、页面访问量统计

代码

LogEntity.java
 
WebVisitsNumsJob.java / WebVisitsNumsMapper.java / WebVisitsNumsReduce.java
 
2、页面访问量统计数据写到MySQL数据库中

代码

LogWritable.java
 
MRToMysqlMapper.java / MRToMysqlJob.java
 
3、页面独立IP的访问量统计

说明

  • 独立IP,即统计每个IP的访问量

代码

LogEntity.java
 
AloneIPVisitsNumsMapper.java / AloneIPVisitsNumsCombiner.java
 
AloneIPVisitsNumsReduce.java / StringSameCount.java
 
AloneIPVisitsNumsJob.java
 
4、页面独立IP的访问量统计写到MySQL中
AloneIpWritable.java
 
MRToMysqlMapper.java / MRToMysqlJob.java
 

6.2.3 在网页上显示 网页访问量统计的top5
1、MVC框架说明

M:module,业务模型,用于提供数据

V:view,视图、用户界面,用于显示数据

C:controller,控制器、分发,用于分发请求

2、新建Web项目

之前已经使用分析出了结果,并将数据写入到了中,现在如果要将数据显示到网页上就得新建一个web项目

  1. 新建一个web项目-

  2. 设置为3.0即可

  3. 一直,最后勾选然后即可。

3、项目结构

在这里插入图片描述

4、代码
1、实体类
 
2、工具类
 
3、Dao层
 
 
4、控制层
 
5、页面
 

6.2.4 在网页上显示 独立Ip访问量统计的Top10

说明

  • 前面实现了的显示,所以这里只需要在其基础上添上几笔
1、实体类
 
2、工具类
 
3、Dao层
 
4、控制层
 
5、页面
 

6.2.5 每天最高访问量
1、MapReduce统计
 
2、写出到MySQL中
 
 
3、显示到页面中

这里和前面一样,只需要添加一些类就可以了

1、实体类
 
2、dao层
 
3、控制层
 
4、页面
 

6.2.6 统计用户每小时的页面访问量(PV,page view

说明

  • 统计24小时类各个小时 页面的访问量
1、MR统计每个小时的访问量
 
2、录入到MySQL中
  • 建表
  • 创建序列化类
  • MR写出数据
 
 
3、显示到页面中
1、实体类
 
2、dao层
 
3、控制层
 
4、页面
 

6.2.7 统计用户的访问设备

说明:

  • 统计用户访问页面使用的设备
1、MR统计各个访问记录使用的设备,并统计相同设备的数量
 
2、MR录入到MySQL中
 
 
3、显示到页面中
1、实体类
 
2、dao层
 
3、控制层
 
4、页面
 

使用技巧

最新文章
国际站:SEO Checker诊断工具助力商家诊断详情页,提升seo效果
国际站商家看过来:众所周知,一个优质的商品描述,可以提升买家转化的同时,还可以带来更多免费流量,从而让商家获得更多询盘和
【富蕴网站优化】在网站优化中有哪些常用的网站推广方式?
1、,百度,google的优化,针对,音乐,mp3下载,电影、游戏等一级,二级,甚至关键字优化。Seo介绍的网站很多,就不在这里重复
公众号简单爬虫--把公众号文章全部转载到网站(二)
根据上一篇的方法,我们得到了一个获取列表信息的地址,而且是用get方法就可以的地址.那么事情就变得很简单了,就是常规的爬取信息
1.【typecho】个人博客安装—使用群晖演示
哈喽,大家好今天给大家带来的是最近在群晖上安装一个博客的演示。先给大家看一下安装好之后的效果。虽然说现在使用博客和看博客
SEO优化攻略,揭秘网站排名提升与流量最大化技巧
本文深入解析SEO优化策略,通过关键词研究、高质量内容创作、链接建设等技术手段,帮助提升网站在搜索引擎中的排名,从而实现流
【HMNOTE搜狗手机输入法下载】小米HMNOTE搜狗手机输入法12.1.1免费下载
搜狗输入法,拥有超大中文词库,输入更加精准,智能。搜狗智能旺仔带你用表达,斗图,妙语,输入更加有趣。******特色功能******
vivo S19 Pro:全焦段人像拍照的5G游戏续航新宠
在智能手机市场日益同质化的今天,vivo S19 Pro以其独特的全焦段人像拍照功能、强大的5G性能以及出色的游戏续航能力,成为了众多
12月12日,星期四, 每天60秒读懂全世界!
新闻来源:百度热搜榜1. 25年老员工被开除 法院判赔98万近日,工作25年的李某被安排学习员工手册,全程玩手机遭公司开除,引发热
刚子扯谈:网站运营在左 技术在右 真TM扯
2013年8月5日,雨未下,天猴焖开片语:今天的扯谈内容是我转载我Java学习交流群里面一个哥们,当然我推荐他加入了朋友的网络分析
做seo营销网站/百度惠生活商家入驻
假定我们定义了一个Persion的message type,我们的用法可能如下定义 和 package tutorial;message Person {required int
相关文章