Merge pull request ‘提交 Hadoop 大数据分析系统项目主目录代码’ (#1) from feature/hadoop-analysis-init into master
一个用于课程设计/毕业设计答辩演示的前后端分离 Web 系统,覆盖大数据采集、存储、分析、可视化和报表导出全流程。
mock
real
{ code, message, data }
默认内置场景:电商用户行为大数据分析
event_time
user_id
item_id
city
action
pay_amount
. ├── backend │ ├── pom.xml │ └── src/main │ ├── java/com/graduation/hadoop/analysis │ │ ├── aspect │ │ ├── common │ │ ├── config │ │ ├── controller │ │ ├── dto │ │ ├── entity │ │ ├── exception │ │ ├── mapper │ │ ├── security │ │ ├── service │ │ └── util │ └── resources │ ├── application.yml │ └── db │ ├── schema.sql │ └── data.sql ├── frontend │ ├── package.json │ ├── vite.config.ts │ └── src │ ├── api │ ├── layout │ ├── router │ ├── stores │ ├── styles │ └── views │ ├── auth │ ├── dashboard │ ├── datasets │ ├── hdfs │ ├── hive │ ├── spark │ ├── reports │ ├── monitor │ └── system ├── docs ├── scripts │ ├── init-demo.ps1 │ └── start-all.ps1 └── docker ├── docker-compose.yml ├── backend.Dockerfile ├── frontend.Dockerfile └── nginx.conf
SQL 文件位置:
backend/src/main/resources/db/schema.sql
backend/src/main/resources/db/data.sql
核心表:
sys_user
sys_role
sys_menu
sys_user_role
sys_role_menu
dataset
file_record
hive_query_record
spark_task
spark_task_log
report_record
operation_log
方式 1:手动导入
mysql -uroot -proot < backend/src/main/resources/db/schema.sql mysql -uroot -proot < backend/src/main/resources/db/data.sql
方式 2:脚本导入
powershell -ExecutionPolicy Bypass -File scripts/init-demo.ps1 -User root -Password root
说明:在中文路径环境下,建议用 mvn package + java -jar,不要优先使用 spring-boot:run。
mvn package + java -jar
spring-boot:run
cd backend mvn clean package -DskipTests java -jar target/hadoop-analysis-backend-1.0.0.jar
如本机有多个 Java,请确保使用 JDK17:
$env:JAVA_HOME="E:\cs\java\jdk-17.0.5" $env:Path="$env:JAVA_HOME\bin;$env:Path"
cd frontend npm install npm run dev
powershell -ExecutionPolicy Bypass -File scripts/start-all.ps1
访问地址:
http://localhost:5173
http://localhost:8080
默认账号:
admin
123456
/api/auth/*
/api/datasets/*
/api/hdfs/*
/api/hive/*
/api/spark/tasks/*
/api/reports/*
/api/dashboard/*
/api/monitor/*
/api/system/*
admin / 123456
通过配置切换 mock 或 real:
app: bigdata: hdfs-mode: mock hive-mode: mock spark-mode: mock
对应扩展点:
MockHdfsGateway
RealHdfsGateway
MockHiveGateway
RealHiveGateway
MockSparkGateway
RealSparkGateway
cd docker docker compose up -d --build
基于 Hadoop 的大数据分析系统项目提交说明
基于 Hadoop 生态的大数据分析系统,采用 Spring Boot 3 + Vue 3 前后端分离架构,面向电商用户行为场景,支持数据集管理、HDFS 文件管理、Hive SQL 查询、Spark 分析任务、可视化大屏、报表导出与权限管理。
版权所有:中国计算机学会技术支持:开源发展技术委员会 京ICP备13000930号-9 京公网安备 11010802047560号
基于 Hadoop 的大数据分析系统设计与实现
一个用于课程设计/毕业设计答辩演示的前后端分离 Web 系统,覆盖大数据采集、存储、分析、可视化和报表导出全流程。
1. 项目简介
1.1 技术栈
mock与real){ code, message, data }1.2 业务场景
默认内置场景:电商用户行为大数据分析
event_time、user_id、item_id、city、action、pay_amount1.3 核心能力
2. 项目目录结构
3. 数据库说明
SQL 文件位置:
backend/src/main/resources/db/schema.sqlbackend/src/main/resources/db/data.sql核心表:
sys_usersys_rolesys_menusys_user_rolesys_role_menudatasetfile_recordhive_query_recordspark_taskspark_task_logreport_recordoperation_log4. 快速启动
4.1 环境要求
4.2 初始化数据库
方式 1:手动导入
方式 2:脚本导入
4.3 启动后端(推荐)
如本机有多个 Java,请确保使用 JDK17:
4.4 启动前端
4.5 一键启动(可选)
访问地址:
http://localhost:5173http://localhost:8080默认账号:
admin1234565. 接口模块
/api/auth/*:认证与用户信息/api/datasets/*:数据源管理、文件上传/api/hdfs/*:HDFS 文件管理/api/hive/*:Hive SQL 分析/api/spark/tasks/*:Spark 任务管理/api/reports/*:报表生成与导出/api/dashboard/*:仪表盘统计/api/monitor/*:系统监控与日志/api/system/*:用户、角色、菜单、场景配置6. 演示流程建议
admin / 123456登录系统7. Hadoop 实现切换
通过配置切换
mock或real:对应扩展点:
MockHdfsGateway/RealHdfsGatewayMockHiveGateway/RealHiveGatewayMockSparkGateway/RealSparkGateway8. Docker(可选)
基于 Hadoop 的大数据分析系统项目提交说明