PRODUCT  PROFILE

产品简介

迈越大数据智慧校园平台,是在开源的hadoop主流大数据技术基础上进行二开的平台,可以实现结构化、非结构化等各种类型、海量数据的存储、检索和挖掘,完成校园数据全面集成与融合,为数据共享服务以及综合数据分析提供完整、可靠的数据基础。

PRODUCT  PROFILE

解决问题

在迈越大数据智慧校园平台基础上,产生各种应用,主要有:综合校情分析、内部教学质量诊改分析,贫困生认定分析、生源质量分析、时间序列趋势预测、消费分析、就业率分析、相关性趋势预测、专题分析、失联预警、水电安全预警、沉迷游戏预警、孤僻人群预警、学分成绩预警等各种碎片化应用服务。能够实现智能相关分析、智能分类、智能判别、智能判定、智能决策。

DERIVATIVE  DEMAND

解决方案

使用开源的etl工具kettle,采用jdbc访问数据库、爬虫技术、消息队列、http接口、日志读取等技术,从学校各个业务系统进行数据抽取,采集教与学的全过程数据,全面客观的记录学生成长轨迹。

根据数据特性,有针对性的进行处理。半结构化数据、低频数据储存于hive,结构化数据、中频数据储存于hbsae,高频数据通过spark steaming处理,使数据能够按按周、日、小时等时间维度进行定时分析,并支持高并发、实时访问。

建设数据采集系统、完善业务系统数据等方式,保障大数据建设有更好的基础数据支撑。

挖掘和分析数据,用回归、决策树、随机森林等算法,根据学生上网数据、一卡通、人脸识别、图书馆系统等业务系统的数据,分析学生可能出现的挂科、学习成绩下滑、经济问题、失联或晚归等情况进行预测。

SOLUTIONS

主要技术

主数据仓库

存储指标数据、KPI数据和高度汇总数据。

分布式数据库

存储加工、关联、汇总后的业务数据,并提供分布式计算,支撑数据仓库输出KPI和高度汇总数据。

Hadoop平台

负责存储海量的数据,提供并行的计算和非结构化数据的处理能力,实现低成本的存储和低延迟、高并发的查询能力。

数据的采集

负责源数据的采集、清洗、转换和加 载包括: 1、把原始数据加载到Hadoop平台。 2、把加工后的数据加载分布式数据 库和主数据仓库

CLASSIC  CASES

经典案例