时间:2022-03-28 17:06:12 次数:3183
产品介绍
智立方是威廉希尔中文网站研发的一款跨数据平台的数据挖掘、分析、建模工具。面向各行各业在大数据建设过程的应用诉求,致力于构建智能数据体系,打造更便捷、更易用的大数据生产力平台,提供从数据准备、数据建模、分析探索、数据可视化到数据API服务等全链路的完整解决方案,充分满足建设数据过程中的多样复杂需求,帮助客户打通挖掘数据价值,促进在业务场景中应用大数据。
产品特征
全流程体验:提供“一站式”体验,从数据接入、数据准备、数据建模、分析探索、数据可视化到数据API服务,覆盖全流程形成完整闭环。
可视化建模:提供全程可视化的模型搭建,通过拖拽的交互方式,采用引导式及“搭积木”般的画图式界面帮助用户实现数据、组件的灵活的组合,从而快速地获得高质量的模型搭建。
数据可视化:提供常见的可视化图表和探索分析能力,让用户可以便捷的将模型结果采用图表的形式展现,让数据更生动更直观。
简捷高效易用:纯拖拽式操作,能够极大地降低建模的技术门槛,让复杂、繁琐的数据建模过程变更简单、高效。
数据应用简单:模型结果可便捷的生成仪表盘,以及快速生成数据API的能力,以满足不同的业务应用场景对模型结果的使用需求,非常方便实现建模成果的分享和使用。
技术浅析
标准化数据集
■统一数据集模型:适配主流关系库,NOSQL库,文件,统一数据访问方式,方便项目的快速扩展,打通各个异构库之间的数据集计算过程
■标准化SQL解析引擎:实现异构库之间跨库JOIN,分组统计等查询检索业务
统一的表达式框架
■可扩展的表达式定制框架:方便根据项目定义特定的分析计算公式,满足多变复杂的项目定制需求
■统一的表达式解析器:满足表达式逻辑的统一复用,实现一次编写,随处可用
图形化模型构建
■标准化数据集:用户无需关注使用的库类型或数据类型,统一标准化为二维数据集
■过程可视化:通过“拖”,“拉”,“拽”的方式配置模型计算的流程,步骤与步骤之间松耦合,每个步骤输出新的标准数据集,方便用户控制数据的计算和流转
■计算过程插件化:插件化的计算过程,可快速响应项目定制的过程插件
■内置主流数据集计算插件:提供主流的集合运算插件,适应各种数据集负责运算
■快速即席查询配置:计算出的结果集可快速通过即席查询配置构建方案,发布到前台,给用户提供快速的结果集检索
灵活高效的标签体系
■自定义标签体系:自定义标签项,标签值,标签分类;支持枚举标签,复杂业务标签,基本类型标签的定义;方便用户快速构建行业标签体系。
■复杂标签计算逻辑:支持复杂标签计算逻辑的表达式编写,支持事件触发的标签计算。灵活应对各种复杂业务场景。
■高效的标签立方体:分布式标签立方体,可扩展的存储架构,支持超过10000+的标签项的毫秒级检索,研判,比对。为行业用户的行为决策分析提供强大支撑。
高性能关系分析模型
■高性能关系检索:快速定位带时间周期的行为关系人,根据关系亲密度排分,不落下任何可疑人员。
■复杂关系计算逻辑:支持复杂关系计算逻辑的表达式编写,灵活应对各种复杂业务场景,如同车厢,相邻位置等。
数据集的快速比对
■比对数据集的快速构建:支持文件,数据库表,SQL语句等多种数据集的构建,适应各种复杂场景。
■高效的比对引擎:分布式比对引擎,实现千万,亿数据级数据的秒级比对,10亿级数据的分钟比对。
■结果集的自定义存储与再次比对:可将结果集根据用户要求存储或再次生成比对方案,方便用户快速洞察数据集与结果集之间的关注信息。
■比对队列的合理调度:根据集群情况合理安排比对任务,保证比对引擎的高可用。
高性能任务执行
■任务的水平切分
任务根据分区自动被分片到多台DMC-分析引擎中,每个分析引擎的执行容器使用多线程并发的对数据进行加工处理后加载到数据仓库中。当源头库单表数据量巨大时,可极大提升整体的数据集成效率和性能
高扩展任务调度
■集群处理能力的线性扩展
Ø 集群处理能力的快速扩充
Ø 集群自动识别和热部署新增分析引擎
■多集群组
Ø 根据业务划分集群组,使关注点分离
Ø 集群组有利于异常干扰的隔离
■任务的分布式调度
Ø 带权重的负载均衡算法,可根据设备处理能力安排并发任务数
Ø 任务调度中心对集群环境的自动负载均衡