-
新飞电器的BI建设案例
所属栏目:[大数据] 日期:2020-12-27 热度:110
一、河南新飞电器简介 河南新飞电器在制造行业内属于领先地位,其信息化程度较高,面对系统多且杂乱的情况,一个集中展示数据的平台就显得尤为重要。使用BI就是为了在一个相对统一的平台展示需要查看的数据,供决策层进行分析查看,从而做出更加有依据的判断[详细]
-
Gartner发布2017年商业智能(BI)魔力象限报告――云商业智能工
所属栏目:[大数据] 日期:2020-12-27 热度:51
对我来说,等待Gartner发布最新一期的Gartner商业智能魔力象限报告,看看有哪些最新的意外总是一件令人兴奋的事情。 今年的魔力象限报告包括几个意外,并且对这个市场的现状以及未来发展方向发表了几点想法。 2017年的魔力象限看起来像这样: Gartner还没有[详细]
-
企业BI系统应用的切入点及五大策略
所属栏目:[大数据] 日期:2020-12-26 热度:185
从技术的角度来看,BI的技术正在走向成熟,处于一个发展的阶段,但它促使了BI的应用在成本方面开始逐步的降低,越来越多的企业在BI应用方面取得了成功。从实施的角度来出发,实施商业智能系统是一项复杂的系统工程,整个项目涉及企业管理,运作管理,信息系[详细]
-
挖掘隐式启动Activity可能存在的坑
所属栏目:[大数据] 日期:2020-12-26 热度:141
今日科技快讯 很早之前,谷歌母公司Alphabet的董事长施密特就曾经表示,在中国市场,谷歌需要寻找到一个商业伙伴来开展自身的一些业务。而 近日有消息传出,谷歌和网易正在进行合作磋商,很可能是成立合资公司,在国内推出针对中国市场的Google Play应用商店[详细]
-
pyhive 连接 Hive 时错误
所属栏目:[大数据] 日期:2020-12-26 热度:163
一、User: xx is not allowed to impersonate xxx' 解决办法:修改 core-site.xml 文件,加入下面的内容后重启 hadoop 。 property namehadoop.proxyuser.xx.hosts/name value*/value/propertyproperty namehadoop.proxyuser.xx.groups/name value*/value/pr[详细]
-
分布式基础通信协议:paxos、totem 和 gossip(转载)
所属栏目:[大数据] 日期:2020-12-26 热度:108
背景: 在分布式中,最难解决的一个问题就是多个节点间数据同步问题。为了解决这样的问题,涌现出了各种奇思妙想。只有在解决了如何进行信息同步的基础之上才衍生出形形色色的应用。这里开始介绍几种分布式通信协议。 简单即有效——totem协议: totem协议也[详细]
-
Hive 导入 parquet 格式数据
所属栏目:[大数据] 日期:2020-12-26 热度:58
Hive 导入 parquet 数据步骤如下: 查看 parquet 文件的格式 构造建表语句 倒入数据 一、查看 parquet 内容和结构 下载地址 社区工具 GitHub 地址 命令 查看结构: java -jar parquet-tools-1.6.0rc3-SNAPSHOT.jar schema -d activity.201711171437.0.parque[详细]
-
Presto 常用配置及操作
所属栏目:[大数据] 日期:2020-12-26 热度:181
一、介绍 Presto是一个开源的分布式SQL查询引擎,适用于交互式分析查询,数据量支持GB到PB字节。 Presto的设计和编写完全是为了解决像Facebook这样规模的商业数据仓库的交互式分析和处理速度的问题。 推荐阅读 Presto实现原理和美团的使用实践 二、安装 2.1[详细]
-
大数据的技术生态概述(转载)
所属栏目:[大数据] 日期:2020-12-26 热度:171
如何用形象的比喻描述大数据的技术生态?Hadoop、Hive、Spark 之间是什么关系? 大数据本身是个很宽泛的概念,Hadoop生态圈(或者泛生态圈)基本上都是为了处理超过单机尺度的数据处理而诞生的。你可以把它比作一个厨房所以需要的各种工具。锅碗瓢盆,各有各[详细]
-
九种常见的数据分析模型
所属栏目:[大数据] 日期:2020-12-26 热度:167
1. 漏斗分析模型 漏斗分析是一套流程式数据分析,它能够科学反映用户行为状态以及从起点到终点各阶段用户转化率情况的重要分析模型。 运营人员可以通过观察不同属性的用户群体(如新注册用户与老客户、不同渠道来源的客户)各环节转化率,各流程步骤转化率的[详细]
-
大数据领域常用技术栈
所属栏目:[大数据] 日期:2020-12-26 热度:196
提起大数据,不得不提由IBM提出的关于大数据的5V特点:Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性),而对于大数据领域的从业人员的日常工作也与这5V密切相关。大数据技术在过去的几十年中取得非常迅速的发[详细]
-
Databricks说的Lakehouse是什么?
所属栏目:[大数据] 日期:2020-12-26 热度:155
? 在过去的几年里,Lakehouse作为一种新的数据管理范式,已独立出现在Databricks的许多用户和应用案例中。在这篇文章中,我们将阐述这种新范式以及它相对于之前方案的优势。 数据仓库在决策支持和商业智能应用方面有着悠久的历史。自20世纪80年代末问世以来[详细]
-
BigData数据可视化软件及工具
所属栏目:[大数据] 日期:2020-12-26 热度:73
摘要: 大量繁杂的数据在经过可视化工具处理后,就能以图形化的形式展现在用户面前,清晰直观。随着各种数据的增加,这种可视化工具越来越得到开发者们的欢迎。本文向大家推荐30款数据可视化工具。 各个互联网公司通过大量的用户数据、信息进行统计分析,而[详细]
-
ArcGIS Desktop 无法录入数据处理一例
所属栏目:[大数据] 日期:2020-12-26 热度:132
最近,搭建了一个DB2的测试环境,装完系统后,发现有一个美国带的样例数据无法导入,详细环境如下: 桌面:Desktop 10.3.1 DB2: V97 FP8 X64 For NT 从错误信息上得不到任何的提示,继续做测试 导入数据的时候出了空间字段,属性字段全部删除,可以导入进去,[详细]
-
URAL - 1153 Supercomputer 大数开方
所属栏目:[大数据] 日期:2020-12-26 热度:99
??????? 题意:给定m,m = n * (n+1) / 2,计算n值。 ????? 思路:n = SQRT(m*2) ???? 注意m很大,需要自己实现大数开方。我用的是自己写的大数模板:大数模板 AC代码 #include cstdio#include cmath#include algorithm#include cstring#include utility#inc[详细]
-
[bigdata-047] 禅道 ubuntu 配置开机自启动服务 开机启动
所属栏目:[大数据] 日期:2020-12-26 热度:156
1. 在/etc/init.d目录下创建chandao文件 内容如下: #!/bin/bash /opt/lampp/lampp restart 然后增加全选 chmod 755 chandao 2. 运行runleve命令,查看现在的run level是多少,通常是2 3. 既然是2,就在/etc/rc2.d目录下,创建一个链接 ln -s /etc/init.d/cha[详细]
-
[bigdata-048] git使用 上
所属栏目:[大数据] 日期:2020-12-26 热度:187
0. 主要参考 http://www.liaoxuefeng.com 1. git是分布式版本管理器,每个人的电脑都是一个完整的版本库。你修改了文件A,你同事修改了文件A,你们可以将各自的修改推给对方,可以互相看到对方的修改。 2. 创建版本库repository ? 2.1 在一个合适的地方,创[详细]
-
商业智能BI和报表的区别?
所属栏目:[大数据] 日期:2020-12-26 热度:150
报表是数据展示工具,商业智能BI是数据分析工具。 报表工具是一类报表制作工具和数据展示工具,用于制作各类数据报表、图形报表。或者制作特定格式的电子发票联、流程单、收据等等。 商业智能的重点在于商业数据的分析,集成了数据统计、数据展示、数据分析[详细]
-
大数运算(大数加法and大数乘法)
所属栏目:[大数据] 日期:2020-12-26 热度:53
大数模板 -- 万进制 为基础的 模板 #include algorithm#include stdlib.h#include cstring#include iostream#include stdio.h#define ll long long#define MAXN 10000#define DELD 4using namespace std;int a[MAXN];int b[MAXN];struct Bignum{ int len; in[详细]
-
如何打造高性能大数据分析平台
所属栏目:[大数据] 日期:2020-12-26 热度:139
原文:Building High Performance Big Data Analytics Systems 作者:Rohit Dhall 译者:袁璞,圣特尔?E店宝大数据架构师,关注高性能或可用架构、大数据技术、机器学习。 转自:CSDN 导读 大数据分析系统作为一个关键性的系统在各个公司迅速崛起,但是这种[详细]
-
nyoj517 最小公倍数 (大数)
所属栏目:[大数据] 日期:2020-12-26 热度:184
描述 为什么1小时有60分钟,而不是100分钟呢?这是历史上的习惯导致。 但也并非纯粹的偶然:60是个优秀的数字,它的因子比较多。 事实上,它是1至6的每个数字的倍数。即1,2,3,4,5,6都是可以除尽60。 我们希望寻找到能除尽1至n的的每个数字的最小整数m. 输入[详细]
-
撇开技术,初识实时数据处理
所属栏目:[大数据] 日期:2020-12-26 热度:189
hello!艾瑞巴蒂! 今天俺给大家换换心情,撇开技术,聊聊实时数据处理的前世今生。 曾经有那么几年的光阴,整个业界(大数据)言必称Hadoop,撩个妹不懂点Hadoop都被人看不起。 当然,hadoop在海量数据处理上绝对是毫无争辩的霸主: 比如 百度用户短时间对[详细]
-
BigData学习4_内部攻击实验数据集浅析
所属栏目:[大数据] 日期:2020-12-25 热度:198
杨光+吴钰 摘要:获取用户行为数据集是内部威胁研究的前提和基础,该文深度调研了当今公开的内部威胁实验数据集,通过分析KDD99、SEA、WUIL以及CERT-IT四种主流的数据集,提出上述数据集的优缺点,并指出未来数据集构建的研究方向。 关键词:内部威胁;网络[详细]
-
情人节福利!那些“浪(zhuang)漫(bi)”的程序员情书
所属栏目:[大数据] 日期:2020-12-25 热度:52
情人节到来,小编为大家准备了几篇只有程序员才看得懂的情书。小编祝天下有情人终成眷属! 情书正文 ?do?{?a++;?b++;}?while(a??b); 我和你原本就是两个世界的人,一直都在不停的向前走。 直到有一天在某一刻相遇,我们才在彼此的世界里相拥, 然后追寻着各[详细]
-
大数据处理分析的六大最好工具
所属栏目:[大数据] 日期:2020-12-25 热度:154
我们的数据来自各个方面,在面对庞大而复杂的大数据,选择一个合适的处理工具显得很有必要,工欲善其事,必须利其器,一个好的工具不仅可以使我们的工作事半功倍,也可以让我们在竞争日益激烈的云计算时代,挖掘大数据价值,及时调整战略方向。本文转载自中[详细]