#Hive

Apache Hive是一个建立在Hadoop架构之上的数据仓库。它能够提供数据的精炼,查询和分析。

快手一面:讲一讲 Hadoop、Hive、Spark 之间的关系?

微观技术

Hive 可以直白理解为 Hadoop 的 API 包装,采用 SQL 语法实现业务,底层依然 Map Reduce 引擎来执行,但是转换逻辑被 Hive 作为...

1930

实时即未来,车联网项目之将数据落地到文件系统和数据库【三】

ChinaManor

? azkaban airflow dolphinscheduler oozie 自研

4410

业内首个基于Iceberg的“云端仓转湖”生产实践探索

腾讯QQ大数据

业务背景 作业帮成立于2015年,一直致力于用科技手段助力教育普惠,运用人工智能、大数据等前沿技术,为学生、老师、家长提供更高效的学习、教育解决方案,智能硬件产...

2810

Java调用matlab

sofu456

mcc Compile MATLAB functions for deployment outside MATLAB. Options applicable ...

5440

0886-7.1.7-Hive1与Hive3中Decimal数据计算结果精度缺失问题分析

Fayson

将集群从CDH升级到CDP后,Hive1与Hive3在Decimal精度的处理上发生了变化,导致两个版本的Hive在进行Decimal类型的数据计算时存在差异,...

5330

大数据生态圈常用组件(二):概括介绍、功能特性、适用场景

不吃西红柿

点赞之后,上一篇传送门: https://blog.csdn.net/weixin_39032019/article/details/89340739

5820

记一次python清洗疫情历史数据

不愿意做鱼的小鲸鱼

数据的来源是用了GitHub上这个我收藏了很久的项目:https://lab.isaaclin.cn/nCoV/ 数据仓库链接:https://github....

5630

大作业——新冠肺炎疫情的数据采集和可视化分析系统

不愿意做鱼的小鲸鱼

这次大作业的主要流程是: 首先要采集数据,采用脚本定时采集的那种,采集的数据来源这篇博文:https://www.dzyong.com/#/ViewArtic...

4420

一面数据: Hadoop 迁移云上架构设计与实践

从大数据到人工智能

要迁移的数据包括两部分:Hive Metastore 元数据以及 HDFS 上的文件。由于不能中断业务,采用存量同步 + 增量同步(双写)的方式进行迁移;数据同...

5520

数据仓库——hive的相关配置和操作

不愿意做鱼的小鲸鱼

点击下载 链接:https://pan.baidu.com/s/1Z4VG7mPBpmW6mWpR_WcyPQ 提取码:7afc

8750

Nexus:搭建私人Maven仓库

用户4480853

访问 Oracle 官网来获取 Java 8/11/17/latest 版本,Windows 平台可通过 x64 Compressed Archive 安装、L...

4920

开源项目丨一文详解一站式大数据平台运维管家 ChengYing 如何部署 Hadoop 集群

数栈DTinsight

选择计算组件模块,选择需要对接的计算引擎 Hive 和 Spark,选择 Hive 和 Spark 的版本,填写对应的 jdbc(jdbc:hive://ip:...

5010

Hive 高频考点讲解

sowhat1412

Hive 是 FaceBook 开源的一款基于 Hadoop 数据仓库工具,它可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。

6210

Presto实战

全栈程序员站长

Presto支持在线数据查询,包括Hive, Cassandra, 关系数据库以及专有数据存储。一条Presto查询可以将多个数据源的数据进行合并,可以跨越整个...

6420

自动生成测试用例_测试用例设计的完整过程

全栈程序员站长

写用例之前,我们应该熟悉API的详细信息。建议使用抓包工具Charles或AnyProxy进行抓包。

5320

python批量生成测试用例_系统测试用例的编写依据

全栈程序员站长

写用例之前,我们应该熟悉API的详细信息。建议使用抓包工具Charles或AnyProxy进行抓包。

5430

自动生成测试用例_接口测试用例自动生成工具

全栈程序员站长

写用例之前,我们应该熟悉API的详细信息。建议使用抓包工具Charles或AnyProxy进行抓包。

10640

【拿走不谢】大数据高效查询神器--bitmap

不吃西红柿

https://github.com/lihuigang/hive-bitmap-udf

6750

数据倾斜?几招把你安排的板板正正的!

不吃西红柿

一般都发生在Sql中group by和join on上,而且和数据逻辑绑定比较深。

5420

hive like与rlike的区别

全栈程序员站长

项目github地址:[bitcarmanlee easy-algorithm-interview-and-practice](https://github.c...

6910

扫码关注腾讯云开发者

领取腾讯云代金券

http://www.vxiaotou.com