相关软件
oTit">基本简介
hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。 其优点是学习成本低,可以通过类SQL语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应用,十分适合数据仓库的统计分析。
Hive定义
Hive是建立在 Hadoop 上的数据仓库基础构架。它提供了一系列的工具,可以用来进行数据提取转化加载(ETL),这是一种可以存储、查询和分析存储在 Hadoop 中的大规模数据的机制。Hive 定义了简单的类 SQL 查询语言,称为 HQL,它允许熟悉 SQL 的用户查询数据。同时,这个语言也允许熟悉 MapReduce 开发者的开发自定义的 mapper 和 reducer 来处理内建的 mapper 和 reducer 无法完成的复杂的分析工作。
Hive 没有专门的数据格式。 Hive 可以很好的工作在 Thrift 之上,控制分隔符,也允许用户指定数据格式。
适用场景
Hive 构建在基于静态批处理的Hadoop 之上,Hadoop 通常都有较高的延迟并且在作业提交和调度的时候需要大量的开销。因此,Hive 并不能够在大规模数据集上实现低延迟快速的查询,例如,Hive 在几百MB 的数据集上执行查询一般有分钟级的时间延迟。因此,
Hive 并不适合那些需要低延迟的应用,例如,联机事务处理(OLTP)。Hive 查询操作过程严格遵守Hadoop MapReduce 的作业执行模型,Hive 将用户的HiveQL 语句通过解释器转换为MapReduce 作业提交到Hadoop 集群上,Hadoop 监控作业执行过程,然后返回作业执行结果给用户。Hive 并非为联机事务处理而设计,Hive 并不提供实时的查询和基于行级的数据更新操作。Hive 的最佳使用场合是大数据集的批处理作业,例如,网络日志分析。
下载地址
猜你喜欢
deepseek桌面版 v1.0.0
下载网易邮箱大师 V5.3.1.1006
下载Outlook for Mac V16.95
下载ticktick日程管理 V6.2.1.0
下载Adobe Photoshop 2025 V26.4.1.194
下载Adobe Bridge 2025中文版 V15.0.1.412.0
下载Adobe After Effects 2025中文版 V25.1.0
下载Adobe Media Encoder 2025中文版
下载Adobe InCopy 2025中文版 V20.0.1.32
下载Adobe Character Animator 2025 V25.0
下载Adobe Audition 2025 中文版 V25.0.0.47
下载Office LTSC 2024专业增强版 V2024
下载Icecream Ebook Reader6官方版 V6.52
下载Q-Dir资源管理器 V12.12.0
下载Bitwarden V2025.2.1
下载LibreWolf 浏览器 V136.02
下载热门关键词
网友评论
广告更精彩
分类列表
类型列表
精品软件推荐
0条评论