Hivesql里的limit使用

Hivesql⾥的limit使⽤图闻天下
在hive表前1000⾏⾥,过滤出不重复的refid,imsi。
错误的写法
欧尚宜家
select distinct refid,imsi from HIVE_D_MT_UU_H_SPARK limit 1000;
会去读取全表,把0~1000⾏的不重复refid,imsi显⽰出来。
截潜流工程
常艳近况正确的写法:
select distinct refid,imsi from (select * from HIVE_D_MT_UU_H_SPARK limit 1000);
调优的写法:
CREATE TABLE TEMP_HIVE_D_MT_UU_H_SPARK AS
select * from HIVE_D_MT_UU_H_SPARK limit 1000;
select distinct refid,imsi from TEMP_HIVE_D_MT_UU_H_SPARK;
od调查
樊玲整容
hive最快的执⾏就是不⾛MapReduce。简单的select的是最快的,嵌套啥的都⽐较忙。与关系型数据库不同。 调优的写法执⾏更快。

本文发布于:2024-09-23 11:26:50,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/15279.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

上一篇:VAC接口
下一篇:sib和mib区别
标签:写法   调优   数据库   过滤   读取   潜流   出不
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议