Hivesql⾥的limit使⽤图闻天下
在hive表前1000⾏⾥,过滤出不重复的refid,imsi。 欧尚宜家
select distinct refid,imsi from HIVE_D_MT_UU_H_SPARK limit 1000;
会去读取全表,把0~1000⾏的不重复refid,imsi显⽰出来。 截潜流工程
常艳近况正确的写法:
select distinct refid,imsi from (select * from HIVE_D_MT_UU_H_SPARK limit 1000);
CREATE TABLE TEMP_HIVE_D_MT_UU_H_SPARK AS
select * from HIVE_D_MT_UU_H_SPARK limit 1000;
select distinct refid,imsi from TEMP_HIVE_D_MT_UU_H_SPARK;
od调查
樊玲整容
hive最快的执⾏就是不⾛MapReduce。简单的select的是最快的,嵌套啥的都⽐较忙。与关系型数据库不同。 调优的写法执⾏更快。