在Hive中,collect_set函數(shù)用于將一個列中的所有不重復(fù)的值收集到一個數(shù)組中。它的基本語法如下:
SELECT collect_set(column_name) FROM table_name;
其中,column_name是要收集不重復(fù)值的列名,table_name是數(shù)據(jù)表的名稱。
例如,假設(shè)我們有一個名為employee的表,包含一個名為department的列,我們想要收集所有不重復(fù)的部門名稱,可以使用以下查詢:
SELECT collect_set(department) FROM employee;
這將返回一個包含所有不重復(fù)部門名稱的數(shù)組。