Hive中的collect_set函數(shù)用于返回指定列的唯一值集合。其語法如下:
SELECT collect_set(column_name)
FROM table_name
WHERE conditions;
其中,column_name是要收集唯一值的列名,table_name是要查詢的表名,conditions是查詢條件。
例如,假設有一個表student,包含學生的姓名和年齡字段,我們可以使用collect_set函數(shù)來收集所有學生的唯一年齡值:
SELECT collect_set(age)
FROM student;
這將返回一個包含所有學生年齡的唯一值的集合。