溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

數(shù)據(jù)庫根據(jù)指定字段去重的案例分析

發(fā)布時間:2020-11-18 14:29:21 來源:億速云 閱讀:192 作者:小新 欄目:MySQL數(shù)據(jù)庫

這篇文章主要介紹了數(shù)據(jù)庫根據(jù)指定字段去重的案例分析,具有一定借鑒價值,需要的朋友可以參考下。希望大家閱讀完這篇文章后大有收獲。下面讓小編帶著大家一起了解一下。

需求:對一張用戶表根據(jù)name/email/card_num字段去除重復(fù)數(shù)據(jù);

思路:用group by方法可以查詢出'去重'后的數(shù)據(jù),將這些數(shù)據(jù)存儲到一張臨時表中,然后將臨時表的數(shù)據(jù)存儲到指定的表中;

誤區(qū)及解決方案:group by方法只能獲取部分字段(去重指定字段),不能一次獲取到完整的數(shù)據(jù),但是可以通過max函數(shù)獲取group by結(jié)果集中的id,再根據(jù)id集合查詢出全部的記錄。

測試思路

  • 查詢?nèi)ブ睾蟮臄?shù)據(jù)

SELECT max(id) as id,name,email,card_num FROM users GROUP BY name,email,card_num;

  • 從去重后的數(shù)據(jù)中獲取id集合

SELECT ID from (SELECT max(id) as id,name,email,card_num FROM users  GROUP BY name,email,card_num) as T;

  • 根據(jù)去重后的數(shù)據(jù)中獲取id集合,從源數(shù)據(jù)中獲得記錄列表

SELECT * from users  where id in (SELECT ID from (SELECT max(id) as id,name,email,card_num FROM users GROUP BY name,email,card_num) as T);

實際方法

  • 根據(jù)去重后的數(shù)據(jù)中獲取id集合,從源數(shù)據(jù)中獲得記錄列表,將這些列表數(shù)據(jù)存入一個臨時表中

create TEMP TABLE tmp_data as SELECT * from users where id in (SELECT ID from (SELECT max(id) as id,name,email,card_num FROM users GROUP BY name,email,card_num) as T);

  • 將臨時表中的數(shù)據(jù)存入指定的數(shù)據(jù)表中,完畢

insert into users_copy1 select * from tmp_data;

檢測

  • 檢測結(jié)果是不是和第一步查詢?nèi)ブ睾蟮臄?shù)據(jù)總數(shù)相同

select count(*) from users_copy1;

測試結(jié)果:1.4w條數(shù)據(jù)中有2300條數(shù)據(jù)重復(fù),實際運行結(jié)果為0.7s,基本滿足現(xiàn)在的需求。

感謝你能夠認(rèn)真閱讀完這篇文章,希望小編分享數(shù)據(jù)庫根據(jù)指定字段去重的案例分析內(nèi)容對大家有幫助,同時也希望大家多多支持億速云,關(guān)注億速云行業(yè)資訊頻道,遇到問題就找億速云,詳細(xì)的解決方法等著你來學(xué)習(xí)!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI