溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

利用Distinct()內(nèi)置方法對(duì)List集合的去重問題詳解

發(fā)布時(shí)間:2020-08-22 07:47:42 來源:腳本之家 閱讀:383 作者:cmm123123 欄目:編程語言

前言

說到對(duì)集合去重處理,第一時(shí)間想到的肯定是Linq的Distinct擴(kuò)展方式,對(duì)于一般的值類型集合去重,很好處理,直接list.Distinct()即可。但是如果想要對(duì)一個(gè)引用類型的集合去重(屬性值都相同就認(rèn)為重復(fù)),就會(huì)發(fā)現(xiàn),直接Distinct()是不行的

先來看看泛型鏈表 List<T> 的定義:

public class List<T> : IList<T>, ICollection<T>, IList, ICollection, IReadOnlyList<T>, IReadOnlyCollection<T>, IEnumerable<T>, IEnumerable

可見它實(shí)現(xiàn)了 IEnumerable<T>,而IEnumerable<T>規(guī)定了Distinct方法。

使用這個(gè)方法時(shí)要注意:

(1)該方法并不會(huì)改變?cè)瓉淼逆湵恚?/p>

(2)該方法返回一個(gè)對(duì)象(假設(shè)叫做dis),通過該對(duì)象可以枚舉原鏈表中的非重復(fù)元素,但是并沒有把非重復(fù)元素復(fù)制一份到新的對(duì)象中(連簽拷貝也沒有)

(3)由于(2),在枚舉dis時(shí),始終是依賴于原有鏈表,所以如果在獲得dis后,又更新了原有鏈表,那么使用dis枚舉將會(huì)使用原有鏈表的最新狀態(tài)。

 var list=new List<SampleVersionDto>()///表明具有重復(fù)值得集合

有時(shí)候Distinct()不能對(duì)引用類型去重時(shí) 我們就要自定義了 自定義代碼如下:

public class User
{
 public int Id { get; set; }
 public string Name { get; set; }
}

var list = new List<User>() 
{ 
 new User() { Id = 1, Name = "張三" } ,
 new User() { Id = 1, Name = "張三" } ,
 new User() { Id = 3, Name = "李四" } ,
};

var newList1 = list.Distinct().ToList();

運(yùn)行上述代碼會(huì)發(fā)現(xiàn),并不是預(yù)期想要的結(jié)果,newList1還是有3個(gè)元素。之所以會(huì)產(chǎn)生這樣的結(jié)果,是因?yàn)镈istinct()是通過使用默認(rèn)的相等比較器對(duì)值進(jìn)行比較返回序列中的非重復(fù)元素。對(duì)于值類型,默認(rèn)的相等比較器是比較值是否相等,對(duì)于引用類型,默認(rèn)的相等比較器是比較對(duì)象的引用地址,所以上述例子中即使屬性值都相同,也不能去重。

IEqualityComparer<TSource>

聰明的我們,很容易就能發(fā)現(xiàn),Linq已經(jīng)為我們重載了一個(gè)去重方法,可以滿足我們的需求:

public static IEnumerable<TSource> Distinct<TSource>(this IEnumerable<TSource> source, IEqualityComparer<TSource> comparer);

重載的這個(gè)方法,多提供了一個(gè)參數(shù)IEqualityComparer<TSource> comparer,是一個(gè)泛型接口,我們只需要對(duì)這個(gè)接口進(jìn)行實(shí)現(xiàn),即可滿足我們的去重需求:

public class UserComparer : IEqualityComparer<User>
{
 public bool Equals(User x, User y)
 {
 return x.Id == y.Id && x.Name == y.Name;
 }

 public int GetHashCode(User obj)
 {
 return obj.ToString().GetHashCode();
 }
}

IEqualityComparer<TSource> 定義了兩個(gè)方法,一個(gè)是Equals,一個(gè)是GetHashCode。這里我查找參考資料發(fā)現(xiàn),進(jìn)行比較時(shí),默認(rèn)先通過GetHashCode對(duì)兩個(gè)元素進(jìn)行比較,如果HashCode不同,則認(rèn)為兩個(gè)元素不同,如果相同則再通過Equals方法比較。所以這里我不能直接將User對(duì)象GetHashCode處理,而是先轉(zhuǎn)換成了字符串再GetHashCode。通過這個(gè)重載方法,我們就可以到達(dá)目的了:

ar newList2 = list.Distinct(new UserComparer()).ToList();

甚至我們還可以實(shí)現(xiàn)只要某個(gè)屬性相同就認(rèn)為重復(fù)的效果,只需要在Equals方法按想要比較方式進(jìn)行處理即可

延伸思考

Distinct的重載方法,基本已經(jīng)能夠滿足我們的各式各樣的去重需求了,但是想來想去,還是覺得有點(diǎn)別扭,那就是如果有類似的去重需求,我們都要新增一個(gè)類去實(shí)現(xiàn)IEqualityComparer<TSource>接口,不夠靈活,本著封裝重用的原則,想了想能否在這方面進(jìn)行優(yōu)化。恰巧最近在搞一個(gè)Android項(xiàng)目,學(xué)習(xí)了一下java,了解到j(luò)ava有一個(gè)匿名實(shí)現(xiàn)接口的語法特性,如果C#也能匿名實(shí)現(xiàn)接口,那就不需要增加那么多類去實(shí)現(xiàn)接口,會(huì)方便很多。很遺憾C#中沒有這個(gè)特性,看了下資料我感覺java其實(shí)也不算是真正意義上的匿名實(shí)現(xiàn),它是編譯器做了手腳,編譯的時(shí)候生成了一個(gè)真實(shí)的類去實(shí)現(xiàn)接口。在一番查找資料后,終于找到了一個(gè)很好的解決方案:

public class LambdaComparer<T> : IEqualityComparer<T>
{
 private readonly Func<T, T, bool> _lambdaComparer;
 private readonly Func<T, int> _lambdaHash;
 public LambdaComparer(Func<T, T, bool> lambdaComparer)
 : this(lambdaComparer, EqualityComparer<T>.Default.GetHashCode)
 {
 }
 public LambdaComparer(Func<T, T, bool> lambdaComparer, Func<T, int> lambdaHash)
 {
 if (lambdaComparer == null)
  throw new ArgumentNullException("lambdaComparer");
 if (lambdaHash == null)
  throw new ArgumentNullException("lambdaHash");
  _lambdaComparer = lambdaComparer;
  _lambdaHash = lambdaHash;
 }

 public bool Equals(T x, T y)
 {
 return _lambdaComparer(x, y);
 }

 public int GetHashCode(T obj)
 {
 return _lambdaHash(obj);
 }
}

很巧妙的采用了泛型委托的方式,實(shí)現(xiàn)只需要定義一個(gè)類實(shí)現(xiàn)IEqualityComparer<TSource>接口,Equals、GetHashCode的實(shí)現(xiàn),由傳入的委托方法決定,接下來就簡單了

var newList3 = list.Distinct(new LambdaComparer<User>((a, b) => a.Id == b.Id && a.Name == b.Name, obj => obj.ToString().GetHashCode())).ToList();

是不是很熟悉的寫法,想怎么比較就怎么比較,方便快捷,不需要定義那么多類去實(shí)現(xiàn)接口,目的達(dá)到。Linq中有很多擴(kuò)展方法,都會(huì)用到IEqualityComparer<TSource>接口。通過這種方式,可以大大提高重用率

參考資料

1、https://www.jb51.net/article/162602.htm

2、https://ask.helplib.com/c-Sharp/post_1277383

總結(jié)

以上就是這篇文章的全部內(nèi)容了,希望本文的內(nèi)容對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,謝謝大家對(duì)億速云的支持。

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請(qǐng)聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI