溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Redis分詞索引法怎么用

發(fā)布時間:2022-01-15 16:04:17 來源:億速云 閱讀:216 作者:iii 欄目:大數(shù)據(jù)

這篇文章主要介紹“Redis分詞索引法怎么用”的相關知識,小編通過實際案例向大家展示操作過程,操作方法簡單快捷,實用性強,希望這篇“Redis分詞索引法怎么用”文章能幫助大家解決問題。

分詞索引法

這種方式是我實踐過后,結合上篇的前輩給的觀點覺得唯一比較可行且符合redis特性的方式,不過最終效率上還是比不過內存。

詳細的實現(xiàn)思路清看Redis作者博客(參考資料1),這里的例子還是基于UserName,英文,并且只針對詞組做了長度為3的分詞,其他場景請自行擴展。

首先基于AutoComplete的字母搜索,那么我們需要對所有的Name做一個分詞,即:

abc => (a, ab, abc)

那么輸入a,我們就直接取set a里的內容,輸入ab就直接取ab集合的內容。那么我們開始轉換,首先我們需要對User表的姓名進行分詞:

var redis = ConnectionMultiplexer.Connect("localhost");var db = redis.GetDatabase();for (var i = 1; i < 4; i++)
{    var data = dbCon.Lookup<string, int>(string.Format(@"select words, id from (
                                    select Row_number() over (partition by words order by name) as rn,id,words from (
                                        select  id, SUBSTRING(name, 1, {0}) as words, name from User 
                                    ) as t
                                    ) t2 where rn <= {1} and words != '' and words is not null", i, 20));

    data.ForEach((key, item) =>  {
         db.SetAdd("capqueen:Cache:user:" + key.ToLower(), item.Select<int, RedisValue>(j => j).ToArray());
      });
}

第一步:采用SQL,分組排序篩選出每個分詞的前20條數(shù)據(jù),這里使用的是OrmLite的語法。

第二部:存入RedisSet,注意這里其實只是做了一個索引,并不保存具體的User內容

接著搜索的時候我們可以實現(xiàn)如下:

public List<User> SearchWords(string keywords)
{            var redis = ConnectionMultiplexer.Connect("localhost");            var db = redis.GetDatabase();            var result = db.SetMembers("capqueen:Cache:user:" + keywords.ToLower());            var users = new List<User>();            if (result.Any())
            {                //轉換成ids                var ids = result.ToList().Select<RedisValue, RedisKey>(i => i.ToString());                //按照keys獲取value ,事先已經(jīng)存好了Usersvar values = db.StringGet(ids.ToArray());                //構造List Json以加速解析var portsJson = new StringBuilder("[");

                values.ToList().ForEach(item =>{                    if (!string.IsNullOrWhiteSpace(item))
                    {
                        portsJson.Append(item).Append(",");
                    }
                });

                portsJson.Append("]");

                users = JsonConvert.DeserializeObject<List<User>>(portsJson.ToString());
            }
}

經(jīng)過實際的測試,這樣的寫法比前面的Keys確實好了不少,但是性能還是差強人意的。

Scan搜索法

這種方法是我在查閱了Redis的文檔之后,發(fā)現(xiàn)的,但是也就是試驗一下,估計也不能用做生產(chǎn)環(huán)境大規(guī)模查詢。

Scan根據(jù)數(shù)據(jù)結構的不同分為了SCAN\HSCAN\SSCAN\ZSCAN,具體的信息請看文檔。我們這里采用了ZSCAN:

ZSCAN key cursor [MATCH pattern] [COUNT count]

這里cursor是搜索的迭代的一個游標,具體還沒弄明白,pattern就是匹配規(guī)則 count就是記錄條數(shù)

由于我使用的是StackExchange.Redis,它提供的zscan方法是:

IEnumerable SortedSetScan(RedisKey key, RedisValue pattern = null, int pageSize = 10, long cursor = 0, int pageOffset = 0, CommandFlags flags = CommandFlags.None);

public void CreateTerminalCache(List<User> users)
{            if (users == null) return;            var db = ConnectionMultiplexer.GetDatabase();            var sourceData = new List<KeyValuePair<RedisKey, RedisValue>>();            //構造集合數(shù)據(jù)var list = users.Select(item =>{                var value = JsonConvert.SerializeObject(item);                //構造原始數(shù)據(jù)sourceData.Add(new KeyValuePair<RedisKey, RedisValue>("capqueen:users:" + item.Id, value));                //構造數(shù)據(jù)    return new SortedSetEntry(item.Name, item.Id);
            });            //添加進有序集合,采用name - id db.SortedSetAdd("capqueen:users:index", list.ToArray());            //添加港口數(shù)據(jù)key-value            db.StringSet(sourceData.ToArray(), When.Always, CommandFlags.None);
}

然后搜索的時候如下:

public List<User> GetUserByWord(string words)
{            var db = ConnectionMultiplexer.GetDatabase();            //搜索var result = db.SortedSetScan("capqueen:users:index", words + "*", 10, 1, 30, CommandFlags.None).Take(30).ToList();           var users = new List<User>();            if (result.Any())
            {                //轉換成ids                var ids = result.ToList().Select<SortedSetEntry, RedisKey>(i => i.ToString());                //按照keys獲取valuevar values = db.StringGet(ids.ToArray());                //構造List Json以加速解析var portsJson = new StringBuilder("[");

                values.ToList().ForEach(item =>{                    if (!string.IsNullOrWhiteSpace(item))
                    {
                        portsJson.Append(item).Append(",");
                    }
                });

                portsJson.Append("]");

                users = JsonConvert.DeserializeObject<List<User>>(portsJson.ToString());
            }            return users;
}

關于“Redis分詞索引法怎么用”的內容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業(yè)相關的知識,可以關注億速云行業(yè)資訊頻道,小編每天都會為大家更新不同的知識點。

向AI問一下細節(jié)

免責聲明:本站發(fā)布的內容(圖片、視頻和文字)以原創(chuàng)、轉載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權內容。

AI