溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點(diǎn)擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

PHP實(shí)現(xiàn)短網(wǎng)址的方法

發(fā)布時(shí)間:2020-08-25 13:46:54 來源:億速云 閱讀:131 作者:小新 欄目:編程語言

這篇文章主要介紹PHP實(shí)現(xiàn)短網(wǎng)址的方法,文中介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們一定要看完!

1.背景介紹

相信很多人手機(jī)上都收到過一些營銷短信,短信里面有時(shí)候會(huì)附帶一些網(wǎng)址,如下圖

這些網(wǎng)址往往都是非常短,但是當(dāng)我們打開之后,如果你仔細(xì)觀察,中間會(huì)有跳轉(zhuǎn),最終瀏覽器地址欄顯示的網(wǎng)址并不是你短信里面看到的網(wǎng)址,這就是短網(wǎng)址!

PHP實(shí)現(xiàn)短網(wǎng)址的方法

2.原理和應(yīng)用

短網(wǎng)址一般是采用一個(gè)非常短域名下,路徑參數(shù)一般只有3-6個(gè)字符組成,非常簡潔!

使用短網(wǎng)址的前提是先生成短網(wǎng)址,主要是采用某種算法讓一段短的字符對應(yīng)一個(gè)長的字符,比如說從常用的0-9、a-z、A-Z共62個(gè)字符中選擇6個(gè)字符,那意味著有62的6次方種組合,大概有568億不重復(fù)的短網(wǎng)址可用!

服務(wù)器通過路徑參數(shù)查詢到真實(shí)的長網(wǎng)址,然后使用301/302跳轉(zhuǎn)到真實(shí)的網(wǎng)址即可!

關(guān)于跳轉(zhuǎn),301 是永久重定向,302 是臨時(shí)重定向。短地址一經(jīng)生成就不會(huì)變化,所以用 301 是符合 http 語義的,瀏覽器會(huì)記錄跳轉(zhuǎn)地址,同時(shí)對服務(wù)器壓力也會(huì)有一定減少。但是如果使用了 301,我們就無法統(tǒng)計(jì)到短地址被點(diǎn)擊的次數(shù)了,如果對數(shù)據(jù)統(tǒng)計(jì)有要求的話,使用302跳轉(zhuǎn)可能比較好一些!

短網(wǎng)址的主要好處是方便傳輸記憶,特別是在短信里面使用的時(shí)候,短信對內(nèi)容字?jǐn)?shù)有限制,還有比如說微博分享也使用了短網(wǎng)址!

3.市面現(xiàn)有案例

目前市面上有很多免費(fèi)的短鏈接服務(wù),功能基本上都一樣,也沒有什么限制!

(1)百度的短鏈接(dwz.cn/),百度不僅僅提供了網(wǎng)頁入口,也提供了接口和開發(fā)文檔,簡單易用!

(2)新浪的短鏈接(sina.lt/),目前僅提供網(wǎng)頁入口,未發(fā)現(xiàn)接口服務(wù)!

(3)淘寶的短鏈接(tb.am/),目前僅提供網(wǎng)頁入口,未發(fā)現(xiàn)接口服務(wù)!

市面還有很多其它的小的公司提供短鏈接服務(wù),有些是部分免費(fèi),有些短鏈接是有效期的,這里不一一介紹!

4.常用算法

網(wǎng)上比較流行的算法有進(jìn)制算法、摘要(Hash)算法、隨機(jī)數(shù)算法,下面簡單介紹一下:

一.進(jìn)制算法

這個(gè)算法網(wǎng)上也有叫作自增序列算法,特點(diǎn)就是永不重復(fù),設(shè)置 id 自增,一個(gè) 10進(jìn)制 id 對應(yīng)一個(gè)62進(jìn)制的數(shù)值,1對1,也就不會(huì)出現(xiàn)重復(fù)的情況,這個(gè)利用的就是低進(jìn)制轉(zhuǎn)化為高進(jìn)制時(shí),字符數(shù)會(huì)減少的特性。

計(jì)算機(jī)中常見的進(jìn)制有2進(jìn)制,8進(jìn)制,10進(jìn)制,16進(jìn)制,進(jìn)制越大,能夠表示的數(shù)越大,占用的字?jǐn)?shù)也越少。下面舉個(gè)例:

10進(jìn)制的1000,在8進(jìn)制里面是1750,在16進(jìn)制里面就是3E8,那在62進(jìn)制里面呢?有人說,計(jì)算機(jī)里面沒有62進(jìn)制。。。雖然沒有,但是我們可以造一個(gè),進(jìn)制的轉(zhuǎn)換算法是固定的,最常見的就是“除基取余法”!

我們假設(shè)62進(jìn)制的字符序列為 0-9a-zA-Z,順序可以打亂,但是應(yīng)該固定下來,是一個(gè)從0角標(biāo)開始的到61的數(shù)組,我們暫且稱之為字母表!

====> 1000/62 = 16,余8

====> 16/62 = 0,余16

余數(shù)得到的數(shù)字是16、8,然后找到字母表里面角標(biāo)為16和8的字符拼起來,就是g8,非常短,只有2位數(shù)!假如說我們想至少產(chǎn)生6位字符,那么我們可以從一個(gè)比較大的數(shù)字開始,具體可以看下圖:

1位 62 0 - 61 2位 3844 62 - 3843 3位 約 23萬 3844 - 238327 4位 約 1400萬 238328 - 14776335 5位 約 9.1億 14776336 - 916132831 6位 約 568億 916132832 - 56800235583 復(fù)制代碼

二.Hash算法

第一種方式:

簡單的對長鏈接進(jìn)行加鹽md5,會(huì)生成一個(gè)32位的字符串,隨機(jī)從里面取6個(gè)字符,或者簡單粗暴取最后6位,但是md5只包含0-9A-Fa-f,比字母表的里面字符還少,沖突幾率更大!

第二種方式:

1.將長網(wǎng)址 md5 生成 32 位簽名串,分為 4 段, 每段 8 個(gè)字節(jié)

2.對這四段循環(huán)處理, 取 8 個(gè)字節(jié), 將他看成 16 進(jìn)制串與 0x3fffffff(30位1) 與操作, 即超過 30 位的忽略處理

3.這 30 位分成 6 段, 每 5 位的數(shù)字作為字母表的索引取得特定字符, 依次進(jìn)行獲得 6 位字符串

4.總的 md5 串可以獲得 4 個(gè) 6 位串,取里面的任意一個(gè)就可作為這個(gè)長 url 的短 url 地址

生成的方式更加復(fù)雜,重復(fù)的幾率低,但是依然會(huì)出現(xiàn)沖突!

三.隨機(jī)數(shù)算法

這個(gè)更簡單,直接對這個(gè)62個(gè)字符數(shù)組做隨機(jī)選擇,選擇其中6個(gè)字符當(dāng)作短鏈接碼,簡單易用,但是難免會(huì)出現(xiàn)重復(fù)沖突!

四.算法對比

第一種算法只要解決自增id問題就可以避免沖突,自增id可以采用數(shù)據(jù)庫自增主鍵,每次生成短碼只需一次數(shù)據(jù)庫操作(insert操作,獲取主鍵id,然后算出短碼即可)

第二種和第三種算法其實(shí)都差不多,都是依賴于程序隨機(jī),容易出現(xiàn)沖突,這就需要每次在插入數(shù)據(jù)庫的時(shí)候判重,效率低一些!

5.安全

短鏈接雖然方便了傳輸和記憶,但是由于鏈接組成的字符個(gè)數(shù)少,更容易被爆破、猜測攻擊,攻擊者可以輕松遍歷所有字符組成的鏈接!

所以不建議使用短鏈接發(fā)送具有私密性的網(wǎng)址,比如說重置密碼鏈接,對一些權(quán)限、敏感信息的鏈接要做好二次鑒權(quán)!

以上是PHP實(shí)現(xiàn)短網(wǎng)址的方法的所有內(nèi)容,感謝各位的閱讀!希望分享的內(nèi)容對大家有幫助,更多相關(guān)知識(shí),歡迎關(guān)注億速云行業(yè)資訊頻道!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

php
AI