<table id="lsz8c"></table>

<u id="lsz8c"></u>

溫馨提示×

溫馨提示×

您好，登錄后才能下訂單哦！

密碼登錄×

忘記密碼？

登錄注冊×

獲取短信驗證碼

其他方式登錄

點擊登錄注冊即表示同意《億速云用戶服務條款》

用戶登錄×

賬戶密碼登錄

請使用微信掃描上方二維碼

使用幫助

請求超時！

請點擊重新獲取二維碼

怎么讓chatgpt將html中的圖片轉為base64

發(fā)布時間：2023-02-24 10:34:30 來源：億速云閱讀：131 作者：iii 欄目：開發(fā)技術

這篇文章主要介紹“怎么讓chatgpt將html中的圖片轉為base64”的相關知識，小編通過實際案例向大家展示操作過程，操作方法簡單快捷，實用性強，希望這篇“怎么讓chatgpt將html中的圖片轉為base64”文章能幫助大家解決問題。

加載賊慢的原因：

剛才所說的服務端響應慢，那這個交給后端去搞就好（這個是重中之重）
官網的圖片請求是在是太多了，而我們知道 http 請求是有次數限制的(http1.1)，太多的話其他只能處于阻塞狀態(tài)

那第二點自然是需要前端去搞了，圖片太多，導致 http 請求太多，那好辦，把小圖片轉 base64 不就好。嗯，思路很簡單，如果是前后端分離的項目，我們一般無腦配置 webpack url-loader 的體積限制就好，或者配置 webpack5 的 asset，即在導出一個 data URI 和發(fā)送一個單獨的文件之間自動選擇：

rules: [
    {
      test: /\.(png|jpe?g|svg|gif)$/,
      //webpack4 start
      use: [
        {
          loader: 'url-loader',
          options: { limit: 10 * 1024 },
        },
      ],
      //webpack4 end
      // webapack5 start
      type:'asset/inline',
      parser: {
        dataUrlCondition: {
          maxSize: 10 * 1024, // 小于10k則轉為base64
        },
      },
      // webapack5 end
    },
  ],

很簡單對吧，但當你想快速 cv 以上配置的時候，發(fā)現，前端代碼都是混在后端代碼里面，一堆 html 文件，html 里面又混雜著一堆的 Thymeleaf 語法（Thymeleaf 是一個跟 Velocity、FreeMarker 類似的模板引擎，它可以完全替代 JSP，JSP？？都啥年代了）

但沒辦法，領導可不管用啥方式，只要有個方法把 html 里面圖片小于某個指定值，如 10k，那就轉 base64，讓這些小圖片不走 http 請求。

思路

那么，正常的路走不通(當然也有可能有其他更快捷的方式，只是比較趕，暫時想不到更好、更簡單的方式實現)，那就另辟蹊徑。

全體流程如下：

1. mvn clean // marven 清空輸出目錄

2. mvn compile // marven編譯

3. 將所有 html 的的小圖片都轉 base64

4. mvn package // marven 打包

以上主要重點關注第3點，既然要將所有 html 的的小圖片都轉 base64，那么自然而然可以通過寫個 node 腳本來實現，大概可以分為以下幾個步驟：

遞歸讀取指定目錄下的所有 html 文件路徑 htmlPaths，這里我們假設所有 html 都放在 backend/templates 里面
遍歷每個路徑，讀取對應的 html，然后通過正則匹配到每個 html 里面的所有 img 對應的 src，存放到 imgSrcs 里面
遍歷每個 img 的 src，讀取 imageBuffer，并轉為 base64
再將得到的 base64 替換原先的 src
最后將新的 html 替換舊的 html

實現過程

遞歸讀取指定目錄下的所有 html 文件路徑 htmlPaths

首先判斷入口目錄的下的內容，是文件的話就判斷是否以.html 結尾，是的話則放入 htmlFilePaths，是目錄的話則遞歸遍歷，那我們來問神奇的 chatgpt：

怎么讓chatgpt將html中的圖片轉為base64

嗯，很不錯，第一次幾乎完美，順利拿到所有的 html 路徑

獲取每個 html 里面的圖片 src

自然而然想到用正則匹配來做，所以我馬上問：

怎么讓chatgpt將html中的圖片轉為base64

一看結果就不是我想要的，當然也是我描述的不清晰，導致 chatgpt 以為要獲取 html 文檔的圖片 src

獲取 html 字符串的所有圖片 src

應該問要獲取 html 字符串的，所以我接著問：

怎么讓chatgpt將html中的圖片轉為base64

// 定義匹配圖片標簽的正則表達式
var imgRegex = /<img\s+[^>]*src=["']([^"']*)["'][^>]*>/gi;
// 要解析的HTML字符串
var htmlString = '<img src="image1.jpg"> <img src="image2.jpg">';
// 遍歷所有匹配到的圖片標簽并獲取其src屬性
var matches;
while ((matches = imgRegex.exec(htmlString)) !== null) {
  var src = matches[1];
  console.log(src);
}

運行后，得到的結果：

怎么讓chatgpt將html中的圖片轉為base64

不錯不錯，再接再厲。

忽略注釋的代碼

但 html 代碼可能 img 被注釋了，如 ，那么我們實際上沒必要去轉換，故我們讓個讓其忽略注釋的：

怎么讓chatgpt將html中的圖片轉為base64

那我們來試試，將其中注釋代碼中插入 img，看看是否會解析：

// 定義匹配圖片標簽的正則表達式
var imgRegex = /<img\s+[^>]*src=["']([^"']*)["'][^>]*>/gi;
// 定義匹配注釋的正則表達式
var commentRegex = /<!--[\s\S]*?-->/g;
// 要解析的HTML字符串
var htmlString = '<!-- <img src="image3.jpg"> --> <img src="image1.jpg"> <img src="image2.jpg">';
// 刪除所有注釋
htmlString = htmlString.replace(commentRegex, '');
// 遍歷所有匹配到的圖片標簽并獲取其src屬性
var matches;
while ((matches = imgRegex.exec(htmlString)) !== null) {
  var src = matches[1];
  console.log(src);
}

怎么讓chatgpt將html中的圖片轉為base64

可以看到被注釋掉的 image3 不會被匹配到

本身是 base64，則忽略

繼續(xù)繼續(xù)，但圖片 src 可能一開始就是 base64 了，就沒必要轉了，而 base64 是 data:image 開頭的，所以我們再讓它加下條件：

怎么讓chatgpt將html中的圖片轉為base64

// 定義匹配圖片標簽的正則表達式
var imgRegex = /<img\s+[^>]*src=["']((?!data:image)[^"']*)["'][^>]*>/gi;
// 要解析的HTML字符串
var htmlString = '<img src="image1.jpg"> <img src="data:image/png;base64,iVBORw0KG..."> <img src="image2.jpg"><!-- <img src="image3.jpg"> -->';
// 遍歷所有匹配到的不以 data:image 開頭的圖片標簽并獲取其src屬性
var matches;
while ((matches = imgRegex.exec(htmlString)) !== null) {
  var src = matches[1];
  console.log(src);
}

我們運行看下結果

怎么讓chatgpt將html中的圖片轉為base64

成功跳過了 base64 的，但是，好像沒有了忽略注釋代碼的條件，啊這。。

所以我就讓他忽略注釋和 base64 的，但好像一直丟三落四，按下葫蘆浮起瓢，大家可以看看

怎么讓chatgpt將html中的圖片轉為base64

上面的注釋的被匹配到了

怎么讓chatgpt將html中的圖片轉為base64

怎么讓chatgpt將html中的圖片轉為base64

注釋又又又被匹配到了，算了，我直接問如果忽略 base64，然后再組合忽略注釋的就好，組合后的代碼如下：

const imgRegex = /<img\s+[^>]*src=["']((?!data:image)[^"']*)["'][^>]*>/gi;
// 定義匹配注釋的正則表達式
const commentRegex = /<!--[\s\S]*?-->/g
// 刪除所有注釋
var htmlString = '<img src="image1.jpg"> <img src="data:image/png;base64,iVBORw0KG..."> <img src="image2.jpg"><!-- <img src="image3.jpg"> -->';
htmlString = htmlString.replace(commentRegex, '')
// 遍歷所有匹配到的圖片標簽并獲取其src屬性
const imgSrcs = []
let matches;
while ((matches = imgRegex.exec(htmlString)) !== null) {
const src = matches[1];
imgSrcs.push(src)
}
console.log(imgSrcs)

怎么讓chatgpt將html中的圖片轉為base64

忽略 Thymeleaf 語法

還有個問題，img 的 src 可能是通過服務端渲染導入的，那么我們要忽略掉，大致語法為 <img th:src="${t.imgUrl1}" />，也就是以 th:開頭的

怎么讓chatgpt將html中的圖片轉為base64

// 定義匹配圖片標簽的正則表達式
var imgRegex = /<img\s+[^>]*src=["']((?!data:image|@{)(?!\s*th:src)[^"']*)["'][^>]*>/gi;
// 要解析的HTML字符串
var htmlString = '<img src="image1.jpg"> <img src="@{some/url}"> <img src="data:image/png;base64,iVBORw0KG..."> <img src="image2.jpg" th:src="@{some/other/url}">';
// 遍歷所有匹配到的不以 data:image、@{ 和包含 th:src 的圖片標簽并獲取其src屬性
var matches;
while ((matches = imgRegex.exec(htmlString)) !== null) {
  var src = matches[1];
  console.log(src);
}

怎么讓chatgpt將html中的圖片轉為base64

上面的@{可以忽略，實際上也是屬于 Thymeleaf 語法，屏蔽 th:src 即可

結合起來，封裝成一個函數

function getImgSrcInHtml(htmlString) {
  /** 定義匹配圖片標簽的正則表達式
   * 1.src中不以data:image開頭，即不以base64開頭，沒必要再轉化了
   * 2.不是th:src
   * 3.忽略注釋的代碼
   * */
  const imgRegex = /<img\s+[^>th:]*src=["']((?!data:image)[^"']*)["'][^>]*>/gi;
  // 定義匹配注釋的正則表達式
  const commentRegex = /<!--[\s\S]*?-->/g
  // 刪除所有注釋
  htmlString = htmlString.replace(commentRegex, '')
  // 遍歷所有匹配到的圖片標簽并獲取其src屬性
  const imgSrcs = []
  let matches;
  while ((matches = imgRegex.exec(htmlString)) !== null) {
    const src = matches[1];
    imgSrcs.push(src)
  }
  return imgSrcs.filter(Boolean)
}

運行下，看下結果：

怎么讓chatgpt將html中的圖片轉為base64

src 轉 base64

自此，我們拿到所有 html 里面的 src 了，那么判斷下是否小于指定 size，是的話轉 base64

獲取文件大小可通過 fs 的 statSync 來拿到對應文件的 size，如下

/** 獲取文件大小 */
function getFileSize(filePath) {
  const stat = fs.statSync(filePath)
  return stat.size
}

如果滿足條件則將圖片轉 base64，而圖片本身是 Buffer，所以要轉一下：

/** 圖片轉成base64 */
function imageToBase64(filePath) {
  // 讀取圖片文件
  const imageBuffer = fs.readFileSync(filePath)
  const extname = getExtname(filePath)
  // 將圖片文件轉換為 base64 編碼字符串
  const base64String = Buffer.from(imageBuffer).toString('base64')
  return `data:image/${extname.slice(1)};base64,${base64String}`
}

通過加上前綴data:image/${extname.slice(1)};base64,，其中 extname 是文件后綴名，通過path.extname拿到：

/** 獲取后綴名 */
function getExtname(filePath) {
  return path.extname(filePath)
}

每得到一個 base64，則替換原先的 src：

htmlString = htmlString.replace(src, imgBase64)

最后將新的 html 替換舊的 html

html 下滿足條件的 src 全部替換好后，就可以將新的 html 替換老的了，實際上也就是重寫回去：

writeFile(htmlPath, htmlString)

性能優(yōu)化

但我們發(fā)現整個過程中有兩處可以優(yōu)化代碼：

如果 src 大于指定尺寸，那么下次遇到直接跳過，不再獲取尺寸大小
一個圖片可能被多處引用到，那么轉 base64 后，下次遇到就沒必要再轉了，直接復用即可

針對第一點，我們可以通過聲明一個 Set，存放大于指定尺寸的 src：

for (const src of imgSrcs) {
      /** 之前已經大于了，這次遇到就直接跳過即可 */
      if (imgOverSizeSet.has(src)) continue
      let absoluteSrc = src
      // 如果不是相對路徑，那么轉換為絕對路徑
      if (!src.startsWith('.')) absoluteSrc = path.join(STATIC_PATH, src)
      // 不存在或者超出限制，則不替換
      if (getFileSize(absoluteSrc) &gt;= FILE_LIMIE_SIZE) {
        imgNotExistOrOverSizeSet.add(src)
        continue
      }
}

針對第二點，我們可以通過聲明一個 Map，key 為 src，value 為 base64：

/** 存imgSrc -&gt; 圖片base64 */
const imgSrc2Base64Map = new Map()

每次判斷到對應的 src 有值，則直接拿之前的 base64，不再轉化：

let imgBase64 = imgSrc2Base64Map.get(src)
if (!imgBase64) {
  imgBase64 = imageToBase64(absoluteSrc)
  imgSrc2Base64Map.set(src, imgBase64)
}

總的代碼

const fs = require('fs')
const path = require('path')
function resolve(relativePath) {
  return path.resolve(__dirname, relativePath)
}
/** 靜態(tài)資源路徑 */
const STATIC_PATH = resolve('xxx')
/** html模板路徑 */
const TEMPLATE_PATH = resolve('yyy')
/** 文件大小限制 10K */
const FILE_LIMIE_SIZE = 1024 * 10
/** 圖片轉成base64 */
function imageToBase64(filePath) {
  // 讀取圖片文件
  const imageBuffer = fs.readFileSync(filePath)
  const extname = getExtname(filePath)
  // 將圖片文件轉換為 base64 編碼字符串
  const base64String = Buffer.from(imageBuffer).toString('base64')
  return `data:image/${extname.slice(1)};base64,${base64String}`
}
/** 獲取文件大小 */
function getFileSize(filePath) {
  const stat = fs.statSync(filePath)
  return stat.size
}
/** 獲取后綴名 */
function getExtname(filePath) {
  return path.extname(filePath)
}
/** 獲取所有html路徑 */
function getHtmlPaths(dir, filePaths = []) {
  const files = fs.readdirSync(dir);
  for (const file of files) {
    const filePath = path.join(dir, file);
    const fileStat = fs.statSync(filePath);
    if (fileStat.isDirectory()) {
      getHtmlPaths(filePath, filePaths);
    } else if (fileStat.isFile() && getExtname(filePath) === '.html') {
      filePaths.push(filePath);
    }
  }
  return filePaths;
}
function readFile(filePath) {
  return fs.readFileSync(filePath, 'utf-8')
}
function writeFile(filePath, source) {
  return fs.writeFileSync(filePath, source)
}
/** 獲取html中滿足規(guī)則的img src */
function getImgSrcInHtml(htmlString) {
  /** 定義匹配圖片標簽的正則表達式
   * 1.src中不以data:image開頭，即不以base64開頭，沒必要再轉化了
   * 2.不是th:src
   * 3.忽略注釋的代碼
   * */
  const imgRegex = /<img\s+[^>th:]*src=["']((?!data:image)[^"']*)["'][^>]*>/gi;
  // 定義匹配注釋的正則表達式
  const commentRegex = /<!--[\s\S]*?-->/g
  // 刪除所有注釋
  htmlString = htmlString.replace(commentRegex, '')
  // 遍歷所有匹配到的圖片標簽并獲取其src屬性
  const imgSrcs = []
  let matches;
  while ((matches = imgRegex.exec(htmlString)) !== null) {
    const src = matches[1];
    imgSrcs.push(src)
  }
  return imgSrcs.filter(Boolean)
}
/** 主程序 */
function main() {
  const htmlPaths = getHtmlPaths(TEMPLATE_PATH)
  /** 存imgSrc -> 圖片base64 */
  const imgSrc2Base64Map = new Map()
  /** 存不存在，或者超過指定大小的img */
  const imgNotExistOrOverSizeSet = new Set()
  htmlPaths.forEach(htmlPath => {
    let htmlString = readFile(htmlPath)
    const imgSrcs = getImgSrcInHtml(htmlString)
    if (!imgSrcs.length) return
    for (const src of imgSrcs) {
      if (imgNotExistOrOverSizeSet.has(src)) continue
      let absoluteSrc = src
      // console.log(imgSrcs)
      // 如果不是相對路徑，那么轉換為絕對路徑
      if (!src.startsWith('.')) absoluteSrc = path.join(STATIC_PATH, src)
      const isExist = fs.existsSync(absoluteSrc)
      if (!isExist) console.log('not isExist', src)
      // 不存在或者超出限制，則不替換
      if (!isExist || getFileSize(absoluteSrc) >= FILE_LIMIE_SIZE) {
        imgNotExistOrOverSizeSet.add(src)
        continue
      }
      let imgBase64 = imgSrc2Base64Map.get(src)
      if (!imgBase64) {
        imgBase64 = imageToBase64(absoluteSrc)
        imgSrc2Base64Map.set(src, imgBase64)
      }
      htmlString = htmlString.replace(src, imgBase64)
    }
    // 替換好后，寫回
    writeFile(htmlPath, htmlString)
  })
}
main()

關于“怎么讓chatgpt將html中的圖片轉為base64”的內容就介紹到這里了，感謝大家的閱讀。如果想了解更多行業(yè)相關的知識，可以關注億速云行業(yè)資訊頻道，小編每天都會為大家更新不同的知識點。

向AI問一下細節(jié)

推薦閱讀：

免責聲明：本站發(fā)布的內容（圖片、視頻和文字）以原創(chuàng)、轉載和分享為主，文章觀點不代表本網站立場，如果涉及侵權請聯系站長郵箱：is@yisu.com進行舉報，并提供相關證據，一經查實，將立刻刪除涉嫌侵權內容。

上一篇新聞：
怎么讓ChatGPT解讀Vue3源碼
下一篇新聞：
怎么利用Python進行客戶分群分析

猜你喜歡

AI
助
手

產品服務

地區(qū)劃分

專題活動

幫助支持

關于我們

售后咨詢

7*24小時在線電話：400-100-2938

7*24小時在線 QQ：800811969

關注億速云

億速云公眾號

手機網站二維碼

<button id="wkyqb"><em id="wkyqb"></em></button>

<div id="wkyqb"><del id="wkyqb"></del></div>