<noscript id="11611"></noscript>

溫馨提示×

溫馨提示×

您好，登錄后才能下訂單哦！

密碼登錄×

忘記密碼？

登錄注冊×

獲取短信驗(yàn)證碼

其他方式登錄

點(diǎn)擊登錄注冊即表示同意《億速云用戶服務(wù)條款》

用戶登錄×

賬戶密碼登錄

請使用微信掃描上方二維碼

使用幫助

請求超時(shí)！

請點(diǎn)擊重新獲取二維碼

web編程語言的數(shù)據(jù)親和力分析

發(fā)布時(shí)間：2021-11-18 14:58:36 來源：億速云閱讀：102 作者：iii 欄目：web開發(fā)

本篇內(nèi)容主要講解“web編程語言的數(shù)據(jù)親和力分析”，感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷，實(shí)用性強(qiáng)。下面就讓小編來帶大家學(xué)習(xí)“web編程語言的數(shù)據(jù)親和力分析”吧!

目前，程序設(shè)計(jì)語言似乎進(jìn)入了一個(gè)蓬勃發(fā)展的時(shí)期，JavaScript、Perl、Python、Ruby、Groovy等一批較新的語言正越來越多地被熟悉和使用，而C++、C#、Java等主流語言也在不斷地融入函數(shù)式和動態(tài)性特征。程序員的百寶箱中可供選擇的寶貝是越來多了，而社區(qū)中關(guān)于語言間的比較和爭論也更為熱烈，我們常常見到關(guān)于“面向過程和面向?qū)ο蟮谋容^”、“動態(tài)語言和靜態(tài)語言的比較”、“命令式和函數(shù)式范式的比較”等比較。我注意到這類討論的關(guān)注點(diǎn)多集中于設(shè)計(jì)相關(guān)話題，如“動態(tài)語言的Duck typing多態(tài)和靜態(tài)語言的繼承多態(tài)的比較”，“Prototype based和Class based的比較”等。但我認(rèn)為還有一個(gè)十分重要的方面值得關(guān)注，這就是數(shù)據(jù)處理。

數(shù)據(jù)處理之所以重要是因?yàn)椴徽撌潜镜匦畔⒋鎯€是系統(tǒng)間信息交換都需要建立在一定的數(shù)據(jù)格式基礎(chǔ)上。另外，不管語言屬于那種范式，設(shè)計(jì)上采用什么模式，在微觀層次上程序很大一部分工作都是在做數(shù)據(jù)處理。所以，從數(shù)據(jù)處理角度比較和理解語言間的差異有重要的現(xiàn)實(shí)意義。雖然數(shù)據(jù)通常是平臺和語言無關(guān)的，但不同的語言在處理某種格式的數(shù)據(jù)時(shí)會表現(xiàn)出不同的難度，甚至某些數(shù)據(jù)格式只能采用特定的語言才能實(shí)現(xiàn)，這就是數(shù)據(jù)親和力的不同。

語言的數(shù)據(jù)親和力(Data Affinity)指的是語言與某種數(shù)據(jù)格式之間的相容程度，它主要取決于語言的數(shù)據(jù)模型，類型系統(tǒng)，以及庫的支持等。語言對某種數(shù)據(jù)格式親和力越強(qiáng)，則操作某類數(shù)據(jù)越容易。

二進(jìn)制字節(jié)塊格式

在偏底層的操作系統(tǒng)、嵌入式和通信系統(tǒng)中，二進(jìn)制的字節(jié)塊是最常見的一種數(shù)據(jù)格式。二進(jìn)制數(shù)據(jù)布局緊湊和接近機(jī)器的特點(diǎn)使得它常常作為系統(tǒng)間通信或系統(tǒng)文件的數(shù)據(jù)格式。但一般高級語言不方便直接和0101打交道，而是基于記錄、結(jié)構(gòu)體和類等結(jié)構(gòu)化表示操作數(shù)據(jù)，這就存在著在底層的二進(jìn)制字節(jié)塊和高層的結(jié)構(gòu)化數(shù)據(jù)之間的轉(zhuǎn)換問題。

C語言作為最主要的系統(tǒng)語言具有很高的字節(jié)塊數(shù)據(jù)親和力。這不僅因?yàn)镃語言具有指針可以直接訪問內(nèi)存以外，還因?yàn)镃的結(jié)構(gòu)體(struct)可以和字節(jié)塊建立起直接的映射關(guān)系。例如，在基于Socket連接的分布式系統(tǒng)中服務(wù)器端和客戶端通過二進(jìn)制的字節(jié)數(shù)據(jù)進(jìn)行通信，通信雙方只要事先定義共用的結(jié)構(gòu)體，發(fā)送方先創(chuàng)建相應(yīng)的結(jié)構(gòu)體變量并填充字段，然后把變量對應(yīng)的內(nèi)存塊copy到Socket，接收方從Socket讀取字節(jié)塊，然后把字節(jié)塊強(qiáng)制類型轉(zhuǎn)換為相應(yīng)的結(jié)構(gòu)體指針即可讀取個(gè)字段信息。整個(gè)過程中通信的雙方都沒有復(fù)雜的信息編碼和解碼的過程。示例代碼如下：

struct t_data {      int version;      char type[10];      float value;  };

//發(fā)送方  struct t_data data;  data.version = 1;  strcpy(data.type, “degree”);  data.value = 189.0;  send(socket,  (char*)&data, sizeof(data));

//接收方  struct t_data data;  read(socket,  (char*)&data, sizeof(data));  printf(“%d, %s, %f”, data.version, data.type, data.value);

上面的方法在實(shí)際應(yīng)用中還需要注意內(nèi)存對齊問題和大小端問題。內(nèi)存對齊問題可以通過編譯器預(yù)處理命令來進(jìn)行控制，保證內(nèi)存中struct結(jié)構(gòu)與傳輸?shù)淖止?jié)塊具有相同的對齊方式;大小端問題需要通信的雙方采用同樣的大小端方式，否則就需要進(jìn)行轉(zhuǎn)換。

C++可以完全兼容C的結(jié)構(gòu)體，但C++的類(包括class和struct)中如果定義了虛函數(shù)，則會喪失結(jié)構(gòu)的字節(jié)塊數(shù)據(jù)親和力，這是C++編程時(shí)需要權(quán)衡的一個(gè)因素。而除了C/C++，其他語言中則難以見到字節(jié)塊數(shù)據(jù)親和力，其原因在于C/C++允許控制結(jié)構(gòu)體/對象的內(nèi)存布局，并允許對指針進(jìn)行非類型安全的強(qiáng)制類型轉(zhuǎn)換，這都是在Java，C#等語言中不允許的。所以，在Java、C#中進(jìn)行字節(jié)塊的編碼解碼就只能按照協(xié)議一個(gè)字段一個(gè)字段地按偏移量和長度進(jìn)行解析。C/C++的指針以及結(jié)構(gòu)體和內(nèi)存的直接映射帶來了對字節(jié)塊數(shù)據(jù)的親和力，但同時(shí)也留下了內(nèi)存訪問和類型安全的隱患;而Java、C#在擁有引用安全和類型安全的同時(shí)也失去了對字節(jié)塊數(shù)據(jù)的親和力。

文本格式

文本格式是另一種十分常見的數(shù)據(jù)格式。《Unix編程藝術(shù)》是這樣評價(jià)文本格式的："Text streams are a valuable universal format because they're easy for human beings to read, write, and edit without specialized tools ”。基于文本流的管道處理是一種備受贊譽(yù)的Unix風(fēng)格。Shell可以通過管道把各種功能單一的命令串聯(lián)起來，讓文本流在管道上流動，因而Shell語言具有很好的文本數(shù)據(jù)親和力。許多文本數(shù)據(jù)處理任務(wù)Bash都可以一行搞定，這就是Hacker們酷愛的One Liner風(fēng)格。

下面我們來看兩個(gè)用Bash進(jìn)行文本處理的例子：

1. 統(tǒng)計(jì)當(dāng)前目錄下的gz文件數(shù)目：

ls –l *.gz | wc –l

2. 在Web服務(wù)器日志service.log中統(tǒng)計(jì)2011年6月26和27兩天中每天各頁面的PV

cat service.log | grep ^2011-06-2[6-7] | cut –d ‘ ‘ –f 1, 3 | sort | uniq –c

service.log:

2011-06-25 13:00:55 /music/c.htm Safari

…

2011-06-26 08:01:23 /main.htm IE

2011-06-26 08:03:01 /sports/b.htm Chrome

…

2011-06-27 11:41:06 /main.htm IE

2011-06-27 11:52:41 /news/a.htm Firefox

輸出:

210 2011-06-26 /main.htm

231 2011-06-26 /news/a.htm

155 2011-06-26 /sports/b.htm

288 2011-06-27 /main.htm

292 2011-06-27 /news/a.htm

161 2011-06-27 /sports/b.htm

上面的兩個(gè)簡單文本數(shù)據(jù)處理任務(wù)如果是在C或C++下實(shí)現(xiàn)則要麻煩得多，代碼量至少是十幾行或者數(shù)十行，加上編譯調(diào)試，整個(gè)開發(fā)效率可能比Shell低一個(gè)數(shù)量級。除了Shell外，Perl也是以強(qiáng)大的文本數(shù)據(jù)處理而聞名的。我們來看一個(gè)Perl正則表達(dá)式的例子：

while (<STDIN>) {      if (/hello\s(\w+)/i) {          print “say hello to $1“      }      else if (/goodbye\s(\w+)/i) {          print “say goodbye to $1”      }  }

輸入：

HeLLo world

Goodbye bug

輸出：

say hello to world

say goodbye to bug

上面的例子中我們看到Perl直接進(jìn)行字符串匹配并進(jìn)行數(shù)據(jù)提取的強(qiáng)大威力。Perl基于正則表達(dá)式的字符串處理不僅比C/C++等系統(tǒng)語言更強(qiáng)大，甚至比Python這樣的動態(tài)語言也更強(qiáng)大和更方便，這是因?yàn)檎齽t表達(dá)式是Perl語言的“一等公民”，這就使得Perl比其他以庫的方式支持正則表達(dá)式功能的語言具有更好的文本數(shù)據(jù)親和力。后來的Ruby也學(xué)習(xí)Perl直接在語言上支持正則表達(dá)式。

結(jié)構(gòu)化文本格式

XML是最近十幾年來流行起來的一種通用(半)結(jié)構(gòu)化的文本數(shù)據(jù)交換格式。XML除具有一般文本格式的優(yōu)點(diǎn)外，還具有能層次結(jié)構(gòu)表達(dá)力和可擴(kuò)展性的優(yōu)勢，所以它至誕生以來就被大量用于配置文件和各種Web Service中?，F(xiàn)代程序設(shè)計(jì)基本都少不了和XML打交道，不過在C++、Java和C#幾種靜態(tài)類型語言中處理XML卻并不是一件十分輕松的事情。我們先來看一個(gè)Java解析和構(gòu)建下面這個(gè)XML的例子：

<langs type="current">    <language>Java</language>    <language>Groovy</language>    <language>JavaScript</language>  </langs>

//Java解析XML  DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();  try {      DocumentBuilder db = dbf.newDocumentBuilder();      Document doc = db.parse("src/languages.xml");      Element langs = doc.getDocumentElement();      System.out.println("type = " + langs.getAttribute("type"));      NodeList list = langs.getElementsByTagName("language");      for(int i = 0 ; i < list.getLength();i++) {          Element language = (Element) list.item(i);          System.out.println(language.getTextContent());      }  }catch(Exception e) {      e.printStackTrace();  }

//Java創(chuàng)建XML  DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();  try {      DocumentBuilder db = dbf.newDocumentBuilder();      Document doc = db.newDocument();      Element langs = doc.createElement("langs");      langs.setAttribute("type", "current");      doc.appendChild(langs);       Element language1 = doc.createElement("language");      Text text1 = doc.createTextNode("Java");      language1.appendChild(text1);      langs.appendChild(language1);       Element language2 = doc.createElement("language");      Text text2 = doc.createTextNode("Groovy");      language2.appendChild(text2);      langs.appendChild(language2);      Element language3 = doc.createElement("language");      Text text3 = doc.createTextNode("JavaScript");      language3.appendChild(text3);      langs.appendChild(language3);  } catch (Exception e) {      e.printStackTrace();  }

為了解析和創(chuàng)建小小的一段XML代碼需要編寫如此冗長的Java代碼，而實(shí)現(xiàn)同樣的功能動態(tài)語言Groovy則十分簡潔：

//Groovy解析XML             def langs = new XmlParser().parse("languages.xml")  println "type = ${langs.attribute("type")}" langs.language.each{    println it.text()  }

//Groovy創(chuàng)建XML  def xml = new groovy.xml.MarkupBuilder()  xml.langs(type:"current"){    language("Java")    language("Groovy")    language("JavaScript")  }

上面Groovy操作XML的代碼簡潔而富有表達(dá)力，代碼與XML幾乎是一一對應(yīng)的，如同直接在XML上進(jìn)行操作的DSL一樣，而相應(yīng)的Java代碼則看不到XML的影子。這說明Groovy具有很高的XML數(shù)據(jù)的親和力。為什么Java和Groovy在XML親和力方面有這樣的差異呢?原因在于Java要求所有的方法和屬性都必須先定義再調(diào)用，嚴(yán)格的靜態(tài)類型檢查使得Java只能把XML元素作為“二等公民”來表達(dá);而Groovy則沒有靜態(tài)類型檢查的限制，可以自由地使用方法和屬性來表達(dá)XML結(jié)構(gòu)。上面用Groovy創(chuàng)建XML的例子中，groovy.xml.MarkupBuilder類中實(shí)際上并沒有l(wèi)angs, language這些方法，但會在調(diào)用的時(shí)候自動創(chuàng)建相應(yīng)的XML結(jié)構(gòu)。

除了XML外，JSON是另一種通用的半結(jié)構(gòu)化的純文本數(shù)據(jù)交換格式，它常被視為輕量級的XML。JSON的本意是Javascript的對象表示(Javascript Object Notation)，它屬于Javascript的語法子集，Javascript對JSON有原生的支持。下面就是一個(gè)在Javascript中創(chuàng)建JSON對象的例子：

var json = { “l(fā)angs” : {          "type” : "current”,          "language” : ["Java”, "Groovy”, "Javascript”]      }  }

許多Javascript程序都會通過AJAX都從服務(wù)器獲取JSON字符串，然后把字符串解析為JSON對象。由于Javascript對JSON的原生支持，所以，在Javascript中解析JSON字符串可以采用通用的eval方式，如：

var json = eval(“(" + jsonStr + “)");  alert(json.langs.type);

甚至可以：

eval(“var json = ” + jsonStr);  alert(json.langs.type);

不過eval的通用性帶來了一定的安全隱患，所以一般只建議對受信任的數(shù)據(jù)源采用eval方式解析JSON，對于不受信任的數(shù)據(jù)源可以采用專門的JSON解析庫。無論如何Javascript對JSON的原生支持都使得Javascript具有很高的JSON數(shù)據(jù)親和力。另外，Groovy 1.8也加入了對JSON的原生支持，操作JSON與Javascript一樣方便。

到此，相信大家對“web編程語言的數(shù)據(jù)親和力分析”有了更深的了解，不妨來實(shí)際操作一番吧！這里是億速云網(wǎng)站，更多相關(guān)內(nèi)容可以進(jìn)入相關(guān)頻道進(jìn)行查詢，關(guān)注我們，繼續(xù)學(xué)習(xí)！

向AI問一下細(xì)節(jié)

推薦閱讀：

免責(zé)聲明：本站發(fā)布的內(nèi)容（圖片、視頻和文字）以原創(chuàng)、轉(zhuǎn)載和分享為主，文章觀點(diǎn)不代表本網(wǎng)站立場，如果涉及侵權(quán)請聯(lián)系站長郵箱：is@yisu.com進(jìn)行舉報(bào)，并提供相關(guān)證據(jù)，一經(jīng)查實(shí)，將立刻刪除涉嫌侵權(quán)內(nèi)容。

上一篇新聞：
進(jìn)行Web網(wǎng)站壓力測試方法是什么
下一篇新聞：
如何進(jìn)行Metasploit+NetRipper獲取Chrome等瀏覽器帳號密碼測試

猜你喜歡

AI
助
手

產(chǎn)品服務(wù)

地區(qū)劃分

專題活動

幫助支持

關(guān)于我們

售后咨詢

7*24小時(shí)在線電話：400-100-2938

7*24小時(shí)在線 QQ：800811969

關(guān)注億速云

億速云公眾號

手機(jī)網(wǎng)站二維碼

<td id="66111"><tr id="66111"></tr></td><source id="66111"></source>

<u id="66111"><object id="66111"></object></u>

<var id="66111"></var>