您好,登錄后才能下訂單哦!
本篇內(nèi)容主要講解“HIVE有哪些數(shù)據(jù)類(lèi)型”,感興趣的朋友不妨來(lái)看看。本文介紹的方法操作簡(jiǎn)單快捷,實(shí)用性強(qiáng)。下面就讓小編來(lái)帶大家學(xué)習(xí)“HIVE有哪些數(shù)據(jù)類(lèi)型”吧!
類(lèi)型 | 后綴 | 例子 |
---|---|---|
TINYINT | Y | 100Y |
SMALLINT | S | 100S |
BIGINT | L | 100L |
INTEGER is introduced as a synonym for INT in Hive 2.2.0 (HIVE-14950).
2. Decimals
Hive的小數(shù)型是基于Java BigDecimal做的, BigDecimal在java中用于表示任意精度的小數(shù)類(lèi)型。所有常規(guī)數(shù)字運(yùn)算(例如+, - ,*,/)和相關(guān)的UDFs(例如Floor,Ceil,Round等等)都使用和支持Decimal。你可以將Decimal和其他數(shù)值型互相轉(zhuǎn)換,且Decimal支持科學(xué)計(jì)數(shù)法和非科學(xué)計(jì)數(shù)法。因此,無(wú)論您的數(shù)據(jù)集是否包含如4.004E + 3(科學(xué)記數(shù)法)或4004(非科學(xué)記數(shù)法)或兩者的組合的數(shù)據(jù),可以使用Decimal。
從Hive 0.13開(kāi)始,用戶(hù)可以使用DECIMAL(precision, scale) 語(yǔ)法在創(chuàng)建表時(shí)來(lái)定義Decimal數(shù)據(jù)類(lèi)型的precision和scale。 如果未指定precision,則默認(rèn)為10。如果未指定scale,它將默認(rèn)為0(無(wú)小數(shù)位)。
CREATE TABLE foo (
a DECIMAL, – Defaults to decimal(10,0)
b DECIMAL(9, 7)
)
大于BIGINT的數(shù)值,需要使用BD后綴以及Decimal(38,0)來(lái)處理,例:
select CAST(18446744073709001000BD AS DECIMAL(38,0)) from my_table limit 1;
Decimal在Hive 0.12.0 and 0.13.0之間是不兼容的,故0.12前的版本需要遷移才可繼續(xù)使用,具體情況參見(jiàn)官網(wǎng)。
類(lèi)型 | 支持版本 |
---|---|
TIMESTAMP | Note: Only available starting with Hive 0.8.0 |
DATE | Note: Only available starting with Hive 0.12.0 |
INTERVAL | Note: Only available starting with Hive 1.2.0 |
1. Timestamps
支持傳統(tǒng)的UNIX時(shí)間戳和可選的納秒精度。
- 支持的轉(zhuǎn)化:
- 整數(shù)數(shù)字類(lèi)型:以秒為單位解釋為UNIX時(shí)間戳
- 浮點(diǎn)數(shù)值類(lèi)型:以秒為單位解釋為UNIX時(shí)間戳,帶小數(shù)精度
- 字符串:符合JDBC java.sql.Timestamp格式“YYYY-MM-DD HH:MM:SS.fffffffff”(9位小數(shù)位精度)
時(shí)間戳被解釋為無(wú)時(shí)間的,并被存儲(chǔ)為從Unix紀(jì)元的偏移量。 提供了用于轉(zhuǎn)換到和從時(shí)區(qū)轉(zhuǎn)換的便捷UDFs(to_utc_timestamp,from_utc_timestamp)。
所有現(xiàn)有的日期時(shí)間UDFs(月,日,年,小時(shí)等)都使用TIMESTAMP數(shù)據(jù)類(lèi)型。
Text files中的時(shí)間戳必須使用格式y(tǒng)yyy-mm-dd hh:mm:ss [.f …]。 如果它們是另一種格式,請(qǐng)將它們聲明為適當(dāng)?shù)念?lèi)型(INT,F(xiàn)LOAT,STRING等),并使用UDF將它們轉(zhuǎn)換為時(shí)間戳。
在表級(jí)別上,可以通過(guò)向SerDe屬性”timestamp.formats”(自版本1.2.0 with HIVE-9298)提供格式來(lái)支持備選時(shí)間戳格式。 例如,yyyy-MM-dd’T’HH:mm:ss.SSS,yyyy-MM-dd’T’HH:mm:ss。
2. Dates
DATE值描述特定的年/月/日,格式為YYYY-MM-DD。 例如,DATE’2013-01-01’。 日期類(lèi)型沒(méi)有時(shí)間組件。 Date類(lèi)型支持的值范圍是0000-01-01到9999-12-31,這取決于Java Date類(lèi)型的原始支持。
Date types只能在Date, Timestamp, or String types之間轉(zhuǎn)換。
1.Strings
字符串文字可以用單引號(hào)(’)或雙引號(hào)(“)表示。Hive在字符串中使用C風(fēng)格的轉(zhuǎn)義。
2. Varchar
Varchar類(lèi)型使用長(zhǎng)度說(shuō)明符(介于1和65355之間)創(chuàng)建,它定義字符串中允許的最大字符數(shù)。 如果要轉(zhuǎn)換/分配給varchar值的字符串值超過(guò)length說(shuō)明符,則字符串將被靜默截?cái)唷?字符長(zhǎng)度由字符串包含的代碼點(diǎn)的數(shù)量確定。
像字符串一樣,尾部空格在varchar中很重要,并且會(huì)影響比較結(jié)果。
非通用UDFs不能直接使用varchar類(lèi)型作為輸入?yún)?shù)或返回值。 可以創(chuàng)建字符串UDFs,而varchar值將被轉(zhuǎn)換為strings并傳遞到UDF。 要直接使用varchar參數(shù)或返回varchar值,請(qǐng)創(chuàng)建GenericUDF。
如果基于reflection-based方法來(lái)獲取數(shù)據(jù)類(lèi)型信息,則可能存在不支持varchar的場(chǎng)景。 這包括一些SerDe函數(shù)實(shí)現(xiàn)。
3. Char
字符類(lèi)型與Varchar類(lèi)似,但它們是固定長(zhǎng)度的,意味著比指定長(zhǎng)度值短的值用空格填充,但尾隨空格在比較期間不重要。 最大長(zhǎng)度固定為255。
CREATE TABLE foo (bar CHAR(10))
<table font-size:16px;background-color:#FFFFFF;">
類(lèi)型 | 支持版本 | |
---|---|---|
arrays | ARRAY(data_type) | Note: negative values and non-constant expressions are allowed as of Hive 0.14. |
maps | MAP(primitive_type, data_type) | Note: negative values and non-constant expressions are allowed as of Hive 0.14. |
structs | STRUCTcol_name : data_type [COMMENT col_comment], …) | |
union | UNIONTYPE(data_type, data_type, …) | Note: Only available starting with Hive 0.7.0. |
到此,相信大家對(duì)“HIVE有哪些數(shù)據(jù)類(lèi)型”有了更深的了解,不妨來(lái)實(shí)際操作一番吧!這里是億速云網(wǎng)站,更多相關(guān)內(nèi)容可以進(jìn)入相關(guān)頻道進(jìn)行查詢(xún),關(guān)注我們,繼續(xù)學(xué)習(xí)!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。