這篇文章總結(jié)了所有的Java集合(Collection)。主要介紹各個(gè)集合的特性和用途,以及在不同的集合類型之間轉(zhuǎn)換的方式。
Array是Java特有的數(shù)組。在你知道所要處理數(shù)據(jù)元素個(gè)數(shù)的情況下非常好用。java.util.Arrays
包含了許多處理數(shù)據(jù)的實(shí)用方法:
Array
轉(zhuǎn)換成 List
??梢宰鳛槠渌项愋蜆?gòu)造器的參數(shù)。、
Arrays.deepHashCode:Arrays.equals/hashCode
的高級(jí)版本,支持子數(shù)組的操作。equals
方法(數(shù)組對(duì)象中沒(méi)有重寫(xiě)equals()
方法,所以這個(gè)方法之比較引用而不比較內(nèi)容)。這個(gè)方法集合了Java 5的自動(dòng)裝箱和無(wú)參變量的特性,來(lái)實(shí)現(xiàn)將一個(gè)變量快速地傳給 equals()
方法——所以這個(gè)方法在比較了對(duì)象的類型之后是直接傳值進(jìn)去比較的。hashCode()
不可用)。這個(gè)方法集合了Java 5的自動(dòng)裝箱和無(wú)參變量的特性,來(lái)實(shí)現(xiàn)將一個(gè)變量快速地傳給 Arrays.hashcode
方法——只是傳值進(jìn)去,不是對(duì)象。如果想要復(fù)制整個(gè)數(shù)組或其中一部分到另一個(gè)數(shù)組,可以調(diào)用 System.arraycopy
方法。此方法從源數(shù)組中指定的位置復(fù)制指定個(gè)數(shù)的元素到目標(biāo)數(shù)組里。這無(wú)疑是一個(gè)簡(jiǎn)便的方法。(有時(shí)候用 ByteBuffer bulk復(fù)制會(huì)更快??梢詤⒖?a rel="nofollow" target="_blank">這篇文章).
最后,所有的集合都可以用T[] Collection.toArray( T[] a )
這個(gè)方法復(fù)制到數(shù)組中。通常會(huì)用這樣的方式調(diào)用:
1 | return coll.toArray( new T[ coll.size() ] ); |
這個(gè)方法會(huì)分配足夠大的數(shù)組來(lái)儲(chǔ)存所有的集合,這樣 toArray
在返回值時(shí)就不必再分配空間了。
這一部分介紹的是不支持多線程的集合。這些集合都在java.util
包里。其中一些在Java 1.o的時(shí)候就有了(現(xiàn)在已經(jīng)棄用),其中大多數(shù)在Java 1.4中重新發(fā)布。枚舉集合在Java 1.5中重新發(fā)布,并且從這個(gè)版本之后所有的集合都支持泛型。PriorityQueue
也在Java 1.5中加入。非線程安全的集合架構(gòu)的最后一個(gè)版本是ArrayDeque
,也在Java 1.6中重新發(fā)布了。
List
集合實(shí)現(xiàn)。由一個(gè)整形數(shù)字或數(shù)組存儲(chǔ)了集合的大?。〝?shù)組中第一個(gè)沒(méi)有使用的元素)。像所有的List
集合一樣,ArrayList
可以在必要的時(shí)候擴(kuò)展它的大小。ArrayList訪問(wèn)元素的時(shí)間開(kāi)銷(xiāo)固定。在尾部添加元素成本低(為常數(shù)復(fù)雜度),而在頭部添加元素成本很高(線性復(fù)雜度)。這是由ArrayList
的實(shí)現(xiàn)原理——所有的元素的從角標(biāo)為0開(kāi)始一個(gè)接著一個(gè)排列造成的。也就是說(shuō),從要插入的元素位置往后,每個(gè)元素都要向后移動(dòng)一個(gè)位置。CPU緩存友好的集合是基于數(shù)組的。(其實(shí)也不是很友好,因?yàn)橛袝r(shí)數(shù)組會(huì)包含對(duì)象,這樣存儲(chǔ)的只是指向?qū)嶋H對(duì)象的指針)。Deque
實(shí)現(xiàn):每一個(gè)節(jié)點(diǎn)都保存著上一個(gè)節(jié)點(diǎn)和下一個(gè)節(jié)點(diǎn)的指針。這就意味著數(shù)據(jù)的存取和更新具有線性復(fù)雜度(這也是一個(gè)最佳化的實(shí)現(xiàn),每次操作都不會(huì)遍歷數(shù)組一半以上,操作成本最高的元素就是數(shù)組中間的那個(gè))。如果想寫(xiě)出高效的LinkedList
代碼可以使用 ListIterators
。如果你想用一個(gè)Queue/Deque
實(shí)現(xiàn)的話(你只需讀取第一個(gè)和最后一個(gè)元素就行了)——考慮用ArrayDeque
代替。ArrayList
版本?,F(xiàn)在直接用ArrayList
代替了。Deque
是基于有首尾指針的數(shù)組(環(huán)形緩沖區(qū))實(shí)現(xiàn)的。和LinkedList
不同,這個(gè)類沒(méi)有實(shí)現(xiàn)List
接口。因此,如果沒(méi)有首尾元素的話就不能取出任何元素。這個(gè)類比LinkedList
要好一些,因?yàn)樗a(chǎn)生的垃圾數(shù)量較少(在擴(kuò)展的時(shí)候舊的數(shù)組會(huì)被丟棄)。Deque
來(lái)代替(ArrayDeque
比較好)。poll/peek/remove/element
會(huì)返回一個(gè)隊(duì)列的最小值。不僅如此,PriorityQueue
還實(shí)現(xiàn)了Iterable
接口,隊(duì)列迭代時(shí)不進(jìn)行排序(或者其他順序)。在需要排序的集合中,使用這個(gè)隊(duì)列會(huì)比TreeSet
等其他隊(duì)列要方便。Map
實(shí)現(xiàn)。只是將一個(gè)鍵和值相對(duì)應(yīng),并沒(méi)有其他的功能。對(duì)于復(fù)雜的hashCode method
,get/put
方法有固定的復(fù)雜度。Map
。因?yàn)殒I的數(shù)量相對(duì)固定,所以在內(nèi)部用一個(gè)數(shù)組儲(chǔ)存對(duì)應(yīng)值。通常來(lái)說(shuō),效率要高于HashMap
。HashMap
的同步版本,新的代碼中也使用了HashMap
。Map
版本,它違背了一般Map
的規(guī)則:它使用 “==” 來(lái)比較引用而不是調(diào)用Object.equals
來(lái)判斷相等。這個(gè)特性使得此集合在遍歷圖表的算法中非常實(shí)用——可以方便地在IdentityHashMap
中存儲(chǔ)處理過(guò)的節(jié)點(diǎn)以及相關(guān)的數(shù)據(jù)。HashMap
和LinkedList
的結(jié)合,所有元素的插入順序存儲(chǔ)在LinkedList
中。這就是為什么迭代LinkedHashMap
的條目(entry)、鍵和值的時(shí)候總是遵循插入的順序。在JDK中,這是每元素消耗內(nèi)存最大的集合。Map
需要實(shí)現(xiàn)equals
方法和Comparable/Comparator
。compareTo
需要前后一致。這個(gè)類實(shí)現(xiàn)了一個(gè)NavigableMap
接口:可以帶有與鍵數(shù)量不同的入口,可以得到鍵的上一個(gè)或者下一個(gè)入口,可以得到另一Map
某一范圍的鍵(大致和SQL的BETWEEN
運(yùn)算符相同),以及其他的一些方法。Map
通常用在數(shù)據(jù)緩存中。它將鍵存儲(chǔ)在WeakReference
中,就是說(shuō),如果沒(méi)有強(qiáng)引用指向鍵對(duì)象的話,這些鍵就可以被垃圾回收線程回收。值被保存在強(qiáng)引用中。因此,你要確保沒(méi)有引用從值指向鍵或者將值也保存在弱引用中m.put(key, new WeakReference(value))
。HashMap
的Set
實(shí)現(xiàn)。其中,所有的值為“假值”(同一個(gè)Object
對(duì)象具備和HashMap
同樣的性能?;谶@個(gè)特性,這個(gè)數(shù)據(jù)結(jié)構(gòu)會(huì)消耗更多不必要的內(nèi)存。Set
。Java的每一個(gè)enum
都映射成一個(gè)不同的int
。這就允許使用BitSet
——一個(gè)類似的集合結(jié)構(gòu),其中每一比特都映射成不同的enum
。EnumSet
有兩種實(shí)現(xiàn),RegularEnumSet
——由一個(gè)單獨(dú)的long
存儲(chǔ)(能夠存儲(chǔ)64個(gè)枚舉值,99.9%的情況下是夠用的),JumboEnumSet
——由long[]
存儲(chǔ)。BitSet
處理一組密集的整數(shù)Set
(比如從一個(gè)預(yù)先知道的數(shù)字開(kāi)始的id集合)。這個(gè)類用 long[]
來(lái)存儲(chǔ)bit
。HashSet
一樣,這個(gè)類基于LinkedHashMap
實(shí)現(xiàn)。這是唯一一個(gè)保持了插入順序的Set
。HashSet
類似。這個(gè)類是基于一個(gè)TreeMap
實(shí)例的。這是在單線程部分唯一一個(gè)排序的Set
。就像有專門(mén)的java.util.Arrays
來(lái)處理數(shù)組,Java中對(duì)集合也有java.util.Collections
來(lái)處理。
第一組方法主要返回集合的各種數(shù)據(jù):
ClassCastException
異常。這個(gè)功能可以防止在運(yùn)行的時(shí)候出錯(cuò)。//fixmeput
或update
這樣的復(fù)合操作)第二組方法中,其中有一些方法因?yàn)槟承┰驔](méi)有加入到集合中:
Arrays.binarySearch
功能相同。String.indexOf(String) / lastIndexOf(String)
方法類似——找出給定的List
中第一個(gè)出現(xiàn)或者最后一個(gè)出現(xiàn)的子表。Collections.reverseOrder
比較器。List
集合中的節(jié)點(diǎn),可以給定你自己的生成器——例如 java.util.Random / java.util.ThreadLocalRandom or java.security.SecureRandom
。這一部分將介紹java.util.concurrent
包中線程安全的集合。這些集合的主要屬性是一個(gè)不可分割的必須執(zhí)行的方法。因?yàn)椴l(fā)的操作,例如add
或update
或者check
再update
,都有一次以上的調(diào)用,必須同步。因?yàn)榈谝徊綇募现薪M合操作查詢到的信息在開(kāi)始第二步操作時(shí)可能變?yōu)闊o(wú)效數(shù)據(jù)。
多數(shù)的并發(fā)集合是在Java 1.5引入的。ConcurrentSkipListMap / ConcurrentSkipListSet
和 LinkedBlockingDeque
是在Java 1.6新加入的。Java 1.7加入了最后的 ConcurrentLinkedDeque
和 LinkedTransferQueue
listeners/observers
集合。Delayed
元素的集合。元素只有在延時(shí)已經(jīng)過(guò)期的時(shí)候才能被取出。隊(duì)列的第一個(gè)元素延期最小(包含負(fù)值——延時(shí)已經(jīng)過(guò)期)。當(dāng)你要實(shí)現(xiàn)一個(gè)延期任務(wù)的隊(duì)列的時(shí)候使用(不要自己手動(dòng)實(shí)現(xiàn)——使用ScheduledThreadPoolExecutor
)。ReentrantLock-s
。transfer
方法,可以讓生產(chǎn)者直接給等待的消費(fèi)者傳遞信息,這樣就不用將元素存儲(chǔ)到隊(duì)列中了。這是一個(gè)基于CAS操作的無(wú)鎖集合。PriorityQueue
的無(wú)界的版本。Queue
接口的話,通過(guò)Exchanger
類也能完成響應(yīng)的功能。get
操作全并發(fā)訪問(wèn),put
操作可配置并發(fā)操作的哈希表。并發(fā)的級(jí)別可以通過(guò)構(gòu)造函數(shù)中concurrencyLevel
參數(shù)設(shè)置(默認(rèn)級(jí)別16)。該參數(shù)會(huì)在Map
內(nèi)部劃分一些分區(qū)。在put
操作的時(shí)候只有只有更新的分區(qū)是鎖住的。這種Map
不是代替HashMap
的線程安全版本——任何 get-then-put
的操作都需要在外部進(jìn)行同步。ConcurrentNavigableMap
實(shí)現(xiàn)。本質(zhì)上這種集合可以當(dāng)做一種TreeMap
的線程安全版本來(lái)使用。ConcurrentSkipListMap
來(lái)存儲(chǔ)的線程安全的Set
。CopyOnWriteArrayList
來(lái)存儲(chǔ)的線程安全的Set
。Objects
類不同)。如果想要了解更多關(guān)于Java集合的知識(shí),推薦閱讀以下書(shū)籍:
單線程 | 并發(fā) | |
Lists |
|
|
Queues / deques |
|
|
Maps |
|
|
Sets |
|
|
聯(lián)系客服