寫在前面:為什么要用ElasticSearch?
我們的應(yīng)用經(jīng)常需要添加檢索功能,開源的Elastic Search是目前全文檢索引擎的首選。它可以快速的存儲、搜索和分析海量數(shù)據(jù)。ElasticSearch是一個分布式搜索框架,提供RestfulAPI,底層基于Lucene,采用多shard(分片)的方式保證數(shù)據(jù)安全,并且提供自動resharding的功能。
Elasticsearch: 權(quán)威指南(中文):
https://www.elastic.co/guide/cn/elasticsearch/guide/current/index.html
在centos窗口中,執(zhí)行如下命令:
docker pull elasticsearch:5.6.8
當(dāng)前ES鏡像版本信息:
{
"name" : "WlwFyqU",
"cluster_name" : "elasticsearch",
"cluster_uuid" : "78UDZtviQqiWmzmenGpSrQ",
"version" : {
"number" : "5.6.8",
"build_hash" : "cfe3d9f",
"build_date" : "2018-09-10T20:12:43.732Z",
"build_snapshot" : false,
"lucene_version" : "6.6.1"
},
"tagline" : "You Know, for Search"
}
在centos窗口中,執(zhí)行如下操作:
[root@localhost soft]# pwd
/home/soft
[root@localhost soft]# mkdir -p ES/config
[root@localhost soft]# cd ES
[root@localhost ES]# mkdir data1
[root@localhost ES]# mkdir data2
[root@localhost ES]# mkdir data3
[root@localhost ES]# cd ES/config/
[root@localhost ES]# firewall-cmd --add-port=9300/tcp
success
[root@localhost ES]# firewall-cmd --add-port=9301/tcp
success
[root@localhost ES]# firewall-cmd --add-port=9302/tcp
success
注:如果ELK選的6.X版本的,那么讀者需將data1 data2 data3 開啟777權(quán)限=> chmod 777 data1 data2 data3
在centos窗口中,使用vim命令分別創(chuàng)建如下文件:es1.yml,es2.yml,es3.yml
es1.yml
cluster.name: elasticsearch-cluster
node.name: es-node1
network.bind_host: 0.0.0.0
network.publish_host: 192.168.9.219
http.port: 9200
transport.tcp.port: 9300
http.cors.enabled: true
http.cors.allow-origin: "*"
node.master: true
node.data: true
discovery.zen.ping.unicast.hosts: ["192.168.9.219:9300","192.168.9.219:9301","192.168.9.219:9302"]
discovery.zen.minimum_master_nodes: 2
es2.yml
cluster.name: elasticsearch-cluster
node.name: es-node2
network.bind_host: 0.0.0.0
network.publish_host: 192.168.9.219
http.port: 9201
transport.tcp.port: 9301
http.cors.enabled: true
http.cors.allow-origin: "*"
node.master: true
node.data: true
discovery.zen.ping.unicast.hosts: ["192.168.9.219:9300","192.168.9.219:9301","192.168.9.219:9302"]
discovery.zen.minimum_master_nodes: 2
es3.yml
cluster.name: elasticsearch-cluster
node.name: es-node3
network.bind_host: 0.0.0.0
network.publish_host: 192.168.9.219
http.port: 9202
transport.tcp.port: 9302
http.cors.enabled: true
http.cors.allow-origin: "*"
node.master: true
node.data: true
discovery.zen.ping.unicast.hosts: ["192.168.9.219:9300","192.168.9.219:9301","192.168.9.219:9302"]
discovery.zen.minimum_master_nodes: 2
注:本機虛擬機ip:192.168.9.219 讀者請自行更改
在centos窗口中,修改配置sysctl.conf
vim /etc/sysctl.conf
加入如下內(nèi)容:
vm.max_map_count=262144
啟用配置:
sysctl -p
注:這一步是為了防止啟動容器時,報出如下錯誤:
bootstrap checks failed max virtual memory areas vm.max_map_count [65530] likely too low, increase to at least [262144]
啟動ElasticSearch集群容器
在centos窗口中,執(zhí)行如下命令:
docker run -e ES_JAVA_OPTS="-Xms256m -Xmx256m" -d -p 9200:9200 -p 9300:9300 -v /home/soft/ES/config/es1.yml:/usr/share/elasticsearch/config/elasticsearch.yml -v /home/soft/ES/data1:/usr/share/elasticsearch/data --name ES01 elasticsearch:5.6.8
docker run -e ES_JAVA_OPTS="-Xms256m -Xmx256m" -d -p 9201:9201 -p 9301:9301 -v /home/soft/ES/config/es2.yml:/usr/share/elasticsearch/config/elasticsearch.yml -v /home/soft/ES/data2:/usr/share/elasticsearch/data --name ES02 elasticsearch:5.6.8
docker run -e ES_JAVA_OPTS="-Xms256m -Xmx256m" -d -p 9202:9202 -p 9302:9302 -v /home/soft/ES/config/es3.yml:/usr/share/elasticsearch/config/elasticsearch.yml -v /home/soft/ES/data3:/usr/share/elasticsearch/data --name ES03 elasticsearch:5.6.8
注:設(shè)置
-e ES_JAVA_OPTS="-Xms256m -Xmx256m"
是因為/etc/elasticsearch/jvm.options
默認(rèn)jvm最大最小內(nèi)存是2G,讀者啟動容器后 可用docker stats
命令查看
http://192.168.9.219:9200/_cat/nodes?pretty
查看節(jié)點狀態(tài)注:節(jié)點名稱帶表示為主節(jié)點*
docker pull mobz/elasticsearch-head:5
docker run -d -p 9100:9100 --name es-manager mobz/elasticsearch-head:5
寫在最后,這里要多提一點索引分片設(shè)置以及副本,官方推薦設(shè)置,讀者根據(jù)自身需要進行修改:
curl -XPUT 'http://localhost:9200/_all/_settings?preserve_existing=true’ -d '{undefined
“index.number_of_replicas” : “1”,
“index.number_of_shards” : “10”
}’
docker stats $(docker ps --format={{.Names}})
docker logs 容器名/容器ID
cluster.name: elasticsearch-cluster
node.name: es-node1
#index.number_of_shards: 2
#index.number_of_replicas: 1
network.bind_host: 0.0.0.0
network.publish_host: 192.168.9.219
http.port: 9200
transport.tcp.port: 9300
http.cors.enabled: true
http.cors.allow-origin: "*"
node.master: true
node.data: true
discovery.zen.ping.unicast.hosts: ["es-node1:9300","es-node2:9301","es-node3:9302"]
discovery.zen.minimum_master_nodes: 2
注:
cluster.name
:用于唯一標(biāo)識一個集群,不同的集群,其 cluster.name 不同,集群名字相同的所有節(jié)點自動組成一個集群。如果不配置改屬性,默認(rèn)值是:elasticsearch。
node.name
:節(jié)點名,默認(rèn)隨機指定一個name列表中名字。集群中node名字不能重復(fù)
index.number_of_shards
: 默認(rèn)的配置是把索引分為5個分片
index.number_of_replicas
:設(shè)置每個index的默認(rèn)的冗余備份的分片數(shù),默認(rèn)是1
通過 index.number_of_shards,index.number_of_replicas默認(rèn)設(shè)置索引將分為5個分片,每個分片1個副本,共10個結(jié)點。
禁用索引的分布式特性,使索引只創(chuàng)建在本地主機上:
但隨著版本的升級 將不在配置文件中配置而實啟動ES后,再進行配置
bootstrap.memory_lock
: true 當(dāng)JVM做分頁切換(swapping)時,ElasticSearch執(zhí)行的效率會降低,推薦把ES_MIN_MEM和ES_MAX_MEM兩個環(huán)境變量設(shè)置成同一個值,并且保證機器有足夠的物理內(nèi)存分配給ES,同時允許ElasticSearch進程鎖住內(nèi)存
network.bind_host
: 設(shè)置可以訪問的ip,可以是ipv4或ipv6的,默認(rèn)為0.0.0.0,這里全部設(shè)置通過
network.publish_host
:設(shè)置其它結(jié)點和該結(jié)點交互的ip地址,如果不設(shè)置它會自動判斷,值必須是個真實的ip地址
同時設(shè)置bind_host
和publish_host
兩個參數(shù)可以替換成network.host
network.bind_host: 192.168.9.219
network.publish_host: 192.168.9.219
=>network.host: 192.168.9.219
http.port
:設(shè)置對外服務(wù)的http端口,默認(rèn)為9200
transport.tcp.port
: 設(shè)置節(jié)點之間交互的tcp端口,默認(rèn)是9300
http.cors.enabled
: 是否允許跨域REST請求
http.cors.allow-origin
: 允許 REST 請求來自何處
node.master
: true 配置該結(jié)點有資格被選舉為主結(jié)點(候選主結(jié)點),用于處理請求和管理集群。如果結(jié)點沒有資格成為主結(jié)點,那么該結(jié)點永遠不可能成為主結(jié)點;如果結(jié)點有資格成為主結(jié)點,只有在被其他候選主結(jié)點認(rèn)可和被選舉為主結(jié)點之后,才真正成為主結(jié)點。
node.data
: true 配置該結(jié)點是數(shù)據(jù)結(jié)點,用于保存數(shù)據(jù),執(zhí)行數(shù)據(jù)相關(guān)的操作(CRUD,Aggregation);
discovery.zen.minimum_master_nodes
: //自動發(fā)現(xiàn)master節(jié)點的最小數(shù),如果這個集群中配置進來的master節(jié)點少于這個數(shù)目,es的日志會一直報master節(jié)點數(shù)目不足。(默認(rèn)為1)為了避免腦裂,個數(shù)請遵從該公式 => (totalnumber of master-eligible nodes / 2 + 1)。* 腦裂是指在主備切換時,由于切換不徹底或其他原因,導(dǎo)致客戶端和Slave誤以為出現(xiàn)兩個active master,最終使得整個集群處于混亂狀態(tài)*
discovery.zen.ping.unicast.hosts
:集群個節(jié)點IP地址,也可以使用es-node等名稱,需要各節(jié)點能夠解析
-End-