[教程]揭秘Java操作Elasticsearch：轻松高效添加海量数据攻略

发布于 2025-06-20 15:30:32

引言Elasticsearch 是一个基于 Lucene 构建的分布式搜索引擎，广泛应用于各种搜索需求，包括全文搜索、结构化搜索和数据分析等。在 Java 应用中，通过操作 Elasticsearch...

引言

Elasticsearch 是一个基于 Lucene 构建的分布式搜索引擎，广泛应用于各种搜索需求，包括全文搜索、结构化搜索和数据分析等。在 Java 应用中，通过操作 Elasticsearch 可以实现高效的数据存储和检索。本文将详细介绍如何在 Java 中操作 Elasticsearch，以实现轻松高效地添加海量数据。

准备工作

在开始之前，请确保已经完成以下准备工作：

安装 Elasticsearch：从官网下载并安装 Elasticsearch。
启动 Elasticsearch：启动 Elasticsearch 服务。
安装 Java 客户端库：使用 Maven 或 Gradle 安装 Elasticsearch 的 Java 客户端库。


 org.elasticsearch.client elasticsearch-rest-high-level-client 7.9.3

连接到 Elasticsearch

首先，需要创建一个客户端来连接到 Elasticsearch 集群。以下是一个简单的示例：

import org.elasticsearch.client.RestClient;
import org.elasticsearch.client.RestHighLevelClient;
public class ElasticsearchClientExample { public static void main(String[] args) { try (RestHighLevelClient client = new RestHighLevelClient( RestClient.builder("http://localhost:9200"))) { // 客户端代码 } }
}

添加数据

在 Elasticsearch 中，可以通过 IndexRequest 和 IndexResponse 来添加数据。以下是一个添加数据的示例：

import org.elasticsearch.client.RequestOptions;
import org.elasticsearch.client.RestHighLevelClient;
import org.elasticsearch.client.index.IndexRequest;
import org.elasticsearch.client.index.IndexResponse;
import org.elasticsearch.index.query.QueryBuilders;
import org.elasticsearch.action.search.SearchRequest;
import org.elasticsearch.action.search.SearchResponse;
import java.io.IOException;
public class AddDataExample { public static void main(String[] args) { try (RestHighLevelClient client = new RestHighLevelClient( RestClient.builder("http://localhost:9200"))) { IndexRequest indexRequest = new IndexRequest("test-index") .source("{\"name\":\"John\", \"age\":30, \"city\":\"New York\"}"); IndexResponse indexResponse = client.index(indexRequest, RequestOptions.DEFAULT); System.out.println("Indexing response: " + indexResponse.status()); } catch (IOException e) { e.printStackTrace(); } }
}

批量添加数据

对于海量数据的添加，可以使用 BulkRequest 和 BulkResponse 来实现。以下是一个批量添加数据的示例：

import org.elasticsearch.client.RequestOptions;
import org.elasticsearch.client.RestHighLevelClient;
import org.elasticsearch.client.core.CountRequest;
import org.elasticsearch.client.core.CountResponse;
import org.elasticsearch.client.indices.GetIndexRequest;
import org.elasticsearch.client.indices.GetIndexResponse;
import java.io.IOException;
import java.util.concurrent.TimeUnit;
public class BulkAddDataExample { public static void main(String[] args) { try (RestHighLevelClient client = new RestHighLevelClient( RestClient.builder("http://localhost:9200"))) { BulkRequest bulkRequest = new BulkRequest(); bulkRequest.add(new IndexRequest("test-index") .source("{\"name\":\"John\", \"age\":30, \"city\":\"New York\"}")); bulkRequest.add(new IndexRequest("test-index") .source("{\"name\":\"Jane\", \"age\":25, \"city\":\"Los Angeles\"}")); // 添加更多数据... BulkResponse bulkResponse = client.bulk(bulkRequest, RequestOptions.DEFAULT); System.out.println("Bulk indexing response: " + bulkResponse.status()); } catch (IOException e) { e.printStackTrace(); } }
}