Bboss is a good elasticsearch Java rest client. It operates and accesses elasticsearch in a way similar to mybatis.
BBoss Environmental requirements
JDK requirement: JDK 1.8
Elasticsearch version requirements: 1.x,2.X,5.X,6.X,7.x,8.x,
Spring booter 1.x,2.x,
Spring boot环境配置和maven坐标导入,可以参考文档:
https://esdoc.bbossgroups.com/#/usedatatran-in-spring-boot
Elasticsearch-Elasticsearch 数据同步工具demo
使用本demo所带的应用程序运行容器环境,可以快速编写,打包发布可运行的数据导入工具 包含两个现成的示例:
带条件的增量同步
org.frameworkset.elasticsearch.imp.ES2ESScrollTimestampDemo
不带条件的一次性全量同步
org.frameworkset.elasticsearch.imp.ES2ESScrollAllTimestampDemo
支持的数据库:
Elasticsearch 到elasticsearch数据同步 Elasticsearch 到数据库数据同步
支持的Elasticsearch版本:
1.x,2.x,5.x,6.x,7.x,8.x,
支持海量PB级数据同步导入功能
使用参考文档
导入maven坐标
<dependency> <groupId>com.bbossgroups.plugins</groupId> <artifactId>bboss-datatran-jdbc</artifactId> <version>7.0.3</version> <scope>compile</scope> </dependency>
构建部署
准备工作
需要通过gradle构建发布版本,gradle安装配置参考文档:
https://esdoc.bbossgroups.com/#/bboss-build
下载源码工程-基于gradle
https://github.com/bbossgroups/elasticsearch-elasticsearch
从上面的地址下载源码工程,然后导入idea或者eclipse,根据自己的需求,修改导入程序逻辑
org.frameworkset.elasticsearch.imp.ES2ESScrollTimestampDemo
如果需要测试和调试导入功能,运行ES2ESScrollTimestampDemo的main方法即可即可:
public class Dbdemo { public static void main(String[] args){ ES2ESScrollTimestampDemo dbdemo = new ES2ESScrollTimestampDemo(); boolean dropIndice = true;//CommonLauncher.getBooleanAttribute("dropIndice",false);//同时指定了默认值 dbdemo.scheduleTimestampImportData(dropIndice); } ..... }
修改es配置-elasticsearch-elasticsearch\src\main\resources\application.properties
修改完毕配置后,就可以进行功能调试了。
测试调试通过后,就可以构建发布可运行的版本了:进入命令行模式,在源码工程根目录Elasticsearch-Elasticsearch下运行以下gradle指令打包发布版本
release.bat
运行作业
gradle构建成功后,在build/distributions目录下会生成可以运行的zip包,解压运行导入程序
linux:
chmod x restart.sh
./restart.sh
windows: restart.bat
作业jvm配置
修改jvm.options,设置内存大小和其他jvm参数
-Xms1g
-Xmx1g
作业参数配置
在使用elasticsearch-elasticsearch时,为了避免调试过程中不断打包发布数据同步工具,可以将部分控制参数配置到启动配置文件resources/application.properties中,然后在代码中通过以下方法获取配置的参数:
#工具主程序 mainclass=org.frameworkset.elasticsearch.imp.ES2ESScrollTimestampDemo # 参数配置 # 在代码中获取方法:CommonLauncher.getBooleanAttribute("dropIndice",false);//同时指定了默认值false dropIndice=false
在代码中获取参数dropIndice方法:
boolean dropIndice = CommonLauncher.getBooleanAttribute("dropIndice",false);//同时指定了默认值false
另外可以在resources/application.properties配置控制作业执行的一些参数,例如工作线程数,等待队列数,批处理size等等:
queueSize=50 workThreads=10 batchSize=20
在作业执行方法中获取并使用上述参数:
int batchSize = CommonLauncher.getIntProperty("batchSize",10);//同时指定了默认值 int queueSize = CommonLauncher.getIntProperty("queueSize",50);//同时指定了默认值 int workThreads = CommonLauncher.getIntProperty("workThreads",10);//同时指定了默认值 importBuilder.setBatchSize(batchSize); importBuilder.setQueue(queueSize);//设置批量导入线程池等待队列长度 importBuilder.setThreadCount(workThreads);//设置批量导入线程池工作线程数量