基因数据处理116之重新运行SparkBWA Yarn集群模式

其他 2018-09-02 22:42:01 阅读次数: 0

版权声明：本文为博主原创文章，欢迎转载和交流！源码交流：https://github.com/xubo245/ https://blog.csdn.net/bob601450868/article/details/80553038

更多代码请见：https://github.com/xubo245

基因数据处理系列

1.解释

很久没运行SparkBWA了，系统文件有点多，重新运行。

2.代码：

end
hadoop@Master:~/disk2/xubo/project/alignment/sparkBWA$ vi g38L100c100000Nhs20Paired12SparkBWAYarnPartition0.sh 

echo "start"
startTime4=`date +"%s.%N"`
        time4=`date +"%Y%m%d%H%M%S"`
         #spark-submit --class org.apache.spark.examples.SparkPi     --master spark://219.219.220.149:7077     /home/hadoop/cloud/spark-1.5.2/lib/spark-examples*.jar     $i

echo $startTime4
j=0
output2='/xubo/project/alignment/sparkBWA/output/AAg38L100c100000Nhs20Paired12SparkBWAYarnPartition0shell'$j



spark-submit --class SparkBWA \
--master yarn-client \
--executor-memory 7G \
--conf "spark.executor.extraJavaOptions=-Djava.library.path=/home/hadoop/disk2/xubo/tools/SparkBWA/build" \
SparkBWA.jar \
-algorithm mem -reads paired \
-index /home/hadoop/disk2/xubo/ref/GRCH38L1Index/GRCH38chr1L3556522.fasta \
-partitions $j \
/xubo/project/alignment/sparkBWA/input/g38/g38L100c100000Nhs20Paired1.fastq /xubo/project/alignment/sparkBWA/input/g38/g38L100c100000Nhs20Paired2.fastq \
$output2

        endTime4=`date +"%s.%N"`
   echo $k"=>"`awk -v x1="$(echo $endTime4 | cut -d '.' -f 1)" -v x2="$(echo $startTime4 | cut -d '.' -f 1)" -v y1="$[$(echo $endTime4 | cut -d '.' -f 2) / 1000]" -v y2="$[$(echo $startTime4 | cut -d '.' -f 2) /1000]"  'BEGIN{printf " g38L100c10000000Nhs20Paired12SparkBWAYarnPartition0 RunTime:%.6f s",(x1-x2)+(y1-y2)/1000000}'`

echo "end"

3.结果：

3.1 terminal

hadoop@Master:~/disk2/xubo/project/alignment/sparkBWA$ ./g38L100c100000Nhs20Paired12SparkBWAYarnPartition0.sh 
start
1479306305.415351298
=> g38L100c10000000Nhs20Paired12SparkBWAYarnPartition0 RunTime:98.942027 s
end

3.2 文件

参考

【1】https://github.com/xubo245
【4】http://blog.csdn.net/xubo245/

猜你喜欢

转载自blog.csdn.net/bob601450868/article/details/80553038

基因数据处理116之重新运行SparkBWA Yarn集群模式

基因数据处理117之重新多次运行SparkBWA Yarn集群

基因数据处理115之重新运行SparkBWA本地模式

Spark运行模式_基于YARN的Resource Manager的Custer模式（集群）

Spark运行模式_基于YARN的Resource Manager的Client模式（集群）

基因数据处理113之对avocado识别的SparkBWA变异数据进行疾病分析_

大数据教程（9.3）MR运行在yarn集群流程分析&&本地模式调试MR程序_

基因数据处理118之SSW运行

Flink 集群运行原理兼部署及Yarn运行模式深入剖析-Flink牛刀小试

Flink 集群运行原理兼部署及Yarn运行模式深入剖析

Spark On Yarn 运行模式

Mapreduce提交YARN集群运行

Spark运行模式之Yarn模式

Spark运行模式之Yarn模式详解

Flink 1.17教程：集群搭建、运行模式（standalone/yarn/k8s）及历史服务器

Apache Spark on yarn集群模式

flinkx 部署，on yarn模式运行

基因数据处理120之scala调用SSW在linux下运行

基因数据处理119之java调用SSW在linux下运行

Spark之Yarn提交模式

Spark运行模式之Spark on Yarn

Hadoop 集群之HDFS HA、Yarn HA

大数据学习——yarn集群启动

YARN回顾（七）——Spark在YARN上的运行模式

【Hadoop】YARN 原理、MR本地&YARN运行模式

Spark 在YARN上运行，以集群模式启动Spark应用程序：spark-submit --class org.apache.spark.examples.SparkPi \ 。。。如何查看结果？

Hadoop大数据平台实战(05)：深入Spark Cluster集群模式YARN vs Mesos vs Standalone vs K8s

Spark三大运行模式之Yarn 模式

Spark环境搭建——on yarn集群模式

Spark环境搭建④ on yarn集群模式

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)