谷粒学院(五)---Maven从入门到入魔

前言

我们在日常的javaee项目开发中,对于大量模块的开发管理和jar包的管理,我们难免会设计到maven进行项目的管理,这里我总结Maven中比较重要的一些知识点,这也是我在最近学习的项目谷粒学院中所感觉到Maven的使用重要性,所以我就对maven中的一些比较重要的知识点记性总结,希望可以为正在学习的小伙伴提供一些帮助。
“最后希望小伙伴留下小小的爱心”

  1. 导言

在我们的生产环境中,开发不再是一个项目一个工程,而是每一个模块创建一个工程,而多个模块整合在一起就需要使用Maven这样的构建工具。

  1. 我们真的需要Maven吗?

真的需要Maven吗?相信小伙伴在学习Maven的时候可能会问自己这个问题,Maven是干什么用的?为什么这里我们需要用到Maven?不用Maven我们会有什么麻烦?之所以会提出这个问题是因为我们即使不使用Maven我们任然可以进行B/S结构项目的开发。只是比较麻烦而已,就像我们旅游?不一定非要坐飞机,我们坐火车也可以去,只是时间效率不同而已。

从表述层、业务逻辑层到持久层再到数据库都有成熟的解决方案—不使用Maven我们一样也可以进行项目的开发。

图片

这里可能我们的思想会有一个误区,Maven并不是直接用来辅助编码的,他战斗的岗位并不是以上各层。所以我们有必要通过企业开发中的实际需求来看看那些方面是我们现有技术的不足。

2.2 归其原因,为什么要用Maven?

Maven能够帮助我们提高开发效率,但是他能帮我们解决什么问题呢?

①:帮助我们添加第三方jar包

         在我们今天企业的javaee开发领域中,有大量的第三方框架和工具可以供我们使用,要使用这些jar包最简单的方法就是复制粘贴到我们web工程下的WEB-INF/lib目录下。但是这会导致每次创建一个新的工程就需要将jar包重复复制到lib目录下,从而会造成我们的工作区间存在大量的重复文件,让我们的工程会显得很臃肿。

          而使用Maven后每个jar包本身值在本地创库中保存一份,需要jar包的工程只需要一坐标的方式简单的引用一下就可以了。不仅极大的节约了存储空间,让项目更加轻巧,更加避免了重复文件太多而造成的混乱。

②: jar包之间的依赖关系

          我们在开发工程的时候需要用的别的jar包,简而言之那别人在开发的时候也有可能需要使用到别的jar包,所以以此类推就会出现一种情况就是jar包依赖的情况。也及时我们的jar包不是孤立存在的,很多jar包都需要在其他jar包的支持下才能够正常工作,我们称之为jar包之间的依赖关系。其中比较典型的就是我们的文件上传操作,我们在使用commons-fileupload-1.3.jar 就依赖于 commons-io-2.0.1.jar,如果没有后面的包,我们的文件上传功能也就无法实现。

           那么问题来了,你知道你所使用的所有jar包依赖哪些包吗?当你拿到一个新的从未使用过jar包,你如何得知他需要那些jar包的支持?如果不了解情况的话,导入的jar包不够,那么现有的程序还是不能够正常运行。再进一步,当你的项目中需要用到上百的个jar包时,你还会人为的,手工的逐一确认他们一来的其他jar包吗?这简直就是一笔大工程。

           而引入Maven后,Maven就可以替我们自动的将当前jar包所依赖的其他所有jar包全部导入过来,无需人工参与,节约了我们大量的时间和精力。用实际的例子来说明就是:通过Maven导入commons-fileupload-1.3.jar 后,,commons-io-2.0.1.jar 会被自动导入,程序员不必了解这个依赖关系。

           下图就是spring所需jar包的部分依赖关系

图片

③:获取第三方jar包

扫描二维码关注公众号,回复: 12263347 查看本文章
          在javaee的开发中需要使用jar包种类繁多,几乎每个jar包在其本身的官网上获取方式都不尽相同。为了查找一个jar包我们需要找遍互联网,身心俱疲,没有经历过的人或许体会不到这种折磨。不仅如此,费劲心力找的jar包里有的时候并没有你需要的那个类,又或许有你要的类又没有你要的方法---以不规范的方式获取的jar包往往也是不规范的。

        使用maven我们可以享受到一个完全同意规范的jar包管理体系。你只需要在你的项目已坐标的方式依赖一个jar包,Maven就会自动从中央仓库进行下载,并同下载这个jar包所依赖的其他所有jar包------规范、完整、准确、一次性解决所有问题!

PS:在这里我们顺便说一下,统一的规范可以说成是程序员的最高信仰。如果没有一个统一的规范,就会意味着每个具体的技术都各自为政,需要以诸多不同的特殊方式加入到我们的项目中;好不容易加入进来还会和其他技术格格不入,最终受苦的还是我们开发人员。而任何一个领域的统一规范都能够极大的降低程序员的工作难度,减少工作量。例如:USB接口可以外接各种设备,如果每个设备都有自己独特的接口,那么不仅制造商需要维护各个接口的设计方案,使用者也需要了解每个设备对应的接口,无疑是非常繁琐的。

④:将项目拆分成多个工程模块

     随着javaee项目的规模越来越大,开发团队的规模也与日俱增,一个项目上千人的团队持续开发很多对于javaee项目来说是再正常不过了。如果几百人上千人的开发项目是同一个web工程。那么架构师、项目经理该如何划分项目的模块、如何进行分工呢?这么大的项目已经不可能通过package结构来划分模块,必须将项目拆分成多个工程协同开发。多个模块工程中有的是java项目,有的是web项目。

     那么工程拆分后又该如何进行项目调和访问呢?这就需要用到maven的依赖管理机制。大家可以看一下survey调查项目的拆分情况。

图片

3 . Maven核心讲解

3.1 maven简介

       Maven是Apache软件基金会组织维护的一款自动化构建工具,专注服务于java平台的项目构建和项目依赖管理。Maven这个单词的本意是:“专家,内行”。

图片

3.2 什么是构建

        构建并不是创建,创建一个工程并不等于构建一个项目。要了解构建的含义我们应该由浅入深的从以下三个层面来看:

①:纯Java代码

     小伙伴都知道,我们Java是一门编译型语言,纯Java扩展名的源文件需要编译成。class扩展名的字节码文件才能够执行。所以编写任何Java代码想要执行的话就必须编译成对应的.class文件

②:web工程

      当我们需要通过浏览器访问java程序时就必须将包含java程序的web工程编译的结果“拿”到服务器上的指定目录下,并启动服务器才行。这个“拿”的工程我们叫部署。

     我们可以将未编译的web工程比喻成一只生的鸡,编译好的web工程是一只煮熟的鸡,编译部署的过程就是将鸡煮熟的过程。

  web工程和其编译结果的目录结构对比见下图:

图片

③:实际项目

       在实际项目中整合第三方框架,web工程中除了Java程序和jsp页面、图片等静态资源之外,还包括第三方框架的jar包以及各种各样的配置文件。所有这些资源都必须按照正确的目录结构部署到服务器上,项目才可以运行。

       所以综上所述:构建就是以我们编写的java代码、框架配置文件、国家化等其他资源文件、jsp页面和图片等静态资源作为“原材料”,去“生产”一个可以运行的项目的过程。

     那么项目的构建过程包含哪些环节呢?

3.3 构建过程的几个主要环节

  • 清理:删除以前的编译结果,为重新编译做好准备
  • 编译:将Java源程序编译成可执行的字节码文件。
  • 测试:针对项目中的关键点进行测试,确保项目在迭代开发过程中关键点的正确性。
  • 报告:在每一次测试后以标准的格式记录和展示测试结果
  • 打包:将一个包含诸多文件的工程封装为一个压缩文件用于安装或部署。java工程对应的jar包,web工程对应的war包
  • 安装:在Maven环境下特指将打包的结果—jar包或war包安装到本地仓库中
  • 部署:将打包的结果部署到远程仓库或将war包部署到服务器上运行。

3.4 自动化构建

其实上述环节我们在eclipse中都可以找到对应的操作,只是不太标准。那么既然ide以及可以进行构建了,我们为什么还要使用Maven这样的构建工具呢?我们来看一个小故事:

  这是阳光明媚的一天,托马斯像往常一样早早的来到公司,冲好了一杯咖啡,进入自己的邮箱---很不幸,QA小姐发来了一封邮件,报告了他昨天提交的模块测试结果--有bug。“好吧,反正也不是第一次”,托马斯摇摇头,进入IDE,运行自己的程序,编译打包。部署到服务器上,然后按照邮件中的操作路径进行测试。“嗯,没错,这个地方确实有问题”,托马斯说道。于是托马斯开始尝试修复这个bug,当他差不多有眉目的时候已经到了午饭的时间。
  下午继续工作,bug很快就被修正了,接着托马斯对模块重新进行了编译,打包、部署、测试之后确认没有问题了,回复了QA小姐的邮件。
  一天就这样过去了,明媚的阳光化作了美丽的晚霞,托马斯却觉得生活并不像晚霞那样美好。

让我们来梳理一下托马斯这一天中的工作内容
图片

从中我们可以发现,托马斯的很大一部分时间都发在“编译、打包、部署、测试”,这些程式化的工作上面,而真正需要由“人”的智慧实现的分析问题和编码却只占了很少的一部分。

图片

能否将这些程式化的工作直接交给机器自动完成呢?----当然可以!这就是自动化构建

图片

此时Maven的意义就体现出来了,他可以自动的从构建过程的起点一直执行到终点:

图片

3.5 Maven核心概念

        Maven能够实现自动化构建是和它的内部原理分不开的,这里我们从maven的九个核心概念入手,看看Maven是如何实现自动化构建的
  • POM
  • 约定的目录结构
  • 坐标
  • 依赖管理
  • 仓库管理
  • 生命周期
  • 插件和目标
  • 继承
  • 聚合

4 HOW

      Maven的核心程序中仅仅定义了抽象的生命周期,而具体的操作则是由Maven的插件来完成的,可是Maven的插件并不包含在Maven的核心程序中,在首次使用时需要联网下载。

5 Maven核心概念

5.1 POM

        Project Object Model:项目对象模型。将Java工程的相关信息封装为对象作为便于操作和管理的模型,Maven工程的核心配置,可以说是学习maven就是学习pom.xml文件中的配置。

5.2 约定的目录结构

约定的目录结构对于maven实现自动化构建而言是必不可少的一环,就拿自动化编译来说,maven必须能找到java源文件,下一步才能编译,而编译之后也必须有一个准确的位置保持编译得到的字节码文件。我们在开发中如果需要让第三方工具或框架知道我们自己创建的资源在哪,那么基本上就是两种方式:

①:通过配置的形式明确告诉它

②:基于第三方工具或框架的约定

maven对于工程目录结构的要求就属于后面的一种。

图片

 现在javaee开发领域普遍认同同一个观点:约定>配置>编码。意思就是能用配置解决的问题就不编码,能基于约定的就不进行配置。而Maven正是因为指定了特定文件保存的目录才能够对我们的java工程进行自动化构建。

5.3 坐标

①:几何中的坐标

  • 在一个平面中使用x,y两个向量可以唯一的确定平面中的一个点。
  • 在空间中使用x,y,z三个向量可以唯一的确定空间中的一个点

②:maven的坐标

使用如下三个向量在maven的仓库中唯一的确定一个Maven工程

  • groupid:公司或组织的域名倒序+当前项目名称
  • artifactld:当前项目的模块名称
  • version:当前模块的版本

图片

③:如何通过坐标到仓库中查找对应的jar包?

  • 将gav三个向量连起来

图片

  • 已连起来的字符串作为目录结构到仓库中查找

图片

5.4 依赖

  maven中最关键的部分,我们使用Maven最重要的就是使用他的依赖管理功能。要理解和掌握Maven的依赖管理,我们只需要解决一个  

      ①:依赖的目的是什么?

当A jar包用到了B jar包中的某些类时,A就对B产生了依赖,这是概念上的描述。那么如何在项目中一依赖的方式引入一个我们需要的jar包呢?

  答案非常简单,就是使用depenency标签指定被依赖包的坐标就可以了。

图片

        ②:依赖的范围

大家注意到上面的依赖信息中除了目标jar包的坐标以外还有一个scope设置,这是依赖的范围。依赖的范围有几个可选值,我们用得到的是:complie、test、provided三个。

图片

结合具体的例子:对于helloFriend来说,hello 就是服务于主程序的,junit就是服务于测试程序的。helloFriend 主程序需要hello 是非常明显的,测试程序由于要调用主程序所以也需要hello,所以complie范围依赖对于主程序和测试程序都应该有效。

  • 从开发和运行这两个不同阶段理解complie和provided的区别

图片

     ③:有效性总结

图片

    ④:依赖的传递性

A依赖B,B依赖C,A能否使用C呢?那么我们就要看B依赖C的范围是不是complie,否则不可用。

图片

    依赖的排出

如果我们在当前工程中引入了一个依赖是A,而A又依赖了B,那么Maven会自动将A依赖的B引入当前工程,但是个别情况下B有可能是一个不稳定版本,或对当前工程有不良影响。这是我么可以在引用A的时候将B排除。

  • 情景举例

图片

  • 配置方式

图片

  • 排除后的效果

图片

5.5 统一管理所依赖jar包的版本

对同一个框架的一组jar包最好使用相同的版本。为了方便升级框架,可用将jar包的版本信息统一提取出来

  • 统一声明版本号

图片

其中atguigu.spring.version不是是自定义标签

  • 引用前面声明的版本号

图片

图片

  • 其他用法

图片

5.5 仓库

①:分类

    本地仓库:为当前本机电脑上的所有Maven工程服务

     远程仓库:私服:架构在当前局域网环境下,为当前局域网范围内的所有Maven工程服务。

图片

中央仓库:架构在internet上,为全世界所有的Maven工程服务

中央仓库的镜像:架设在各大洲,为中央仓库分担流量。减轻中央仓库的压力,同时更快的响应用户的请求。

②:仓库中的文件

    maven的插件

    我们自己开发的项目的模块

    第三方框架或工具的jar包

不管是什么样的jar包,在仓库中都是按照坐标生成目录结构,所以可以通过统一的方式查询依赖。

5.6 生命周期

①:什么是Maven的什么周期?

  • Maven生命周期定义了各个构建环节的执行顺序,有了这个清单,Maven就可以自动化的执行构建命令了。

  • Maven有三套相互独立的生命周期,分别是:

      ①:clean  Lifecycle 在进行真正构建之前进行一些清理工作
    
      ②:Default Lifecycle 构建的核心部分,编译,测试,打包,安装,部署等等
    
      ③:site  Lifecycle 生成报告,站点,发布站点
    

他们是相互独立,你可以仅仅调用clean来清理工作目录,仅仅调用site来生成站点。当然也可以直接运行mvn clean install site 运行所有这三套什么周期。

每套生命周期都由一组阶段组成,我们平时在命令行输入的命令总会对应一个特定的阶段。比如,运行mvn clean,这个clean是clean生命周期,也有clean阶段。

②:clean什么周期

  clean生命周期一共包含三个阶段:

  ①:pre-clean 执行一些需要在clean之前完成的工作

  ②:clean 移除所有上一次构建生成的文件

  ③:post-clean执行一些需要在clean之后立刻生成的工作

③:site生命周期

   ①:pre-site 执行一些需要在生成站点文档之前完成的工作

   ②:site 生成项目的站点文档

   ③:post-site  执行一些需要在生成站点文档之后完成的工作,并且为部署做准备

   ④:site-deploy将生成的站点文档部署到特定的服务器上

这里经常用到的是site阶段和site-deploy阶段,用以生成和发布Maven站点,这可是maven相当大的功能,manager比较喜欢,文档及统计数据自动生成很好看。

④:Default生命周期

 Default生命周期是maven生命周期中最重要的一个,绝大部分工作都发生在这个生命周期中,这里,只解释一些比较重要和常用的阶段:

validate

generate-sources

process-sources

generate-resources

process-resources 复制并处理资源文件,至目标目录,准备打包。

compile 编译项目的源代码

process-classes

generate-test-sources

process-test-sources

generate-test-resources

process-test-resources 复制并处理资源文件,至目标测试目录。

test-compile 编译测试源代码。

process-test-classes

test 使用合适的单元测试框架运行测试。这些测试代码不会被打包或部署。

prepare-package

package 接受编译好的代码,打包成可发布的格式,如 JAR

pre-integration-test

integration-test

post-integration-test

verify

install 将包安装至本地仓库,以让其它项目依赖

deploy 将最终的包复制到远程的仓库,以让其它开发人员与项目共享或部署到服务器上运行

⑤:生命周期与自动化构建

  运行任何一个阶段的时候,他前面的所有阶段都会被运行,例如我们运行mvn install的时候,代码会被编译,测试,打包。这就是Maven为什么能够自动执行构建过程的各个环节的原因。此外,Maven的插件机制是完全依赖Maven的生命周期的,因此理解生命周期是至关重要。

5.7 插件和目标

  • Maven的核心仅仅定义了抽象的生命周期,具体的任务都是交由插件完成的
  • 每个插件都可以实现多个功能,每个功能就是一个插件
  • Maven的生命周期与插件目标相互绑定以完成某个具体的构建任务

例如:compile就是插件maven-compli-plugin的一个目标:pre-clean是插件maven-clean-plugin的一个目标。

5.8 继承

①:为什么需要继承机制

由于非complie范围的依赖信息是不能在“依赖链”中传递的,所以有需要的工程只能单独配置。例如

图片

图片

此时如果项目需要将各个模块的junit版本统一为5.9,那么到各个工程手动修改无疑是非常不可取的。使用继承机制就可以将这样的依赖信息统一提取到父工程模块中进行统一管理。

②:创建父工程

创建父工程和创建一般的Java工程操作一样,唯一需要注意的就是:打包方式初要设置为pom

③:在子工程中引用父工程

<parent>  
<!-- 父工程坐标 -->
  <groupId>...</groupId> 
  <artifactId>...</artifactId>  
  <version>...</version>  <relativePath>从当前目录到父项目的 pom.xml 文件的相对路径</relativePath> </parent>

图片

此时如果子工程的groupid和version如果和父工程重复则可以删除。

④:在父工程中管理依赖

将parent项目中的dependencies标签,用dependencyManagement 标签括起来

图片

图片

在子项目中重新指定需要的依赖,删除范围和版本号

图片

5.9 聚合

①:为什么要使用聚合?

将多个工程拆分为模块后,需要手动逐个安装到仓库后依赖才能够生效。修改源码后也需要逐个手动进行clean操作。而使用了聚合之后就可以批量进行Maven工程的安装、清理工作。

②:如何配置聚合?

在总的聚合工程中使用moudles/module标签组合,指定模块工程的相对路径即可

图片

6 总结

maven主要是对项目的管理和jar包的管理机制,小伙伴可以到 http://mvnrepository.com/搜索需要的 jar 包的依赖信息。

猜你喜欢

转载自blog.csdn.net/qq_44762290/article/details/107504262