Git从库中移除已删除大文件

分享一下我老师大神的人工智能教程!零基础,通俗易懂!http://blog.csdn.net/jiangjunshow

也欢迎大家转载本篇文章。分享知识,造福人民,实现我们中华民族伟大复兴!

                       

写在前面

大家一定遇到过在使用Git时,不小心将一个很大的文件添加到库中,即使删除,记录中还是保存了这个文件。以后不管是拷贝,还是push/pull都比较麻烦。今天在上传工程到github上,发现最大只能上传100MB大小文件,在本地git库中有一个150MB文件,虽然已经删除,但还保存了记录。下面教大家如何从库中彻底删除无效大文件。


删除大文件

方法很简单,就是先找到大文件对象再删除

  1. 先提交所有更改

     $ git commit -am "commit all"
         
         
    • 1
  2. 对仓库进行gc操作

     $ git gc
         
         
    • 1
  3. 运行count-objects 查看空间使用,size-pack 是以千字节为单位表示的 packfiles 的大小,因此已经使用了大约150MB 。

     $ git count-objects -v
         
         
    • 1

    这里写图片描述

  4. 运行底层命令 git verify-pack 以识别出大对象,对输出的第三列信息即文件大小进行排序.

    $ git verify-pack -v .git/objects/pack/pack-8eaeb...9e.idx | sort -k 3 -n | tail -3
         
         
    • 1

    这里写图片描述

     

    注:可以看到对底下那个就是大文件。

  5. 使用 rev-list 命令,传入 - -objects 选项,它会列出所有 commit SHA 值,blob SHA 值及相应的文件路径,这样查看 blob 的文件名。

    $ git rev-list --objects --all | grep 185ab8d
         
         
    • 1

    这里写图片描述

  6. 将该文件从历史记录的所有 tree 中移除。

    $ git log --pretty=oneline --branches -- spark-assembly-1.3.1-hadoop2.4.0.jar
         
         
    • 1

    这里写图片描述

  7. filter-branch 命令重写从 646784 开始的所有 commit 才能将文件从 Git 历史中完全移除。

    git filter-branch --index-filter 'git rm --cached --ignore-unmatch  spark-assembly-1.3.1-hadoop2.4.0.jar' -- 646784d95f347749517a67c50c117f4bf85d0b42..
         
         
    • 1

    这里写图片描述

     

    注:- -index-filter 选项类似于 - -tree-filter 选项,但这里不是传入一个命令去修改磁盘上签出的文件,而是修改暂存区域或索引。不能用 rm file 命令来删除一个特定文件,而是必须用git rm - -cached 来删除它 ── 即从索引而不是磁盘删除它。这样做是出于速度考虑 ── 由于 Git 在运行你的 filter 之前无需将所有版本签出到磁盘上,这个操作会快得多。也可以用 - -tree-filter 来完成相同的操作。git rm- -ignore-unmatch 选项指定当你试图删除的内容并不存在时不显示错误。最后,因为你清楚问题是从哪个 commit 开始的,使用 filter-branch 重写自 64678 这个 commit 开始的所有历史记录。不这么做的话会重写所有历史记录,花费不必要的更多时间。

  8. 现在历史记录中已经不包含对那个文件的引用了。不过 reflog 以及运行 filter-branch 时 Git 往.git/refs/original 添加的一些 refs 中仍有对它的引用,因此需要将这些引用删除并对仓库进行 repack 操作。在进行 repack 前需要将所有对这些 commits 的引用去除。

    \$ rm -Rf .git/refs/original\$ rm -Rf .git/logs/\$ git gc
         
         
    • 1
    • 2
    • 3
  9. 查看空间使用

     $ git count-objects -v
         
         
    • 1
  10. 如果真的要完全把这个对象删除,可以运行 git prune 命令。


【完】

           

给我老师的人工智能教程打call!http://blog.csdn.net/jiangjunshow

这里写图片描述

猜你喜欢

转载自blog.csdn.net/ufryyfdf/article/details/83544901