uTools-Manuals/docs/git/git filter-branch.html
2019-04-08 23:22:26 +08:00

26 lines
25 KiB
HTML
Raw Blame History

This file contains invisible Unicode characters

This file contains invisible Unicode characters that are indistinguishable to humans but may be processed differently by a computer. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

<div class="c-markdown doc-markdown"><div class="doc-postil"><div class="c-markdown"><h2>命名</h2></div></div><div class="doc-postil"><div class="c-markdown"><p>git-filter-branch  - 重写分支</p></div></div><div class="doc-postil"><div class="c-markdown"><h2>概要</h2></div></div><div class="doc-postil"><div class="c-markdown"><pre class="prism-token token language-javascript">git filter-branch [--setup &lt;command&gt;] [--env-filter &lt;command&gt;]        [--tree-filter &lt;command&gt;] [--index-filter &lt;command&gt;]        [--parent-filter &lt;command&gt;] [--msg-filter &lt;command&gt;]        [--commit-filter &lt;command&gt;] [--tag-name-filter &lt;command&gt;]        [--subdirectory-filter &lt;directory&gt;] [--prune-empty]        [--original &lt;namespace&gt;] [-d &lt;directory&gt;] [-f | --force]        [--] [&lt;rev-list options&gt;…]</pre></div></div><div class="doc-postil"><div class="c-markdown"><h2>描述</h2></div></div><div class="doc-postil"><div class="c-markdown"><p>让您通过重写&lt;rev-list选项&gt;中提到的分支来重写Git修订历史记录并在每个修订版上应用自定义过滤器。这些过滤器可以修改每个树例如删除文件或对所有文件运行perl重写或每个提交的信息。否则将保留所有信息包括原始提交时间或合并信息</p></div></div><div class="doc-postil"><div class="c-markdown"><p>该命令将只重写<code>positive</code>命令行中提到的ref例如如果通过<code>a..b</code>,只会<code>b</code>被重写。如果您没有指定过滤器那么提交将被重新发送而不做任何更改这通常没有任何影响。尽管如此这对于补偿一些Git bug或将来可能会有用因此这种用法是允许的。</p></div></div><div class="doc-postil"><div class="c-markdown"><p><strong>注意</strong>:该命令<code>.git/info/grafts</code><code>refs/replace/</code>命名空间中承认文件和引用。如果您有任何定义的移植或替换参考,运行此命令将使它们永久。</p></div></div><div class="doc-postil"><div class="c-markdown"><p><strong>警告</strong>重写的历史将为所有对象具有不同的对象名称并且不会与原始分支会聚。您将无法轻松地将重写的分支推送并分发到原始分支的顶部。如果您不知道全部含义请不要使用此命令并且如果简单的单一提交就足以解决您的问题请避免使用它。有关重写已发布历史记录的更多信息请参阅git-rebase [1]中的“从上游重新引导恢复”一节。)</p></div></div><div class="doc-postil"><div class="c-markdown"><p>始终验证重写的版本是否正确:原始参考文献(如果与重写版本不同)将存储在命名空间中<code>refs/original/</code></p></div></div><div class="doc-postil"><div class="c-markdown"><p>请注意,由于此操作非常昂贵,因此使用该<code>-d</code>选项将临时目录从磁盘重定向到磁盘可能是一个好主意例如在tmpfs上。据报道加速非常明显。</p></div></div><div class="doc-postil"><div class="c-markdown"><h3>过滤器</h3></div></div><div class="doc-postil"><div class="c-markdown"><p>这些过滤器按以下列出的顺序应用。&lt;command&gt;参数总是使用<code>eval</code>命令在shell上下文中进行评估出于技术原因提交过滤器值得注意的例外。在此之前<code>$GIT_COMMIT</code>环境变量将被设置为包含被重写的提交的ID。此外GIT_AUTHOR_NAMEGIT_AUTHOR_EMAILGIT_AUTHOR_DATEGIT_COMMITTER_NAMEGIT_COMMITTER_EMAIL和GIT_COMMITTER_DATE取自当前提交并导出到环境中以影响由git-commit-tree [1]创建的替换提交的作者身份和提交者身份过滤器已运行。</p></div></div><div class="doc-postil"><div class="c-markdown"><p>如果任何对&lt;command&gt;的评估返回非零退出状态,则整个操作将被中止。</p></div></div><div class="doc-postil"><div class="c-markdown"><p>一个<code>map</code>函数可以使用“original sha1 id”参数如果提交已被重写则输出“重写的sha1 id”否则输出“original sha1 id”。<code>map</code>如果您的提交过滤器发出多个提交该函数可以在单独的行上返回多个ids。</p></div></div><div class="doc-postil"><div class="c-markdown"><h2>选项</h2></div></div><div class="doc-postil"><div class="c-markdown"><p>--setup &lt;command&gt;</p></div></div><div class="doc-postil"><div class="c-markdown"><p>这不是为每个提交执行的实际过滤器,而是在循环之前的一次设置。因此,还没有定义提交特定的变量。由于技术原因,此处定义的函数或变量可以在除提交过滤器之外的以下过滤步骤中使用或修改。</p></div></div><div class="doc-postil"><div class="c-markdown"><p>--env-filter &lt;command&gt;</p></div></div><div class="doc-postil"><div class="c-markdown"><p>如果您只需要修改提交将执行的环境,则可以使用此过滤器。具体来说,您可能需要重写作者/提交者名称/电子邮件/时间环境变量有关详细信息请参阅git-commit-tree [1])。</p></div></div><div class="doc-postil"><div class="c-markdown"><p>--tree-filter &lt;command&gt;</p></div></div><div class="doc-postil"><div class="c-markdown"><p>这是重写树及其内容的过滤器。该参数在shell中用工作目录设置为检出树的根来评估。然后使用新的树新文件自动添加消失的文件自动删除 - 既不.gitignore文件也没有任何其他忽略规则<strong>有任何影响</strong>!)。</p></div></div><div class="doc-postil"><div class="c-markdown"><p>--index-filter &lt;command&gt;</p></div></div><div class="doc-postil"><div class="c-markdown"><p>这是重写索引的过滤器。它类似于树型过滤器,但不检出树,这使得它更快。经常使用<code>git rm --cached --ignore-unmatch ...</code>请参阅下面的示例。对于毛病请参阅git-update-index [1]。</p></div></div><div class="doc-postil"><div class="c-markdown"><p>--parent-filter &lt;command&gt;</p></div></div><div class="doc-postil"><div class="c-markdown"><p>这是重写提交的父列表的过滤器。它将接收stdin上的父字符串并应在stdout上输出新的父字符串。父字符串采用git-commit-tree [1]中描述的格式:初始提交时为空,正常提交时为“-p parent”合并为“-p parent1 -p parent2 -p parent3 ...”承诺。</p></div></div><div class="doc-postil"><div class="c-markdown"><p>--msg-filter &lt;command&gt;</p></div></div><div class="doc-postil"><div class="c-markdown"><p>这是重写提交消息的过滤器。参数在shell中使用标准输入的原始提交消息进行评估; 其标准输出被用作新的提交消息。</p></div></div><div class="doc-postil"><div class="c-markdown"><p>--commit-filter &lt;command&gt;</p></div></div><div class="doc-postil"><div class="c-markdown"><p>这是执行提交的过滤器。如果指定了此过滤器,它将被调用,而不是<code>git commit-tree</code>命令,参数形式为“&lt;TREE_ID&gt;-p &lt;PARENT_COMMIT_ID&gt;...”和stdin上的日志消息。提交ID预计在标准输出上。</p></div></div><div class="doc-postil"><div class="c-markdown"><p>作为一个特殊的扩展提交过滤器可能会发出多个提交id; 在那种情况下,原来承诺的改写孩子将把他们全部当作父母。</p></div></div><div class="doc-postil"><div class="c-markdown"><p>您可以<code>map</code>在此过滤器中使用便利功能,以及其他便利功能。例如,调用<code>skip_commit "$@"</code>将忽略当前的提交(但不会更改它!如果需要,则<code>git rebase</code>改为使用)。</p></div></div><div class="doc-postil"><div class="c-markdown"><p>如果您不希望保留对单个父代的提交并且不对树进行更改<code>git_commit_non_empty_tree "$@"</code><code>git commit-tree "$@"</code>那么也可以使用它。</p></div></div><div class="doc-postil"><div class="c-markdown"><p>--tag-name-filter &lt;command&gt;</p></div></div><div class="doc-postil"><div class="c-markdown"><p>这是重写标签名称的过滤器。传递时将调用指向重写对象或指向重写对象的标记对象的每个标记ref。原始标签名称通过标准输入传递新标签名称预计在标准输出上。</p></div></div><div class="doc-postil"><div class="c-markdown"><p>原始标签不会被删除,但可以被覆盖; 使用“--tag-name-filter cat”来简单地更新标签。在这种情况下要非常小心并确保在转换发生冲突的情况下备份旧标签。</p></div></div><div class="doc-postil"><div class="c-markdown"><p>几乎可以正确重写标签对象。如果标签附有消息,则会使用相同的消息,作者和时间戳创建新的标签对象。如果标签附有签名,签名将被剥离。根据定义,不可能保留签名。这是“几乎”适当的原因,因为理想情况下,如果标签没有改变(指向相同的对象,具有相同的名称等),它应该保留任何签名。情况并非如此,签名将永远被删除,买家要小心。也不支持更改作者或时间戳(或针对该问题的标记消息)。指向其他标签的标签将被重写为指向底层提交。</p></div></div><div class="doc-postil"><div class="c-markdown"><p>--subdirectory-filter &lt;directory&gt;</p></div></div><div class="doc-postil"><div class="c-markdown"><p>只能看看触及给定子目录的历史记录。结果将包含该目录(并且仅包含该目录)作为其项目根目录。意味着重新映射到祖先。</p></div></div><div class="doc-postil"><div class="c-markdown"><p>--prune-empty</p></div></div><div class="doc-postil"><div class="c-markdown"><p>有些过滤器会生成空的提交使树保持不变。这个选项指示git-filter-branch删除这样的提交如果它们只有一个或零个未修剪的父母; 因此合并提交将保持不变。这个选项不能与一起使用<code>--commit-filter</code>,尽管通过<code>git_commit_non_empty_tree</code>在提交过滤器中使用提供的功能可以实现相同的效果。</p></div></div><div class="doc-postil"><div class="c-markdown"><p>--original &lt;namespace&gt;</p></div></div><div class="doc-postil"><div class="c-markdown"><p>使用此选项设置原始提交将存储在其中的名称空间。默认值是<code>refs/original</code></p></div></div><div class="doc-postil"><div class="c-markdown"><p>-d &lt;directory&gt;</p></div></div><div class="doc-postil"><div class="c-markdown"><p>使用此选项可将路径设置为用于重写的临时目录。当应用树型过滤器时,该命令需要暂时将该树检出到某个目录,这在大型项目的情况下可能消耗相当大的空间。默认情况下,它在<code>.git-rewrite/</code>目录中执行此操作,但您可以通过此参数覆盖该选项。</p></div></div><div class="doc-postil"><div class="c-markdown"><p>-f   --force</p></div></div><div class="doc-postil"><div class="c-markdown"><p><code>git filter-branch</code>拒绝从现有的临时目录开始或者当已经有ref时<code>refs/original/</code>,除非强制。</p></div></div><div class="doc-postil"><div class="c-markdown"><p>&lt;rev-list options&gt;</p></div></div><div class="doc-postil"><div class="c-markdown"><p>参数<code>git rev-list</code>。这些选项包含的所有正面参考都被重写。您也可以指定诸如此类的选项<code>--all</code>,但您必须使用<code>--</code>它们将它们与<code>git filter-branch</code>选项分开。意味着重新映射到祖先。</p></div></div><div class="doc-postil"><div class="c-markdown"><h3>重新映射到祖先</h3></div></div><div class="doc-postil"><div class="c-markdown"><p>通过使用git-rev-list [1]参数,例如路径限制器,您可以限制被重写的修订集。然而,在命令行上的正面参考是有区别的:我们不会让这些限制器排除它们。为此,他们改写为指向最近的未被排除的祖先。</p></div></div><div class="doc-postil"><div class="c-markdown"><h2>例子</h2></div></div><div class="doc-postil"><div class="c-markdown"><p>假设您想从所有提交中删除文件(包含机密信息或版权侵犯):</p></div></div><div class="doc-postil"><div class="c-markdown"><pre class="prism-token token language-javascript">git filter-branch --tree-filter 'rm filename' HEAD</pre></div></div><div class="doc-postil"><div class="c-markdown"><p>但是,如果该文件在某个提交的树中不存在,则该树的简单操作<code>rm filename</code>将失败并提交。因此,您可以改为使用<code>rm -f filename</code>脚本。</p></div></div><div class="doc-postil"><div class="c-markdown"><p>使用它<code>--index-filter</code>可以<code>git rm</code>产生更快的版本。与使用一样,如果文件不在提交树中<code>rm filename</code><code>git rm --cached filename</code>将会失败。如果你想“完全忘记”一个文件,它输入历史记录时无关紧要,所以我们还添加<code>--ignore-unmatch</code></p></div></div><div class="doc-postil"><div class="c-markdown"><pre class="prism-token token language-javascript">git filter-branch --index-filter 'git rm --cached --ignore-unmatch filename' HEAD</pre></div></div><div class="doc-postil"><div class="c-markdown"><p>现在您将获得保存在HEAD中的重写历史记录。</p></div></div><div class="doc-postil"><div class="c-markdown"><p>重写存储库以使其看起来像是<code>foodir/</code>其项目根目录,并放弃所有其他历史记录:</p></div></div><div class="doc-postil"><div class="c-markdown"><pre class="prism-token token language-javascript">git filter-branch --subdirectory-filter foodir -- --all</pre></div></div><div class="doc-postil"><div class="c-markdown"><p>因此,您可以将库子目录转换为自己的存储库。请注意,<code>--</code><code>filter-branch</code>选项将从修订选项中分离选项,并<code>--all</code>重写所有分支和标签。</p></div></div><div class="doc-postil"><div class="c-markdown"><p>要将提交(通常位于其他历史记录的顶端)设置为当前初始提交的父级,以便将其他历史记录粘贴到当前历史记录的后面:</p></div></div><div class="doc-postil"><div class="c-markdown"><pre class="prism-token token language-javascript">git filter-branch --parent-filter 'sed "s/^\$/-p &lt;graft-id&gt;/"' HEAD</pre></div></div><div class="doc-postil"><div class="c-markdown"><p>(如果父字符串为空 - 当我们处理初始提交时发生 - 将graftcommit作为父项添加。请注意这假设历史记录具有单个根即没有共同祖先发生时不合并。如果不是这种情况请使用</p></div></div><div class="doc-postil"><div class="c-markdown"><pre class="prism-token token language-javascript">git filter-branch --parent-filter \        'test $GIT_COMMIT = &lt;commit-id&gt; &amp;&amp; echo "-p &lt;graft-id&gt;" || cat' HEAD</pre></div></div><div class="doc-postil"><div class="c-markdown"><p>甚至更简单:</p></div></div><div class="doc-postil"><div class="c-markdown"><pre class="prism-token token language-javascript">echo "$commit-id $graft-id" &gt;&gt; .git/info/grafts
git filter-branch $graft-id..HEAD</pre></div></div><div class="doc-postil"><div class="c-markdown"><p>删除历史记录中由“Darl McBribe”撰写的提交</p></div></div><div class="doc-postil"><div class="c-markdown"><pre class="prism-token token language-javascript">git filter-branch --commit-filter '        if [ "$GIT_AUTHOR_NAME" = "Darl McBribe" ];
        then
                skip_commit "$@";        else
                git commit-tree "$@";
        fi' HEAD</pre></div></div><div class="doc-postil"><div class="c-markdown"><p>该功能<code>skip_commit</code>定义如下:</p></div></div><div class="doc-postil"><div class="c-markdown"><pre class="prism-token token language-javascript">skip_commit(){
        shift;        while [ -n "$1" ];        do
                shift;
                map "$1";
                shift;
        done;}</pre></div></div><div class="doc-postil"><div class="c-markdown"><p>换挡魔法首先抛弃树ID然后抛出-p参数。请注意这将正确处理合并如果Darl在P1和P2之间进行合并它将被正确传播并且合并的所有子代将成为合并提交P1和P2作为它们的父代提交而不是合并提交。</p></div></div><div class="doc-postil"><div class="c-markdown"><p><strong>注意</strong>提交引入的更改以及未被后续提交恢复的更改仍将位于重写的分支中。如果你想<code>changes</code>与提交一起扔掉,你应该使用交互模式<code>git rebase</code></p></div></div><div class="doc-postil"><div class="c-markdown"><p>您可以使用重写提交日志消息<code>--msg-filter</code>。例如,可以通过以下方式删除<code>git svn-id</code>由创建的存储库中的字符串<code>git svn</code></p></div></div><div class="doc-postil"><div class="c-markdown"><pre class="prism-token token language-javascript">git filter-branch --msg-filter '
        sed -e "/^git-svn-id:/d"'</pre></div></div><div class="doc-postil"><div class="c-markdown"><p>如果你需要为<code>Acked-by</code>最后10个提交其中没有一个是合并添加行请使用以下命令</p></div></div><div class="doc-postil"><div class="c-markdown"><pre class="prism-token token language-javascript">git filter-branch --msg-filter '
        cat &amp;&amp;
        echo "Acked-by: Bugs Bunny &lt;bunny@bugzilla.org&gt;"' HEAD~10..HEAD</pre></div></div><div class="doc-postil"><div class="c-markdown"><p><code>--env-filter</code>选项可用于修改提交者和/或作者身份。例如如果您发现由于配置错误的user.email而导致您的提交有错误身份则可以在发布项目之前进行更正如下所示</p></div></div><div class="doc-postil"><div class="c-markdown"><pre class="prism-token token language-javascript">git filter-branch --env-filter '        if test "$GIT_AUTHOR_EMAIL" = "root@localhost"
        then
                GIT_AUTHOR_EMAIL=john@example.com
        fi        if test "$GIT_COMMITTER_EMAIL" = "root@localhost"
        then
                GIT_COMMITTER_EMAIL=john@example.com
        fi
' -- --all</pre></div></div><div class="doc-postil"><div class="c-markdown"><p>要限制仅重写历史记录的一部分,除了指定新的分支名称外,还要指定一个修订范围。新的分支名称将指向<code>git rev-list</code>该范围的最高版本。</p></div></div><div class="doc-postil"><div class="c-markdown"><p>考虑这个历史:</p></div></div><div class="doc-postil"><div class="c-markdown"><pre class="prism-token token language-javascript">     D--E--F--G--H    /     /A--B-----C</pre></div></div><div class="doc-postil"><div class="c-markdown"><p>只重写提交DEFGH但只保留AB和C请使用</p></div></div><div class="doc-postil"><div class="c-markdown"><pre class="prism-token token language-javascript">git filter-branch ... C..H</pre></div></div><div class="doc-postil"><div class="c-markdown"><p>要重写提交EFGH请使用以下其中一个</p></div></div><div class="doc-postil"><div class="c-markdown"><pre class="prism-token token language-javascript">git filter-branch ... C..H --not D
git filter-branch ... D..H --not C</pre></div></div><div class="doc-postil"><div class="c-markdown"><p>要将整棵树移动到一个子目录中,或从其中删除它:</p></div></div><div class="doc-postil"><div class="c-markdown"><pre class="prism-token token language-javascript">git filter-branch --index-filter \
        'git ls-files -s | sed "s-\t\"*-&amp;newsubdir/-" |
                GIT_INDEX_FILE=$GIT_INDEX_FILE.new \
                        git update-index --index-info &amp;&amp;
         mv "$GIT_INDEX_FILE.new" "$GIT_INDEX_FILE"' HEAD</pre></div></div><div class="doc-postil"><div class="c-markdown"><h2>收缩存储库的清单</h2></div></div><div class="doc-postil"><div class="c-markdown"><p>git-filter-branch可以用来摆脱文件的一个子集通常用一些<code>--index-filter</code>和的组合<code>--subdirectory-filter</code>。人们期望得到的存储库比原来的存储库要小但是你需要更多的步骤才能使它更小因为Git在你告诉它之前尽量不要丢失你的对象。首先确保</p></div></div><div class="doc-postil"><div class="c-markdown"><ul class="ul-level-0 list-paddingleft-2" style="margin: 10px 0px 10px 20px;"><li><p>如果一个blob在其整个生命周期中移动你真的会删除所有文件名的变体。<code>git log --name-only --follow --all -- filename</code>可以帮助您找到重命名。</p></li></ul></div></div><div class="doc-postil"><div class="c-markdown"><ul class="ul-level-0 list-paddingleft-2" style="margin: 10px 0px 10px 20px;"><li><p>你真的过滤了所有的refs<code>--tag-name-filter cat -- --all</code>在调用git-filter-branch时使用。</p></li></ul></div></div><div class="doc-postil"><div class="c-markdown"><p>然后有两种方法可以获得较小的存储库。更安全的方法是克隆,这可以保持原来的原样。</p></div></div><div class="doc-postil"><div class="c-markdown"><ul class="ul-level-0 list-paddingleft-2" style="margin: 10px 0px 10px 20px;"><li><p>克隆它<code>git clone file:///path/to/repo</code>。克隆将不会有被删除的对象。参见git-clone [1]。(请注意,使用纯路径进行克隆只是将所有内容硬链接起来!)如果您确实不想克隆它,无论出于何种原因,请检查以下几点(按此顺序)。这是一种非常具有破坏性的方法,因此请<strong>进行备份</strong>或恢复克隆。你被警告了。</p></li></ul></div></div><div class="doc-postil"><div class="c-markdown"><ul class="ul-level-0 list-paddingleft-2" style="margin: 10px 0px 10px 20px;"><li><p>删除由git-filter-branch备份的原始参考<code>git for-each-ref --format="%(refname)" refs/original/ | xargs -n 1 git update-ref -d</code></p></li></ul></div></div><div class="doc-postil"><div class="c-markdown"><ul class="ul-level-0 list-paddingleft-2" style="margin: 10px 0px 10px 20px;"><li><p>使用所有reflogs <code>git reflog expire --expire=now --all</code></p></li></ul></div></div><div class="doc-postil"><div class="c-markdown"><ul class="ul-level-0 list-paddingleft-2" style="margin: 10px 0px 10px 20px;"><li><p>垃圾收集所有未被引用的对象<code>git gc --prune=now</code>或者如果你的git-gc不够新以支持参数<code>--prune</code>,则<code>git repack -ad; git prune</code>改为使用)。</p></li></ul></div></div><div class="doc-postil"><div class="c-markdown"><h2>警告</h2></div></div><div class="doc-postil"><div class="c-markdown"><p>git-filter-branch允许你对Git历史进行复杂的shell脚本重写但如果你只是<code>removing unwanted data</code>像大文件或密码那样你可能不需要这种灵活性。对于这些操作您可能需要考虑BFG Repo-Cleaner一种基于JVM的git-filter-branch替代方案对于这些用例而言其典型速度至少快10-50倍并且具有不同的特征</p></div></div><div class="doc-postil"><div class="c-markdown"><ul class="ul-level-0 list-paddingleft-2" style="margin: 10px 0px 10px 20px;"><li><p>任何特定版本的文件都会被精确清理<code>once</code>。与git-filter-branch不同的是BFG不会让你有机会根据历史记录中何时或何时提交文件来处理文件。这个约束条件给了BFG的核心性能优势并且非常适合清理不良数据的任务 - 您不关心<code>where</code>坏数据,您只需要它<code>gone</code></p></li></ul></div></div><div class="doc-postil"><div class="c-markdown"><ul class="ul-level-0 list-paddingleft-2" style="margin: 10px 0px 10px 20px;"><li><p>默认情况下BFG充分利用多核机器并行清理提交文件树。git-filter-branch清除按顺序提交即以单线程方式提交尽管<code>is</code>可以在针对每个提交执行的脚本中编写包含它们自己的并行性的过滤器。</p></li></ul></div></div><div class="doc-postil"><div class="c-markdown"><ul class="ul-level-0 list-paddingleft-2" style="margin: 10px 0px 10px 20px;"><li><p>该命令选项都远远超过git的过滤分支更严格并致力于只是为了消除不必要的数据-例如任务:<code>--strip-blobs-bigger-than 1M</code></p></li></ul></div></div></div>