web-dev-qa-db-ja.com

gitプロジェクトの一部のみを複製することは可能ですか?

Slackbuildsのコレクションを見つけました。GitHubに必要なものがいくつかあります。 https://github.com/PhantomX/slackbuilds/ すべてのgitを取得したくありません。

git clone https://github.com/PhantomX/slackbuilds.git

これ の場合、slackbuildのみを取得します。

これを行う方法?出来ますか?

35
elbarna

履歴全体をダウンロードしてしまうので、あまりメリットはありませんが、「スパース」チェックアウトを使用して特定の部分をチェックアウトできます。引用 このスタックオーバーフローの投稿

クローンを実行する手順は次のとおりです。

mkdir <repo>
cd <repo>
git init
git remote add -f Origin <url>

これにより、リモートで空のリポジトリが作成され、すべてのオブジェクトがフェッチされますが、チェックアウトはされません。次に行います:

git config core.sparseCheckout true

次に、実際にチェックアウトするファイル/フォルダーを定義する必要があります。これは、それらを.git/info/sparse-checkoutにリストすることで行われます。例:

echo "some/dir/" >> .git/info/sparse-checkout
echo "another/sub/tree" >> .git/info/sparse-checkout

最後に重要なことですが、リモートからの状態で空のリポジトリを更新します。

git pull Origin master

拡張チュートリアル を確認することをお勧めします。おそらく、公式の スパースチェックアウトのドキュメント をお読みください。

浅いクローン を使用した方がよい場合もあります。前に示したgit pullコマンドの代わりに、以下を試してください。

git pull --depth=1 Origin master
32
muru

これを試して:

svn export https://github.com/PhantomX/slackbuilds/trunk/${directory}
8
Meow

_git clone --filter_ Git 2.19から

このオプションは実際にはサーバーからの不要なオブジェクトのフェッチをスキップします:

_git clone --depth 1 --no-checkout --filter=blob:none \
  "file://$(pwd)/server_repo" local_repo
cd local_repo
git checkout master -- mydir/
_

サーバーは次のように構成する必要があります。

_git config --local uploadpack.allowfilter 1
git config --local uploadpack.allowanysha1inwant 1
_

V2.19.0の時点ではサーバーのサポートはありませんが、ローカルでテスト済みです。

TODO:_--filter=blob:none_はすべてのblobをスキップしますが、すべてのツリーオブジェクトをフェッチします。しかし、通常のリポジトリでは、これはファイル自体に比べて小さいはずなので、これで十分です。質問: https://www.spinics.net/lists/git/msg342006.html 開発者は_--filter=tree:0_がそのための作業をしていると回答しました。

_--depth 1_はすでに_--single-branch_を意味していることを覚えておいてください。次も参照してください: https://stackoverflow.com/questions/1778088/how-to-clone-a-single-branch-in-git

_git clone_プロトコルの悪意を克服するにはfile://$(path)が必要です: https://stackoverflow.com/questions/47307578/how-to-shallow-clone-a-local-git-repository -with-a-relative-path

_--filter_の形式は_man git-rev-list_に記載されています。

この機能をサポートするために、Gitリモートプロトコルが拡張されました。

Gitツリーのドキュメント:

テストしてみましょう

_#!/usr/bin/env bash
set -eu

list-objects() (
  git rev-list --all --objects
  echo "master commit SHA: $(git log -1 --format="%H")"
  echo "mybranch commit SHA: $(git log -1 --format="%H")"
  git ls-tree master
  git ls-tree mybranch | grep mybranch
  git ls-tree master~ | grep root
)

# Reproducibility.
export GIT_COMMITTER_NAME='a'
export GIT_COMMITTER_EMAIL='a'
export GIT_AUTHOR_NAME='a'
export GIT_AUTHOR_EMAIL='a'
export GIT_COMMITTER_DATE='2000-01-01T00:00:00+0000'
export GIT_AUTHOR_DATE='2000-01-01T00:00:00+0000'

rm -rf server_repo local_repo
mkdir server_repo
cd server_repo

# Create repo.
git init --quiet
git config --local uploadpack.allowfilter 1
git config --local uploadpack.allowanysha1inwant 1

# First commit.
# Directories present in all branches.
mkdir d1 d2
printf 'd1/a' > ./d1/a
printf 'd1/b' > ./d1/b
printf 'd2/a' > ./d2/a
printf 'd2/b' > ./d2/b
# Present only in root.
mkdir 'root'
printf 'root' > ./root/root
git add .
git commit -m 'root' --quiet

# Second commit only on master.
git rm --quiet -r ./root
mkdir 'master'
printf 'master' > ./master/master
git add .
git commit -m 'master commit' --quiet

# Second commit only on mybranch.
git checkout -b mybranch --quiet master~
git rm --quiet -r ./root
mkdir 'mybranch'
printf 'mybranch' > ./mybranch/mybranch
git add .
git commit -m 'mybranch commit' --quiet

echo "# List and identify all objects"
list-objects
echo

# Restore master.
git checkout --quiet master
cd ..

# Clone. Don't checkout for now, only .git/ dir.
git clone --depth 1 --quiet --no-checkout --filter=blob:none "file://$(pwd)/server_repo" local_repo
cd local_repo

# List missing objects from master.
echo "# Missing objects after --no-checkout"
git rev-list --all --quiet --objects --missing=print
echo

echo "# Git checkout fails without internet"
mv ../server_repo ../server_repo.off
! git checkout master
echo

echo "# Git checkout fetches the missing directory from internet"
mv ../server_repo.off ../server_repo
git checkout master -- d1/
echo

echo "# Missing objects after checking out d1"
git rev-list --all --quiet --objects --missing=print
_

GitHubアップストリーム

Git v2.19.0での出力:

_# List and identify all objects
c6fcdfaf2b1462f809aecdad83a186eeec00f9c1
fc5e97944480982cfc180a6d6634699921ee63ec
7251a83be9a03161acde7b71a8fda9be19f47128
62d67bce3c672fe2b9065f372726a11e57bade7e
b64bf435a3e54c5208a1b70b7bcb0fc627463a75 d1
308150e8fddde043f3dbbb8573abb6af1df96e63 d1/a
f70a17f51b7b30fec48a32e4f19ac15e261fd1a4 d1/b
84de03c312dc741d0f2a66df7b2f168d823e122a d2
0975df9b39e23c15f63db194df7f45c76528bccb d2/a
41484c13520fcbb6e7243a26fdb1fc9405c08520 d2/b
7d5230379e4652f1b1da7ed1e78e0b8253e03ba3 master
8b25206ff90e9432f6f1a8600f87a7bd695a24af master/master
ef29f15c9a7c5417944cc09711b6a9ee51b01d89
19f7a4ca4a038aff89d803f017f76d2b66063043 mybranch
1b671b190e293aa091239b8b5e8c149411d00523 mybranch/mybranch
c3760bb1a0ece87cdbaf9a563c77a45e30a4e30e
a0234da53ec608b54813b4271fbf00ba5318b99f root
93ca1422a8da0a9effc465eccbcb17e23015542d root/root
master commit SHA: fc5e97944480982cfc180a6d6634699921ee63ec
mybranch commit SHA: fc5e97944480982cfc180a6d6634699921ee63ec
040000 tree b64bf435a3e54c5208a1b70b7bcb0fc627463a75    d1
040000 tree 84de03c312dc741d0f2a66df7b2f168d823e122a    d2
040000 tree 7d5230379e4652f1b1da7ed1e78e0b8253e03ba3    master
040000 tree 19f7a4ca4a038aff89d803f017f76d2b66063043    mybranch
040000 tree a0234da53ec608b54813b4271fbf00ba5318b99f    root

# Missing objects after --no-checkout
?f70a17f51b7b30fec48a32e4f19ac15e261fd1a4
?8b25206ff90e9432f6f1a8600f87a7bd695a24af
?41484c13520fcbb6e7243a26fdb1fc9405c08520
?0975df9b39e23c15f63db194df7f45c76528bccb
?308150e8fddde043f3dbbb8573abb6af1df96e63

# Git checkout fails without internet
fatal: '/home/ciro/bak/git/test-git-web-interface/other-test-repos/partial-clone.tmp/server_repo' does not appear to be a git repository
fatal: Could not read from remote repository.

Please make sure you have the correct access rights
and the repository exists.

# Git checkout fetches the missing directory from internet
remote: Enumerating objects: 1, done.
remote: Counting objects: 100% (1/1), done.
remote: Total 1 (delta 0), reused 0 (delta 0)
Receiving objects: 100% (1/1), 45 bytes | 45.00 KiB/s, done.
remote: Enumerating objects: 1, done.
remote: Counting objects: 100% (1/1), done.
remote: Total 1 (delta 0), reused 0 (delta 0)
Receiving objects: 100% (1/1), 45 bytes | 45.00 KiB/s, done.

# Missing objects after checking out d1
?8b25206ff90e9432f6f1a8600f87a7bd695a24af
?41484c13520fcbb6e7243a26fdb1fc9405c08520
?0975df9b39e23c15f63db194df7f45c76528bccb
_

結論:_d1/_外からのすべてのblobがありません。例えば。 _0975df9b39e23c15f63db194df7f45c76528bccb_、つまり_d2/b_は、_d1/_をチェックアウトした後、存在しません。

_root/root_および_mybranch/mybranch_も欠落していますが、_--depth 1_は欠落ファイルのリストから非表示にすることに注意してください。 _--depth 1_を削除すると、欠落ファイルのリストに表示されます。

GitHubリポジトリの場合、 https://github.com/HR/github-clone を使用して、任意のGitHubリポジトリの任意のサブディレクトリを(任意の参照で)クローンできます。

1
CryptoGeek

上記のおかげで、私は最終的にこれを機能させました。私はファイルを直接編集していて、誤って引用符を含めるとエラーが発生しました。 .git/info/sparse-checkoutファイルには、引用符なしでディレクトリのみを含める必要があります。次に例を示します。この巨大なプロジェクト: https://github.com/SharePoint/sp-dev-fx-webparts 、私はサンプルディレクトリのreact-script-editorだけを望んでいました。 https://github.com/SharePoint/sp-dev-fx-webparts/tree/master/samples/react-script-editor

私は上記の指示に従って、私の.git/info/sparse-checkoutファイルにこれだけが含まれているときに動作しました

samples/react-script-editor

1
Josh Leong

これにより、特定のフォルダーのクローンが作成され、それに関連しないすべての履歴が削除されます。

git clone --single-branch -b {branch} [email protected]:{user}/{repo}.git
git filter-branch --subdirectory-filter {path/to/folder} HEAD
git remote remove Origin
git remote add Origin [email protected]:{user}/{new-repo}.git
git Push -u Origin master
1
BARJ

私が直面した特定の制限でお答えします。

  • VSOでは、SSHがセキュリティによって無効化されていたため、gitアーカイブを使用できませんでした。 PAT/CredentialProviderのみがサポートされていました。
  • 私たちのブランチには膨大なコードが含まれていたため、git clone自体は最低でも15分かかります。

これが私がしたことです:

  1. 1回限りの手動プロセス:VSO UIで、新しいリモートブランチを作成し、「emptyBranch」というファイルを持たない(すべて削除される)とします。
  2. git clone --depth=1 --single-branch --branch emptyBranch <remote>(かなり早い)
  3. git checkout <branchToSyncTo> <directoryToSyncTo>(特定のフォルダのみをチェックアウト)
1
Abin