Python

GoogleColab 上でファイルを操作コツ(Part1)

Google Colaboratory上でのファイル操作に困った経験はありませんか?ドライブのファイルにどうアクセスできるのか、ディレクトリ構造はどうなっているのか、自動でアップロード・ダウンロードするにはどうしたらいいのか … などなど。本記事は実際のコーディングでこれらをデモします。複数のやり方が存在しますが、少しでも参考になれればと思います。

Part1では、Gドライブとの接続の基本、そして、ファイルを新規作成し、アップロード、ダウンロードについて示します。次回のPart2では、表データや画像データの読み込みや表示など、もう少しバリエーションのある演習をしましょう。

Google Driveと接続

このコードで必要なクラスやモジュールをimportします。

まずGoogle Drive と接続します。つまりGoogle Driveのアクセス権限を与えます。

f:id:gri-blog:20210922141744p:plain

上記を実行すると、アカウントの選択画面に遷移するためのリンクが出ます。これに従い以下のようなページに移ります。ここでドライブをマウントしたいアカウントをクリックします。

f:id:gri-blog:20210922142014p:plain

Google Cloud SDK を信頼できることを確認する画面が出てくるので承認します。その後 verification code が表示されます。

f:id:gri-blog:20210922142130p:plain

Colabの画面に戻り、そのコードをもとの箱に貼り付けるとドライブにアクセスできる準備が整えられました。「ドライブをマウントしています」というメッセージが表示されるのでしばらく待ちます。

ファイルを読み込む

f:id:gri-blog:20210922175222p:plain
ここでは、test_data.txt というテキストファイルを読み込みます。ファイルの中身はこんな感じです。

f:id:gri-blog:20210922174115p:plain

GUIのボタンから選択します。txtファイルの各行をリストとして書き出します。

f:id:gri-blog:20210922142339p:plain

ファイルを新規作成し、ドライブにアップロード

リストの各要素をファイル名にし、その要素だけを含んだtxtファイルを作ります。リストの要素だけの数のファイうが出来上がります(5個)。

f:id:gri-blog:20210922142513p:plain

次にこれらのファイルをドライブ上にアップロードします。

f:id:gri-blog:20210922142542p:plain

ファイルのダウンロード

最後に5つのtxtファイルを一括ダウンロードしてみましょう。
f:id:gri-blog:20210922142641p:plain

パソコンのローカルに5つのファイルがダウンロードされたのが分かります。

f:id:gri-blog:20210922142807p:plain

いかがでしたか?

いったんドライブに無事に接続できるようになると、あとはパソコンのローカルのディレクトリと同じ感覚でファイルを「出し入れ」するなど操作できますね。ここで示したコーディングはなかなか覚えにくいものなので、実際は「こんなやり方があるのだ」ということを知っていただき、あとはメモしておいていつでも参照できるようにするといいですね。

ここまで読んでいただき、ありがとうございます。Part2も楽しみにしてください。

担当:ヤン ジャクリン(分析官・講師)

yan
データ分析官・データサイエンス講座の講師