ローファイ日記

出てくるコード片、ぼくが書いたものは断りがない場合 MIT License としています http://udzura.mit-license.org/

Cloud BuildからCloud Functionsを呼びたい、それだけなんだ

Google Cloudのサーバレス主要サービスであるCloud BuildCloud Functionsを使っていて、Cloud BuildからCloud Functionsをなるべく安全っぽく呼びたかったのだが、適当な手順がなかなか見つからなかったのでここに残しておき、将来自分が忘れた時に検索可能にしたい。

Prelude: Compute EngineのVMからCloud Functionsを呼ぶ

Cloud FunctionsはCompute EngineのVMから呼ぶのは比較的簡単である。以下は、認証が必要なHTTPS呼び出し設定をしたFunctionsを前提とする。

続きを読む

Lima 0.14 のVirtualization.framework対応を試す

Linux Advent Calendar 2022 19日目の記事です、と言いつつ遅くなりましたが....。

qiita.com

Lima 、使ってますか

Linux Advent Calendar なのにMacの話では?となりそうな感じもありますが、Lima使っていますか? Docker の環境を colima で作っている方もいらっしゃるかもしれません。

Lima を用いるとコマンドラインベースでLinux VMを作成できて便利で、尚且つ複数のCPUアーキテクチャVMを立ち上げられます。Limaの場合、ホストと別アーキテクチャVM作成は、これまでQEMUを利用しており、動作はそれなりのオーバーヘッドがかかるようになっていました。

ですが、Lima 0.14 からVirtualization.framework(vz)に対応したそうです。待望の!

github.com

colima からVirtualization.frameworkを使う

lima >= 0.14 + colima 0.5.0 の組み合わせだと非常にあっさりvzで環境を作れるので、拍子抜けするほど便利です(無論Macのバージョンを 13.0 以降に上げる必要もあります)。

$ colima start --cpu 8 --memory 12 --disk 150 --arch x86_64 --vm-type vz ${profile_name}

以上!と言いたいところですがすごく簡単にベンチを取ってQEMUと比べておきましょう。

vz / QEMU のベンチ

簡単ですが、以下のようなDockerfileを作って Shopify/go-lua をビルドしてベンチマークとしてみました。

# syntax = docker/dockerfile:1.3-labs
FROM golang:1.19

RUN <<SHELL
    git clone https://github.com/Shopify/go-lua.git
    cd go-lua
    git submodule update --init
    go build
    go test -cover
SHELL

ホストの環境はApple M1 Max(8+2 core)、64GB memoryという感じです。

結果です。ビルドのフェーズ2の箇所の所要時間だけ抜粋すると、

vz

 => [2/2] RUN <<SHELL (git clone https://github.com/Shopify/go-lua.git...) ... 20.1s 

QEMU

 => [2/2] RUN <<SHELL (git clone https://github.com/Shopify/go-lua.git...) ... 22.5s

1割ほど高速になっているようです。処理の内容的に、ダウンロード+ビルドでCPUワークロードも雑多な感じなので、参考程度ではありますが。

もうちょっと複雑なソフトウェア(CRubyとか...)をビルドして比べてみたい気持ちもありますが、時間が...。


ということで軽くこんな感じです。 loima 0.14 + colima 0.5.0 のDocker環境はより快適だと思いますので、M1勢試していきましょう。

OSS Halfwayというワークショップを始めるよという話

皆さんは公開情報ですか?(挨拶)

初めに言いたいこと

タイトルの通りのワークショップを始めます。最初は福岡市内でオンサイトで、エンジニアカフェ[PR]でやっていくので、まずはぜひ福岡近辺のソフトウェアに関わるエンジニアに届いてほしい。

engineercafe.connpass.com

OSS Halfway とは?

以下、OSS Halfwayを始めるにあたって考えたことをつらつらと書いてみます。何かの参考になるかは分かりません。とにかく届いてほしい、来てくれ。

続きを読む

SlackのInteractionCallbackに含まれるMessageからもとのURLを復元する

10月何もしていない...(会社のブログはギリギリ書いた記憶がある)。

何もしなすぎてるので極小ネタを。

SlackのAppにはUser Interactionという機能があり、例えばSlackの入力画面からのショートカット実行結果を受け取り、フォームを返したりさらに入力を受け取ったりなんやかんやできる。

api.slack.com

qiita.com

この辺にまとまってる通りなのだけど、メッセージに紐づくショートカット(メッセージ右上のメニューから実行できるやつ)には、元のメッセージの情報がInteractionCallbackとして含まれている。例えばGoのコードならこういう感じで取れる。

payload := new(slack.InteractionCallback)
err := json.Unmarshal(getPayloadFormValue()), payload)
if err != nil { ... }

fmt.Printf("%v\n", payload.Message)

ところで、このMessageには元メッセージのURLがそのものズバリでは含まれていない模様。

例えばショートカットがAcceptされた通知として、元のメッセージのURLを含むポストをする(そうすると元メッセージも引用されるし)などをしたい場合、以下のようなコードを書くしかない。

workspace := "myworkspace"
chanId := payload.Channel.ID
slug := "p" + strings.ReplaceAll(payload.Message.Timestamp, ".", "")

url := fmt.Sprintf("https://%s.slack.com/archives/%s/%s", workspace, chanId, slug)

メッセージのURLにはタイムスタンプの情報が含まれている模様(今はそういう仕様なだけ?)。

なおスレッドのパーマリンクの場合、また別のタイムスタンプ Message.ThreadTimestamp がある。

やりたいことに対し情報がなかったので残しとく。

RubyKaigi 後日譚: GC のレイテンシを可視化する人の補足

本日RubyKaigiでお話ししてきました。BPFのObservability関連の機能を紹介しながら実際にサンプルをRubyで書いていくみたいな流れでした。以下に資料を。

docs.google.com

一番見せたかった「RubyGC関係USDTを用いてレイテンシを可視化する」というツールのデモが...流せなかったので*1、心残りを洗い流すべく補足記事を書きます。

USDT?

Rubyを特定のオプション --enable-dtrace でconfigureしてビルドすると、USDTと呼ばれる情報がRubyのバイナリに付与されます。この情報を使うとRubyの生きているプログラムに対して、さまざまな細かい情報を取得できるようになります。例えば以下のタイミングでイベントがフックされます。

  • オブジェクト一般、シンボル、文字列、配列、ハッシュの作成
  • C定義のメソッドの呼び出し、リターン
  • GCの開始、終了
  • 例外発生

そもそもTracePointという機構もありますが、TracePointがプログラムパフォーマンスに大きく影響を与えることは周知のことです。USDT経由で、かつBPFのような仕組みで情報を取得すると実用上影響ないレベルの副作用で細かい情報が取得できます。はず。

ところでUSDTを調べていると「dtrace」という言葉がよく出てきますが、USDTという概念はそもそもDTraceの文脈で出てきたもののようで、それをLinuxでも使えるようにした感じで進化してきたもの*2みたいです。

詳細は、aaronによるるびまのDTrace紹介(first introduced in 2.0なんですよね / 全く同じProbeが使えます)、

magazine.rubyist.net

kosakiさんによる解説などをどうぞ。

作ったもの

生きているRubyプロセスに対してアタッチし、1秒ごとに以下を表示します。

  • その時のRSS(Resident Set Size)
  • 1秒間に実行されたGC Markの回数と平均実行時間
  • 1秒間に実行されたGC Sweepの回数と平均実行時間
$ sudo ruby ./gcsnoop.rb 186197 $(rbenv which ruby)
Start tracing
TIME                          EVENT    RSS(KB) ELAPSED(ms/event)
2022-09-09 15:22:52.487468      RSS      23372
2022-09-09 15:22:53.500447     MARK            -
2022-09-09 15:22:53.505751    SWEEP            -
2022-09-09 15:22:53.531737      RSS      23204
2022-09-09 15:22:54.603751     MARK            -
2022-09-09 15:22:54.604788    SWEEP            -
2022-09-09 15:22:54.637420      RSS      23444
2022-09-09 15:22:55.712456     MARK            -
2022-09-09 15:22:55.712677    SWEEP              0.250, 1 time(s)
2022-09-09 15:22:55.740717      RSS      23588
2022-09-09 15:22:56.799344     MARK            -
2022-09-09 15:22:56.801217    SWEEP            -
2022-09-09 15:22:56.834391      RSS      23672
2022-09-09 15:22:57.908051     MARK            -
2022-09-09 15:22:57.908299    SWEEP              0.149, 1 time(s)
2022-09-09 15:22:57.941105      RSS      23756

実験としてわざとメモリリークするようなSinatraのアプリを書きました。これはひどいですが、実験です。

require 'sinatra'

$count = 0
$leak = []
$next = 100

puts "LEAK MODE: #{! ENV["LEAKY"].nil?}"

get '/' do
  if ENV["LEAKY"]
    $leak << (1..100).map { Object.new }
  end
  "OK"
end
$ LEAKY=1 ruby sinatra-app.rb 2>/dev/null &
LEAK MODE: true
Puma starting in single mode...
* Puma version: 5.6.5 (ruby 3.1.2-p20) ("Birdie's Version")
*  Min threads: 0
*  Max threads: 5
*  Environment: development
*          PID: 187396
* Listening on http://127.0.0.1:4567
* Listening on http://[::1]:4567
Use Ctrl-C to stop

$ ps auxf | grep -e RSS -e puma
USER         PID %CPU %MEM    VSZ   RSS TTY      STAT START   TIME COMMAND
ubuntu    187441  1.0  0.3 363388 26396 pts/3    Sl   15:26   0:00  |   \_ puma 5.6.5 (tcp://localhost:4567) [rk2022-benchtools]

$ ab -c 1000 -t 10 http://127.0.0.1:4567/
...

$ ps auxf | grep -e RSS -e puma
USER         PID %CPU %MEM    VSZ   RSS TTY      STAT START   TIME COMMAND
ubuntu    187515 33.5  3.6 855116 295512 pts/3   Sl   15:27   0:21  |   \_ puma 5.6.5 (tcp://localhost:4567) [rk2022-benchtools]

簡単にRSSを肥大化させることができます。GCがどうなるか見てみます。

$ sudo ruby ./gcsnoop.rb 187441 $(rbenv which ruby)
Start tracing
TIME                          EVENT    RSS(KB) ELAPSED(ms/event)
2022-09-09 15:30:01.415746      RSS      22860
2022-09-09 15:30:02.489423     MARK            -
2022-09-09 15:30:02.489839    SWEEP            -
2022-09-09 15:30:02.526016      RSS      22860
...
2022-09-09 15:30:28.291423      RSS      22860
2022-09-09 15:30:29.292707     MARK              0.552, 17 time(s)
2022-09-09 15:30:29.292734    SWEEP              0.055, 254 time(s)
2022-09-09 15:30:29.297429      RSS      49260
2022-09-09 15:30:30.298606     MARK              1.274, 6 time(s)
2022-09-09 15:30:30.298636    SWEEP              0.060, 247 time(s)
2022-09-09 15:30:30.304768      RSS      63364
2022-09-09 15:30:31.306836     MARK              1.408, 4 time(s)
2022-09-09 15:30:31.306866    SWEEP              0.059, 255 time(s)
2022-09-09 15:30:31.311147      RSS      83784
2022-09-09 15:30:32.312385     MARK              2.297, 2 time(s)
2022-09-09 15:30:32.312416    SWEEP              0.061, 230 time(s)
2022-09-09 15:30:32.317398      RSS     111252
2022-09-09 15:30:33.318531     MARK              4.285, 2 time(s)
2022-09-09 15:30:33.318559    SWEEP              0.067, 195 time(s)
...
2022-09-09 15:30:47.433592      RSS     389912
2022-09-09 15:30:48.434317     MARK             14.691, 1 time(s)
2022-09-09 15:30:48.434350    SWEEP              0.093, 187 time(s)
2022-09-09 15:30:48.441605      RSS     423512
2022-09-09 15:30:49.442609     MARK              2.361, 1 time(s)
2022-09-09 15:30:49.442659    SWEEP              0.072, 306 time(s)
2022-09-09 15:30:49.450451      RSS     425004
2022-09-09 15:30:50.451657     MARK            -
2022-09-09 15:30:50.451685    SWEEP              0.078, 336 time(s)
2022-09-09 15:30:50.459964      RSS     432168
2022-09-09 15:30:51.461260     MARK             14.032, 1 time(s)
2022-09-09 15:30:51.461293    SWEEP              0.084, 256 time(s)
2022-09-09 15:30:51.468487      RSS     449268
2022-09-09 15:30:52.469774     MARK            -
2022-09-09 15:30:52.469803    SWEEP              0.057, 171 time(s)
2022-09-09 15:30:52.477342      RSS     473020
2022-09-09 15:30:53.478389     MARK             15.491, 1 time(s)
2022-09-09 15:30:53.478409    SWEEP              0.077, 391 time(s)
2022-09-09 15:30:53.485416      RSS     480392
2022-09-09 15:30:54.486348     MARK             16.764, 1 time(s)
2022-09-09 15:30:54.486378    SWEEP              0.078, 160 time(s)
2022-09-09 15:30:54.494123      RSS     512272
2022-09-09 15:30:55.495602     MARK            -
2022-09-09 15:30:55.495634    SWEEP              0.066, 414 time(s)
2022-09-09 15:30:55.503252      RSS     513088
2022-09-09 15:30:56.504433     MARK             18.446, 1 time(s)
2022-09-09 15:30:56.504460    SWEEP              0.096, 149 time(s)
...
...
2022-09-09 15:31:46.065511      RSS    1165324
2022-09-09 15:31:47.066567     MARK             34.956, 1 time(s)
2022-09-09 15:31:47.066786    SWEEP              0.104, 135 time(s)

RSSが大きくなる(=Mark対象のオブジェクトが増える)とMarkフェーズの所要時間が増えていっていることが観測できます。RSSが1GBに達したら30ms超えになっているようです。なお、Sweepの対象が増えるわけではないためかそちらへの影響はそこまで大きくありません。

動画も作っています。以下です。

www.youtube.com

RSSの計算にはprocfsの情報を、そしてMark/Sweepの回数とレイテンシの計測にUSDTと、BPF、RbBCCを使いました。

そしてこのツール自体は USDT有効ビルドのRubyを使っていればどんなアプリケーションにも使える ので、現場のpumaやfluentdのGCレイテンシの計測にそのまま使えるかもしれません。USDT有効ビルドのRubyを準備するのがそれなりにハードルですが挑戦してみてください。

コードの全体は こちら です。


Observability用途のBPFを活用する際、例えばファイルアクセスやネットワークのレイテンシなどを計測するにしても、前提としてカーネル内部の知識が必要になりがちです。一方USDTやuprobeであれば、対象アプリケーションの中身がわかっていれば活用できます。いろいろな用途が見つかるといいなと思います。

と言いたかった。

会期はまだまだ残っていて、私も会場をうろうろとしていますので、興味のある方はお声がけください!

*1:うなすけさん、気にすることないですよ!

*2:識者に補足いただきたい...