GitHub上でやりとりされるさまざまなコメントに含まれている感情表現を分析したところ、Objective-CとPHPは喜びの感情表現が飛び抜けて多いという結果になったとの記事が英語圏でも日本語圏でも話題になっていました(図)。この調査はGitHubが公開した巨大な統計情報GitHub Archiveからyes、yay(やった)、bingo(それだ)、glad(うれしい)といった喜びの感情を表現する単語を抽出し、プログラミング言語ごとの特性を見るという方法で行われました。
そのほかの感情表現では、怒りではVimL、C、Shellが上位にランクインし、楽しみではRuby、C#、Java、驚きではPerl、Objective-C、Cが上位にランクインしていました。単語を抽出するという方法がどこまで有効かは議論になるところですが、事実としてそれらの単語の出現に偏りが見られたことはプログラミング言語のコミュニティの雰囲気が現れているのかもしれません。
喜びの多いObjective-CとPHPは、動くものを作るということに主眼を置いた人々が多いという見方もあり、「神経質な人がPHPからいなくなる、というほうが説得力ある」という声もありました。興味深いのはこの調査用のスクリプトもGitHubで公開されており、日本語に特化した調査などを行う余地が残されています。また統計的な調査をGitHubに対して行うというアプローチ自体も今後、応用できそうですので興味を持った方は調査方法やスクリプトなどにも目を通してみるとよいのではないでしょうか。
URL:http://geeksta.net/geeklog/exploring-expressions-emotions-GitHub-commit-messages/
- 著者プロフィール
安藤祐介(あんどうゆうすけ)
数年間米国でのアフィリエイトサービスの開発に参加後、帰国。下北沢オープンソースCafeに出没しつつRedmineをCakePHPに移植するCandyCaneなどのオープンソース活動に従事。
Twitter:yando
小倉純也(おぐらじゅんや)
フリーランスのWebプログラマー生活を経て、QNYP,LLC.を創業しました。秋葉原を拠点にRails、Heroku、グラフDBを駆使したWebサービスを開発中!
Twitter:junya
マクラケン直子(まくらけんなおこ)
東京在住。サンフランシスコにあるブログサービススタートアップのアジア圏担当。最近は韓国語などのl10nプロジェクトサポートをやってます。
Twitter:naokomc
溝畑考史(みぞはたたかし)
米国New York在住、Social mediaな米国startupでFrontend engineerをしています。趣味はマラソンを走ること。最近は画像最適化ツールのsmush.pyをgithubにて開発中。
Twitter:beatak