(1)はこちら、(2)はこちらから。
Perl 5.26で新たに追加されたもの
このように非互換性の話ばかりしているとPerl 5.26へのアップグレードをためらう声も出てきそうですが、Perl 5.26にはセキュリティ上のメリットだけでなく、性能的なメリットや便利な新機能などもあります。
インデント付きヒアドキュメント
ある程度まとまった分量の、特に複数行にわたる文字列を扱いたい場合は、ヒアドキュメントを利用するのが定番です。
ただ、従来のヒアドキュメントはインデントの概念が存在していなかったため、メソッドや条件文に囲まれていると見栄えが悪くなる欠点がありました。
Perl 5.26では新たにインデント付きのヒアドキュメントが導入されました。これを使うと、範囲内のすべての行が終端文字列のインデントに合わせてインデントされているとみなされます。
コンフリクトを起こしているソースコードの検出
Gitなどのバージョン管理システムを利用して開発を進めていると、ときにはコンフリクトを起こしてしまうことがあります。もちろんそのようなコンフリクトはすぐに解消すべきものですが、うっかりしているとコンフリクトが残ったままテストを走らせてしまうことがあるものです。
従来のPerlは、このようなソースコードを読み込むと暗黙のうちに空の終端文字列を持つヒアドキュメントとみなして解釈していたのですが、Perl 5.26では正しくバージョン管理システムのマークを読み取って、次のようなエラーメッセージを出すようになりました。
Unicode 9.0サポート
Perl 5.26ではUnicode 9.0がサポートされています。Unicode 9.0にはオリンピックで活躍するであろう金銀銅メダルの絵文字などが追加されました。
/xx正規表現修飾子
従来からある/x
正規表現修飾子を使うと、空白文字の扱いが変わることを代償に、正規表現中に改行やコメントを追加して読みやすくできます。ただし、/x
修飾子は文字クラスの中身までは対象にしません。そのため、次のようなコードは、与えられた文字列によっては一見うまく動いているように見えますが、対象となる文字列に空白が含まれている場合、その空白も一緒に抜き出してしまいます。
Perl 5.26で導入された/xx
修飾子を使うと、このような文字クラス内の空白とタブも(バックスラッシュでエスケープされていない限り)無視できます。
特殊変数@{^CAPTURE}など
マッチしても、しなくてもよいという正規表現で、実際に何がマッチしたかを調べるのは意外と面倒なものです。
たとえば、「a: b c」というコロンと空白で3つの部分に区切られた文字列からデータを取り出すことを考えてみます。あまり細かいことを考えずに書けば、次のようなコードになるでしょうか。
今、仕様が変わって3つ目の部分には値が入らない場合があることがわかりました。正規表現の最後を調整しましょう。
出力結果の最後に余計な,
が付いているのは見栄えが良くないですし、warnings
プラグマを有効にしていると警告が出るのもいただけません。
このような場合、$3
の値が定義されているかどうかで挙動を変えてもよいのですが、$0
から始まる特殊変数が何文字目から始まり何文字目で終わるという情報を格納している特殊変数@-
と@+
を見ると、いくつマッチしたかを調べられます[8]。また、マッチした値はsubstr
関数を使って導き出せます。
検索の場合はマッチした値を直接配列で受け取ることもできますが、この受け取り方は必ずしも期待どおりの値を受け取れるとは限りません。
Perl 5.26で新設された@{^CAPTURE}
特殊変数を使うと、この処理をもっと直感的に書けます。
同様に、名前付きキャプチャについては@-
や@+
に対応する特殊変数%-
や%+
を駆使する代わりに、Perl 5.26で新設された%{^CAPTURE}
や%{^CAPTURE_ALL}
という特殊変数を使うと同じようなことができます。
scalar %hashが数値のみを返すように
ハッシュをスカラコンテキストで評価すると、従来は2/8
のようにキーの数と内部的に割り当てられたバケツの数をスラッシュでつないだ値が返ってきました。Perl 5.26からは、上の例でも見たようにキーの数だけを返します。
レキシカルサブルーチンが正式機能に昇格
あまり行儀の良いことではありませんが、グロブとコードリファレンスを使うと、特定のブロックの中でだけ関数の挙動を変えることができます。テストやデバッグの際には重宝しますが、サブルーチンを再定義することになるので、従来はno warnings
を使って警告を抑制する必要がありました。
このような処理は、Perl 5.18で実験的に導入されたレキシカルサブルーチンを使うともう少しきれいに書けることがあります。レキシカルサブルーチンを使えば再定義の警告を抑制するno warnings
も、サブルーチン定義のあとのセミコロンも必要ありません。
ただし、レキシカルサブルーチンを利用するには、上の例にあるようにuse feature
を使って明示的にレキシカルサブルーチンを使うことを宣言し、実験的機能を使っている警告を抑制する必要がありました。
この部分はPerl 5.20で導入されたexperimental
プラグマを使うことで1行にまとめられます。ただ、experimental
プラグマには、Moose
モジュールやRole::Tiny
モジュールのように内部的にすべての警告を有効にしてしまうモジュールをあとから呼び出すと、隠したはずの警告が表示されてしまう罠がありま
す。
Perl 5.26ではレキシカルサブルーチンが正式な機能に昇格したため、そのような制約はなくなります。
レキシカルサブルーチンの罠
なお、パッケージ名の付いた完全修飾名のサブルーチンをレキシカルにすることはできません。そのため、上の例のようにエクスポートされた関数をレキシカルサブルーチンで上書きすることはできますが、モジュールの中に外から手を入れる用途では使えません。
また、通常の名前付きサブルーチンとは異なり、レキシカルサブルーチンは動的に生成されるため、置く場所によっては異なる挙動を示すことがあります。たとえば次のコードはlog
関数が意図どおりに上書きされて、引数に現在時刻を付けたものが出力されます。
次のようにすると、log
関数は上書きされず対数が出力されます。
サブルーチンシグネチャの高速化
Perl 5.20に鳴り物入りで導入されたサブルーチンシグネチャですが、当初の実装は残念ながら従来の書き方に比べてかなり遅いものでした。試しに次のようなコードでベンチマークを取ってみます。
Perl 5.20で実行すると、手もとの環境では従来のコードのほうが50%近く高速でした。
この傾向はPerl 5.22でも変わりません。
Perl 5.24でも傾向は同じですが、このとき行われた最適化の結果、関数呼び出しが以前に比べて全体的に高速になっています。
Perl 5.26ではこの差がかなり縮んでいます。
残念ながらまだ逆転とまではいきませんが、Perl 5.28ではさらに最適化が進むものと期待されています。
機能の廃止や削除の予定
Perlの原作者のLarry Wall氏がPerl 6の開発に専念するようになってからというもの、YAPCなどのカンファレンスではその年にリリースされたPerl 5の安定版や、現在まさに開発中の次期バージョンについての話はあっても、Perl 5は今後こうなっていく、という長期的な展望はあまり語られないのが常でした。
その現状は今も変わってはいませんが、特定機能の廃止や削除については、直近の安定版で廃止の手続きに入ったことを知らせる警告を出すよう修正したあと、問題が見つからなければ2つあとの安定版で削除する(エラーとして扱われるようになる)のが現在の開発ポリシーとなっています。そのため、廃止の手続きに入った時期がわかれば、いつ実際に消えるかが予想できます。
Perl 5.26では、ユーザーが中長期的な変更に備えられるよう、新たにperldeprecation
という文書を用意して、この先数年でどのような機能が消えることになるかを明記するようになりました。現時点では3年後にリリースが予定されているPerl 5.32までの廃止、削除予定がまとめられています。
まとめ
Perl 5.26ではセキュリティ上の理由から@INC
からカレントディレクトリが削除されるなど、スムーズな移行を妨げかねない修正がいくつか入っています。しばらくは古いPerlで様子見せざるを得ない場合もあるかと思いますが、現在のPerl 5は最新2つの安定版(本稿執筆時点においてはPerl 5.26とPerl 5.24)しかサポート対象としないことがポリシーとして明記されていますし、最近の傾向として(特に内部の整理や高速化の代償として)細かな機能の廃止や削除も続いています。実際に5.26を本番投入するかどうかはさておき、可能ならCIサービスなどを利用して、お手もとのモジュールやアプリケーションのテストが一通り通ることだけでも確認しておいていただければと思います。
さて、次回の執筆者は佐藤健太さんで、テーマは「Anikiで学ぶ実践的なO/Rマッパの作り方」です。お楽しみに。
- 特集1
イミュータブルデータモデルで始める
実践データモデリング
業務の複雑さをシンプルに表現!
- 特集2
いまはじめるFlutter
iOS/Android両対応アプリを開発してみよう
- 特集3
作って学ぶWeb3
ブロックチェーン、スマートコントラクト、NFT