正規表現のまとめ

今日は正規表現について調べたのでまとめます。

正規表現は英語でregular expressionsと言ってこれがpythonの標準ライブラリのreの元になっています。正規表現(正則表現ともいう)はたくさんの文字列をまとめて表すためのものです。

 

正規表現のなかでは、普通のローマ字や数字はそのまま扱われますが、いくつかの記号(これを特殊文字という)は特別な意味を持ちます。特殊文字は全部でたった11個しかないので簡単に覚えられます。ここではその一覧と簡単な意味をまとめました。

 

  • ^   =補集合
  • [ ]  =文字クラス
  • \   +アルファベット=色々な意味(どのアルファベットかで異なる)
  • \   +特殊文字 =エスケープ(特殊文字をそのままの意味で使わせる)
  • { }  =カッコ内の数が繰り返しの回数になる
  • .   =任意の一文字
  • $  =末尾
  • *  =繰り返し(0回以上)
  • ?  =最長一致から最短一致へ変更
  • +  =一個以上
  • |  = もしくは(和集合)
  • (  )  =グループ化

いかがだったでしょうか。実際にはこんな単純じゃないんですがこの大まかな意味だけ暗記しておけば勉強していて正規表現が出てきてもついていけると思います!