正規表現モジュールについて

正規表現の使い方。

tags:python, standard, tips
created:2006-02-05T20:24:24

正規表現の使い方 正規表現の利用例を列挙していきます。

reモジュールの使い方基本編

マッチ文字列の取り出し

import re
input = r"""<?xml version='1.0' encoding='utf-8'?>
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN"
   "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html>
  <head><title>たいとる</title></head>
  <body>
    <p>hoge1</p>
    <p>hoge2</p>
    <p>hoge3</p>
  </body>
</html>"""
print re.findall('<p>(.*)</p>', input)

結果は...:

>>> print re.findall('<p>(.*)</p>', input)
['hoge1', 'hoge2', 'hoge3']

こんな感じ。

ずぼらしたいならこの使い方が一番楽です。