正規表現モジュールについて
正規表現の使い方。
tags: | python, standard, tips |
---|---|
created: | 2006-02-05T20:24:24 |
正規表現の使い方 正規表現の利用例を列挙していきます。
reモジュールの使い方基本編
マッチ文字列の取り出し
import re
input = r"""<?xml version='1.0' encoding='utf-8'?>
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN"
"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html>
<head><title>たいとる</title></head>
<body>
<p>hoge1</p>
<p>hoge2</p>
<p>hoge3</p>
</body>
</html>"""
print re.findall('<p>(.*)</p>', input)
結果は...:
>>> print re.findall('<p>(.*)</p>', input)
['hoge1', 'hoge2', 'hoge3']
こんな感じ。
ずぼらしたいならこの使い方が一番楽です。