« [R]インターネット上のファイルをダウンロードする | トップページ | [Python]特定の文字列で始まる(始まらない)文字列を抽出する »

2025年4月20日 (日)

[Python]特定の文字列で終わる(終わらない)文字列を抽出する

正規表現で$記号は文字列の最後を表すため、これを正規表現パターンに利用する。以下の例では、複数の文字列からなるリストから、リスト内包表記を使用して、指定した正規表現パターンにマッチする(しない)要素を取り出している。

>>> import re
>>> ss = ['石見舞菜香', '鈴木みのり', '瀬戸麻沙美', 'のぐちゆり', '和多田美咲']
>>> # 「の」で始まる氏名
>>> [s for s in ss if re.search('^の', s)]
['のぐちゆり']
>>> # 「の」で始まらない氏名
>>> [s for s in ss if not re.search('^の', s)]
['石見舞菜香', '鈴木みのり', '瀬戸麻沙美', '和多田美咲']
>>> # 「の」を含むが「の」で始まらない氏名
>>> [s for s in ss if re.search('^.+の', s)]
['鈴木みのり']

ルックアラウンド式(lookaround expression)を使うこともできる。

>>> # 「の」で始まる氏名 ※肯定的な先読み
>>> [s for s in ss if re.search('^(?=の)', s)]
['のぐちゆり']
>>> # 「の」で始まらない氏名 ※否定的な先読み
>>> [s for s in ss if re.search('^(?!の)', s)]
['石見舞菜香', '鈴木みのり', '瀬戸麻沙美', '和多田美咲']

ルックアラウンド式については、以下のページの「Lookaround の概要」を参照のこと。

« [R]インターネット上のファイルをダウンロードする | トップページ | [Python]特定の文字列で始まる(始まらない)文字列を抽出する »

Python(正規表現)」カテゴリの記事

コメント

コメントを書く

コメントは記事投稿者が公開するまで表示されません。

(ウェブ上には掲載しません)

« [R]インターネット上のファイルをダウンロードする | トップページ | [Python]特定の文字列で始まる(始まらない)文字列を抽出する »

無料ブログはココログ

■■

■■■