正規表現の使い方

正規表現の基本については、 正規表現への入門の記事をお読みください。正規表現を理解して記述することは、最初はとても骨の折れる作業に見えるかも知れませんが、様々な文字やそれらの機能の基本を理解してしまえば、正規表現を使いこなすのにあまり時間はかかりません。まずは、こちらの正規表現の基本ガイド(英文サイト)を読んでみてください。

正規表現を正確に使う鍵は、ソースコードに存在するパターンを確立することです。あらゆるサイトはそれぞれ異なったコーディングがなされているがゆえに、カスタム抽出に関して全てを1つで対応できるガイドは存在しません。唯一の普遍的な文字列は、あらゆるサイトに常に同様に実装されるGoogleアナリティクスなどのようなコードタグです。

Example of Google Analytics tracking code

自社のサイト固有のコードのパターンを確認する最善の方法は、各テンプレートの例を取得し、エレメントを”検証”もしくは”ページのソースを表示”を使って、內部を見てみることです。

Rubularはテンプレート分析の結果に基づき作成した正規表現の文字列を実行・検証することができる優れたツールです。またRubularはRubyのテストもサポートしているため、DeepCrawlに追加したいものを試してみるのに最適です。

問題が解決しませんか? お問い合わせ お問い合わせ