正規表現とは?

実際に正規表現とはなにか、正規表現を使って何ができるかについて、端的に言えば正規表現は検索パターンを作成する手法です。 正規表現の文字列を使って自社サイトのコード内の特定のセクションをマッチさせ、配置していきます。正規表現は、Ctrl + F (Macの場合 Command + F)の検索機能のもっと洗練された方法と思ってください。

正規表現はデータ抽出だけでなく、DeepCrawlのクロール内で特定のURLを含む、含まないといったところでも活用できます。Googleアナリティクスは、GAの中で取得できるレポートをフィルタリングする強力な手法である、正規表現の一致もサポートしています。

正規表現の言語には様々なものがありますが、DeepCrawlではRubyを使っています。

作成した検索パターンは、SEOツールと連携することで、意義ある、かつ処理可能な方法で見つけたコードのスニペットを提示します。 例えば、自社サイトにコーディングされた商品価格を検索するためにDeepCrawl内部で正規表現を活用してカスタム抽出クエリを作成すると、各ページの料金をリスト化された形で抽出できます。

問題が解決しませんか? お問い合わせ お問い合わせ