Sitemap XMLコードからURLリストを抽出し、SEO分析、クローリング、コンテンツ監査に活用できるツールです。
Sitemap XMLの内容を入力して、抽出を開始してください。
サイトマップ内のクロール対象リンクを素早く取得したい場合、手動でのコピーは非効率でエラーが発生しやすくなります。本ツールは、Sitemapプロトコル仕様に準拠したXMLコードを解析し、すべての<loc>タグ内のURLアドレスを正確に特定・抽出して、プレーンテキストのリンクリストを生成します。Sitemap(サイトマップ)とは、インデックスさせたいすべてのページのURLを含む、ウェブサイトが検索エンジンに提供する構造化ファイルです。その基本単位は<url>タグであり、各タグ内にはページアドレスを指定するための<loc>要素が含まれている必要があります。
<loc>ノードからのものであることを保証します。Q:画像サイトマップや動画サイトマップからのリンク抽出には対応していますか?
対応していません。本ツールは、標準的なウェブページサイトマップ(つまり<urlset>名前空間)内の<loc>リンクを抽出することに特化しています。<image:image>や<video:video>などの拡張要素を含むサイトマップの場合、ツールはこれらの非標準ノードを無視します。
Q:サイトマップのリンクを一括で抽出するにはどうすればよいですか?
Sitemap XMLファイルの内容全体を直接貼り付けるだけです。ツールはファイル内のすべての<url>エントリの下にある<loc>リンクを一度に解析し、一括で出力します。
入力するXMLコードのフォーマットが正確で完全であること、特に<loc>タグが正しく閉じられていることを確認してください。ツールはテキスト解析のみを行い、URLの有効性やアクセス可能性は検証しません。数万件のリンクを含む非常に大きなファイルを処理する場合、ブラウザのパフォーマンスによって応答速度に影響が出る可能性があります。本ツールはブラウザのフロントエンドで動作するため、サイトマップデータがサーバーにアップロードされることはありません。安心してご利用ください。
SEO担当者にとって、抽出されたURLリストは、検索エンジンのインデックス状況の迅速な比較、ウェブサイトの内部リンク構造のチェック、またはリンク切れ検出リストの作成に役立ちます。典型的な入力例は次のとおりです:<url><loc>https://example.com/page1</loc></url><url><loc>https://example.com/page2</loc></url>。この場合、出力結果は2行の独立したURLになります。抽出結果をクローラーログやアナリティクスデータとクロス分析し、ウェブサイトのクロールバジェットの割り当てを最適化することをお勧めします。