web-dev-qa-db-ja.com

複数ページにわたる完全なニュース記事をダウンロードする方法は?

New York Timesなどのサイトにアクセスすると、オフラインで閲覧できるようにページを保存したいことがあります。しかし、ページ1、2、3、4、5のように、多くの記事は一連でリンクされています。

記事全体を複数のページに保存する方法はありますか?

6
captainandcoke

一部のWebサイトでは、記事全体、1ページ、またはブラウザーの機能を必要とせずにそれらのバリエーションをダウンロードする方法を提供しています。

ニューヨーク・タイムズ

(NYTの「保存」では何らかのアカウントが必要と思われるため、NYTサイトthatを処理する必要はありませんでした、tbh-I '次のように「確実に機能する」方法でm

このランダム New York Timesの記事 の場合、「単一ページ」オプションを使用できます。

Single Page

これにより、記事全体が1ページに表示されます。その後、「印刷」オプション(スクリーンショットにも表示)を選択して、記事全体の生のテキストを取得できます。

他のサイト

最近では、「複数ページのニュース記事」全体がほぼ取り戻されています。ほとんどのニュースサイトは、垂直スペースを使用するブログ形式を使用しています。たとえば、サイトは長くなりますが、すべてのコンテンツが1ページに収まるため、ほとんど必要ありません。

しかし、まだこれを持っているサイトでは、ほとんどの場合上記のようなものを見つけるでしょう。すべてを1ページに表示する方法、または「記事全体を印刷」へのリンク-そのようなもの。ただし、これらのリンクは標準化されていないため、ほとんどの場合、自分で見つける必要があります。外部スクリプトは確実にそれらを集め普遍的に、記事全体を結び付けることはできませんでした。 allサイトに対してこれを行うものは見つかりません。 someのために存在するかもしれませんが、それからたくさんのスクリプトを実行することになります...コンピューターを実行する最も正確な方法ではありません。

ちょうど私が見つけた素敵な拡張機能の例は、記事の最後までスクロールしてすべてロードする必要がありますが、 "AutoPager" (Firefoxバージョンへのリンク、他のブラウザーにも存在します。信じる)。

サイトの開発者がこれを必要であると考えず、ユーティリティを見つけることができない場合、あなたの最善の策は、手間をかける価値があると思われる場合は、サポートに連絡してメモを取ることです。

6
user98085